データ分析の基礎
データ分析とは
データから意味のある情報を引き出す
データ分析のステップ
1. 目的設定
何を知りたいのか明確に
2. データ収集
3. データクリーニング
4. 分析
5. 解釈・報告
基本統計量
- 平均: データの中心
- 中央値: 外れ値に強い
- 標準偏差: ばらつき
- 相関係数: 関係性
データ可視化
グラフの種類
- 棒グラフ: 比較
- 折れ線グラフ: 推移
- 円グラフ: 割合
- 散布図: 相関
- ヒストグラム: 分布
分析ツール
Excel
Python
- Pandas: データ処理
- Matplotlib: 可視化
- Scikit-learn: 機械学習
R
BI ツール
よくある間違い
❌ 相関と因果の混同
❌ サンプル数不足
❌ 確証バイアス
❌ データの恣意的選択
データで意思決定を!
コメント