検定・分布の使い分けガイド
「このデータ・この問いには、どの分布/どの検定/どの手法を使えばいいのか」を、状況から逆引きできる早見表です。各行は本サイトの対応モジュールにリンクしています。個別の理論はリンク先で、ここでは全体を見渡して手法を選ぶ視点を整理します。
1. 確率分布の選び方
「どんな現象か」から、当てはめる確率分布を選びます。
| 状況・知りたいこと | 使う分布 | 参照 |
|---|---|---|
| n回の独立試行での成功回数 | 二項分布 | 1.6 |
| 有限母集団からの非復元抽出での成功回数 | 超幾何分布 | 1.6 |
| 一定の時間・面積あたりに起きる稀な事象の件数 | ポアソン分布 | 1.7 |
| 初めて成功するまでの試行回数 | 幾何分布 | 1.7 |
| 事象が起きるまでの待ち時間 | 指数分布 | 1.8 |
| 複数の指数的な待ち時間の和 | ガンマ分布 | 1.8 |
| 多数の独立な要因の和(近似) | 正規分布 | 1.10 / 1.11 |
2. 検定統計量が従う分布
推定・検定で使う標本分布の選び方です。
3. 検定の選び方(目的別)
「何を確かめたいか」から検定手法を選びます。
| 知りたいこと | 使う検定 | 参照 |
|---|---|---|
| 1群の平均が基準値と異なるか(分散未知) | 1標本t検定 | 1.20 |
| 独立な2群の平均差 | 2標本t検定 | 1.20 |
| 対応のある2群の差(同一対象の前後など) | 対応のあるt検定 | 1.20 |
| 3群以上の平均差 | 分散分析(ANOVA) | 1.21 |
| 観測度数が理論分布に合うか | 適合度検定(χ²) | 1.20 / 3.4 |
| 2つのカテゴリ変数が独立か | 独立性の検定(χ²) | 3.4 |
| 正規性が仮定できない場合 | ノンパラメトリック検定 | 1.20 |
| 母数の区間推定をしたい | 信頼区間(1標本/2標本) | 1.16 / 1.17 |
4. 多変量解析の選び方(目的別)
「何をしたいか」から多変量手法を選びます。
| 目的 | 使う手法 | 参照 |
|---|---|---|
| 量的な結果を複数の変数から予測する | 重回帰分析 | 2.1 |
| 2値(合否・有無など)を予測・分類する | ロジスティック回帰 | 2.6 |
| 多数の変数を少数の軸に要約する(次元削減) | 主成分分析(PCA) | 2.2 |
| 観測変数の背後にある潜在因子を探る | 因子分析 | 2.4 |
| 事前のラベルなしでグループ分けする | クラスター分析 | 2.5 |
| 既知の群のどれに属するか分類する | 判別分析 | 2.3 |
※ 早見表は典型的な対応を示すものです。前提条件(独立性・等分散・正規性など)の確認が必要な場合があります。詳細は各モジュールをご確認ください。