検定の実践:正規・適合度・ノンパラメトリック
正規分布の各種検定・適合度検定・ノンパラメトリック検定——試験頻出の実践的検定法を学びます。
このモジュールで学ぶこと
前のモジュールで検定の理論的基礎(NP定理・大標本検定)を学びました。このモジュールでは試験頻出の実践的な検定法——正規分布に関する検定・適合度検定・ノンパラメトリック検定——を整理します。
正規分布に関する検定
「薬を飲む前後で血圧が変わったか?」「製品の重さが規格内か?」「2つの工場の不良率に差はあるか?」——状況によって使う検定式が変わります。各式で ・ は「帰無仮説で設定した母平均・母分散の値」です。
母平均の検定( 既知):、両側検定で なら棄却。
母平均の検定( 未知):。
母分散の検定:。
2標本問題(等分散仮定あり):。ここで はプールした分散。
母相関係数の検定( のとき):。
正規性検定:どれを使うか
正規分布を仮定する 検定などの前に「データが本当に正規分布に従うか」を確認するための検定です。
直感:「正規性の検定で帰無仮説(正規)を棄却できない」は「正規性が確認できた」を意味しません。 が小さければ検出力不足、 が極端に大きいと些細なずれでも棄却される、という二面性があります。Q-Q プロットの目視確認との併用が実務的です。
よくある誤解:「Shapiro-Wilk で だったから正規性が証明された」と結論するのは誤りです。正規性検定の帰無仮説は「データは正規分布に従う」で、非棄却は「正規性の証明」ではなく「正規性に矛盾する証拠が不十分」を意味するだけです。特に など小標本では検出力が低く、本当は正規でなくても棄却されにくくなります。逆に が非常に大きい場合(数千以上)はわずかな逸脱でも棄却されるため、検定だけに頼らず Q-Q プロットや歪度・尖度との総合判断が必要です。
適合度検定と一般の分布の検定
「データが特定の分布に従うか」を調べる検定です。
適合度検定(Goodness-of-fit Test): カテゴリの観測度数 と期待度数 の乖離を測ります:
はデータから推定したパラメータ数(自由度から引く)。「サイコロは公正か?」「データは正規分布に従うか?」などに使います。二項分布・ポアソン分布などについても同様の 検定が適用できます。
具体例:サイコロは公正か?
サイコロを60回投げた結果、各目の出現回数が以下のとおりでした。
公正なら各目の期待値は 。 統計量を計算します:
自由度 (パラメータ推定なし)。。 なので 棄却できない → 「公正でないとは言えない」と結論します。P値はおよそ 0.64 です。
ノンパラメトリック検定
正規性などの分布の仮定をおかずに使える検定です。外れ値に強いという特長があります。
ウィルコクソンの順位和検定(Wilcoxon 2標本検定):2標本の分布が等しいかを順位データで検定します(Mann-Whitney の 検定と同値)。
符号付き順位検定(Signed-Rank Test):対応ありの2標本(前後比較など)で中央値の差を検定します。
クラスカル・ウォリス検定(Kruskal-Wallis Test):3群以上の比較で分散分析の代替として使います(一元配置 ANOVA のノンパラ版)。
順位相関係数:スピアマンの (:順位の差)。「大小関係だけ」でデータの相関を測ります。
並べ替え検定(Permutation Test):「 が真なら、2グループへのラベル割り当ては任意のはず」という発想に基づく検定。分布の仮定が一切不要で、小標本でも正確です。
ノンパラ検定の選び方:使い分け表
「パラメトリックの代替として」どれを使うかを整理します。
直感:ノンパラ検定の核心は「順位(rank)に変換してから扱う」ことです。順位は最大値・最小値の影響を抑えるため、外れ値に頑健になります。一方で連続値の細かい情報を捨てるため、正規分布が本当に成立する状況では検出力がやや劣ります。
検定の選び方フローチャート
実務で「どの検定を使うべきか」迷ったときの判断フロー:
データの構造を確認:独立 or 対応?群の数は?順序データか連続データか?
正規性検定(Shapiro-Wilk 等)または Q-Q プロットで確認。
正規性 OK → パラメトリック検定(・ANOVA など)を使う。
正規性 NG または 順序データ → ノンパラ検定を使う。
が極端に小さい( など) → 並べ替え検定や正確検定を検討。
試験頻出:ノンパラ検定は「分布によらず使える」が「同じ状況なら対応する正規検定より検出力が低い」というトレードオフがあります。「ペアか独立か」「群数は2か3以上か」の2軸で適切な検定を選ぶ問題が頻出です。
確認クイズ(抜粋)
Q1. 母分散が未知の場合に母平均を検定するとき、検定統計量はどの分布に従うか?
A.
Q2. 適合度検定の自由度が「」となる理由として正しいものはどれか?
A. 確率の総和 = 1 という制約と、推定したパラメータ数 の分だけ自由度が減るから
Q3. ウィルコクソンの順位和検定の特徴として正しいものはどれか?
A. 分布の仮定をしないため外れ値に強い
全10問のクイズはサイトのインタラクティブ版でお試しください。
第4章の他のモジュール
※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。