カイ二乗検定

適合度検定・独立性の検定の計算方法を習得します。

このモジュールで学ぶこと「サイコロを60回振ったら、1〜6の目はそれぞれ10回ずつ出るはず——でも実際は偏っていた。これは不正なサイコロか、それとも偶然のばらつきか？」このように観測された度数と理論上期待される度数のズレを検定するのがカイ二乗検定（検定）です。数値でなく「カテゴリ（種類）」で記録されたデータを扱う、統計検定2級の重要テーマです。適合度検定：「期待と現実のズレ」を数値化するサイコロを60回振って各目の出た回数を記録したとします。公平なサイコロなら各目の期待度数（Expected）は回です。実際に出た回数が観測度数（Observed）で、例えば「1の目が15回、6の目が5回」のようにばらついたとします。この「ズレ」がたまたまの偶然なのか、サイコロが偏っているからなのかを判断するのが適合度検定（goodness-of-fit test）です。ズレを数値化するには、各カテゴリの「(観測 − 期待)の2乗 ÷ 期待」を全カテゴリで合計します：（Observed）は実際の観測度数、（Expected）は帰無仮説のもとで期待される理論度数です。差を2乗するのは「プラスの偏りとマイナスの偏りを同等に評価するため」、で割るのは「期待値が小さいカテゴリのズレを相対的に大きく評価するため」です。帰無仮説「データは理論分布に従う」のもとで、この統計量は自由度のカイ二乗分布に従います。自由度スライダーを動かして分布の形（右裾が長い非対称分布）を確認しましょう。適合度検定の自由度 = カテゴリ数。カテゴリが4つなら自由度3です。「1を引く」のは「合計度数が固定されているため最後のカテゴリは自動的に決まる」からです。独立性の検定：2変数の関係を検定する適合度検定が「1変数の分布の検定」なのに対し、独立性の検定は「2つのカテゴリカル変数に関連があるか」を調べます。例えば「性別（男・女）と商品の購入有無（購入・未購入）に関係はあるか？」を検定したい場合、結果をの分割表（クロス集計表）にまとめます。独立性の帰無仮説は「2変数は統計的に独立（関係がない）」です。もし独立なら、「男性で購入した人の割合」と「女性で購入した人の割合」は等しくなるはずです。この独立性の条件から、各セルの期待度数は次のように計算できます：「行iの周辺比率 × 列jの周辺比率 × 総計」とも解釈できます。観測度数と期待度数を使ってカイ二乗統計量を計算します：行列の分割表なら自由度はです。例えば分割表なら自由度です。分割表の自由度。「行数−1 × 列数−1」で計算します。使用条件と注意点カイ二乗検定には重要な使用条件があります。まず、各セルの期待度数が5以上であることが目安です。期待度数が小さいと、カイ二乗近似の精度が落ちて誤った結論を導く恐れがあります。特にの分割表で期待度数が5未満のセルがある場合は、フィッシャーの正確検定（Fisher's exact test）を使います。もう一点重要なのは、カイ二乗検定は「関連の有無」しか教えてくれないことです。「性別と購買行動に関連あり」という結論は出せても、「どちらの性別がより多く購入しているか」「関連の強さはどの程度か」はカイ二乗検定からは分かりません。関連の強さを表すには、分割表ではオッズ比、一般の分割表ではクラメールの連関係数などを別途計算します。クラメールの連関係数：。0〜1の値をとり、1に近いほど関連が強いです。カイ二乗検定が有意でもが小さければ「統計的には有意だが実用的な関連は弱い」と解釈します。よくある誤解・つまずき期待度数が小さい（目安5未満）とカイ二乗近似が崩れます。セルを統合するか正確検定を検討。有意＝関連が強い、ではありません。が大きいと小さな差でも有意になります。効果量（クラメールの）で実用的な強さを確認。適合度検定と独立性検定で自由度の数え方が違います。ここまでのまとめカイ二乗検定＝観測度数と期待度数の「ずれ」を評価。用途：適合度検定（理論分布との一致）と独立性検定（2変数の関連）。有意 ≠ 実用的関連：効果量で関連の強さを別途見る。

※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。