仮説検定
帰無仮説・有意水準・p値・検定統計量の考え方を理解します。
このモジュールで学ぶこと
「新薬を飲んだ患者は症状が改善した——これは薬のおかげか、たまたまか?」この問いに「確率的な根拠」で答える手続きが仮説検定です。「偶然でこの結果が出る確率は低い=本物の効果がありそうだ」という論理です。検定の仕組みと正しい解釈を学びます。
仮説検定の発想:「偶然とは言えない」ことを示す
仮説検定は「悪魔の証明を避ける」戦略です。「薬に効果がある」を直接証明するのは難しい——代わりに「効果がない(帰無仮説)」と仮定して、その仮定と矛盾するほど極端なデータが出たら「やっぱり効果はある(対立仮説)」と結論づけます。
帰無仮説 :「効果なし」「変化なし」など、棄却したい(否定したい)主張
対立仮説 :「効果あり」「変化あり」など、証明したい主張
有意水準 (通常5%):「このくらい低い確率でしか起きないなら偶然ではない」という閾値です。p値は「 が真であるとしたとき、今回以上に極端なデータが得られる確率」です。 なら を棄却します。
p値の正しい意味: のもとで今回以上に極端な結果が起きる確率。「 が真である確率」ではない。
第1種・第2種の誤りと検出力
仮説検定は確率的な判断なので、2種類の間違いがあります。薬の試験で考えると:
第1種の誤り(偽陽性):効果がない薬を「効果あり」と判定——確率は有意水準 以下に制御
第2種の誤り(偽陰性):効果がある薬を「効果なし」と判定——確率
検出力 :効果が本当にあるときに「効果あり」と正しく検出できる確率
を小さくすれば偽陽性は減りますが、棄却域が狭くなって偽陰性 が増えるというトレードオフがあります。このトレードオフを解消する唯一の方法が標本サイズを増やすことです—— を増やすと を変えずに を減らせます(検出力向上)。
検定の手順:工場製品の重量例で学ぶ
例題:ある工場の製品の平均重量は100gと言われている。16個を抽出して計測したところ g、g だった。有意水準5%で、母平均は100gから変化したといえるか?
ステップ①:仮説設定
(変化なし)、(変化あり、両側検定)
ステップ②:検定統計量の計算(母分散未知なのでt検定)
「観測された差 」を標準誤差 で割って「何標準誤差分離れているか」を計算しています。
ステップ③:棄却域の確認
自由度 の t 分布で、両側5%の臨界値は 。 なので棄却域に入らない。
ステップ④:結論
有意水準5%で帰無仮説を棄却できない。母平均が100gから変化したとは統計的に言えない。
t分布の棄却域がどこに来るかをスライダーで確認しましょう。
「棄却できない ≠ 帰無仮説が正しい」。あくまで「差があるとは言い切れない」という消極的な結論です。
各種検定の統計量
場面に応じて使う検定統計量が変わります:
母平均のt検定(母分散未知):
母比率の検定(n大):
母分散の検定:(カイ二乗分布は右裾が長い非対称分布)
両側検定か片側検定かで棄却域の位置が変わります。「方向に理論的根拠がある場合のみ片側検定を使う」ことも重要なルールです。
母分散未知のt検定:自由度は 。母比率の検定はn大のとき正規近似。母分散の検定はカイ二乗分布。
※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。