仮説検定

帰無仮説・有意水準・p値・検定統計量の考え方を理解します。

このモジュールで学ぶこと「新薬を飲んだ患者は症状が改善した——これは薬のおかげか、たまたまか？」この問いに「確率的な根拠」で答える手続きが仮説検定です。「偶然でこの結果が出る確率は低い＝本物の効果がありそうだ」という論理です。検定の仕組みと正しい解釈を学びます。仮説検定の発想：「偶然とは言えない」ことを示す仮説検定は「悪魔の証明を避ける」戦略です。「薬に効果がある」を直接証明するのは難しい——代わりに「効果がない（帰無仮説）」と仮定して、その仮定と矛盾するほど極端なデータが出たら「やっぱり効果はある（対立仮説）」と結論づけます。帰無仮説：「効果なし」「変化なし」など、棄却したい（否定したい）主張対立仮説：「効果あり」「変化あり」など、証明したい主張有意水準（通常5%）：「このくらい低い確率でしか起きないなら偶然ではない」という閾値です。p値は「が真であるとしたとき、今回以上に極端なデータが得られる確率」です。ならを棄却します。 p値の正しい意味：のもとで今回以上に極端な結果が起きる確率。「が真である確率」ではない。第1種・第2種の誤りと検出力仮説検定は確率的な判断なので、2種類の間違いがあります。薬の試験で考えると：第1種の誤り（偽陽性）：効果がない薬を「効果あり」と判定——確率は有意水準以下に制御第2種の誤り（偽陰性）：効果がある薬を「効果なし」と判定——確率検出力：効果が本当にあるときに「効果あり」と正しく検出できる確率を小さくすれば偽陽性は減りますが、棄却域が狭くなって偽陰性が増えるというトレードオフがあります。このトレードオフを解消する唯一の方法が標本サイズを増やすことです—— を増やすとを変えずにを減らせます（検出力向上）。検定の手順：工場製品の重量例で学ぶ例題：ある工場の製品の平均重量は100gと言われている。16個を抽出して計測したところ g、g だった。有意水準5%で、母平均は100gから変化したといえるか？ステップ①：仮説設定（変化なし）、（変化あり、両側検定）ステップ②：検定統計量の計算（母分散未知なのでt検定）「観測された差」を標準誤差で割って「何標準誤差分離れているか」を計算しています。ステップ③：棄却域の確認自由度の t 分布で、両側5%の臨界値は。なので棄却域に入らない。ステップ④：結論有意水準5%で帰無仮説を棄却できない。母平均が100gから変化したとは統計的に言えない。 t分布の棄却域がどこに来るかをスライダーで確認しましょう。「棄却できない ≠ 帰無仮説が正しい」。あくまで「差があるとは言い切れない」という消極的な結論です。各種検定の統計量場面に応じて使う検定統計量が変わります：母平均のt検定（母分散未知）：母比率の検定（n大）：母分散の検定：（カイ二乗分布は右裾が長い非対称分布）両側検定か片側検定かで棄却域の位置が変わります。「方向に理論的根拠がある場合のみ片側検定を使う」ことも重要なルールです。母分散未知のt検定：自由度は。母比率の検定はn大のとき正規近似。母分散の検定はカイ二乗分布。よくある誤解・つまずき p値は「帰無仮説が正しい確率」ではありません。「が正しいと仮定したとき、今回以上に極端な結果が出る確率」です。「有意でなかった＝差がない」ではありません。証拠不足の可能性（第2種の誤り）。有意水準5%は「5%の確率で間違える」ではありません。が正しいのに棄却する確率（第1種の誤り）の上限。ここまでのまとめ仮説検定は「差はない（）」を仮定し、極端なら棄却する背理法的手続き。 p値有意水準で有意。第1種（）・第2種（）はトレードオフ。母分散未知の平均は t検定（自由度）。

※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。