仮説検定

帰無仮説・有意水準・p値・検定統計量の考え方を理解します。

このモジュールで学ぶこと「この薬を飲んだ群と飲まなかった群で血圧に差があるか？」——研究者はこのような問いに統計的な根拠で答えなければなりません。感覚的に「下がった気がする」だけでは科学的な証拠になりません。仮説検定は「偶然そうなる可能性はどれくらいか」を定量的に評価し、「統計的に有意な差がある」と言えるかどうかを判断する手続きです。その論理の流れ（背理法的な考え方）を丁寧に理解しましょう。 t分布のグラフで棄却域（両側の赤い領域）と検定統計量の位置関係を視覚的に確認してください。仮説検定の枠組み：「まず疑ってかかる」仮説検定は一種の「消去法」です。「薬は効かない（血圧は変わらない）」という仮定から始め——「もしこの仮定が正しいなら、こんな大きな差が偶然起きる確率はあらかじめ決めた基準（有意水準）を下回るはずだ。でも実際に起きた。だから仮定が間違っていた」と結論する考え方です。証明したいことの反対を仮定して矛盾を導く、これを背理法的な手続きといいます。帰無仮説：棄却を目指す仮説。「薬に効果はない（血圧は変わらない）」「2つの群の平均は等しい」など、「差なし・効果なし」の主張。対立仮説：証明したい主張。「薬に効果がある（血圧が下がる）」など。検定の流れは次の4ステップです。 ① とを設定する ② 有意水準（通常5%）を設定する——第1種の誤り（後述）の許容確率の上限 ③ データから検定統計量を計算する ④ 統計量が棄却域（を棄却すると判断する範囲）に入ればを棄却し、を採択する 2種類の誤りとp値どんな判断手続きでも間違いはゼロにはできません。仮説検定では2種類の間違いがあります。医療診断に例えると分かりやすいです——「病気でない人を病気と診断する（過剰反応）」と「病気の人を見逃す（反応不足）」の2種類です。第1種の誤り（偽陽性）：が本当は正しいのに誤って棄却してしまう誤り。「効果がないのに効果ありと判定」（健康な人を病気と診断するような誤り）。この誤りを犯す確率の上限が有意水準。第2種の誤り（偽陰性）：が本当は誤りなのにも関わらず、データが不十分で棄却できず見逃してしまう誤り。「効果があるのに効果なしと判定」（病気の人を見逃すような誤り）。確率はと書く。を小さくすると第1種の誤りは減りますが第2種の誤りが増えます（トレードオフ）。 p値（p-value）は「が正しいと仮定した世界で、今回観測したデータと同等以上に極端な結果が得られる確率」です。コインを100回投げて全部表だったら、「公正なコイン（表の確率0.5）」が正しい世界では確率という極めて小さな値になります——「のもとではあり得ない」と強く示唆されます。母平均のt検定：具体的な計算高血圧患者の薬投与前の平均血圧は mmHg とします。薬を飲んだ群25人の投与後の血圧の標本平均、標本標準偏差とします。帰無仮説は「薬に効果なし → 投与後も」です。検定統計量は：となり、自由度のt分布に従います。有意水準5%の両側検定（「効果の方向を問わず差があるか」を検定）では棄却域は両裾それぞれ2.5%。が棄却条件です。なのでを棄却——「有意水準5%で薬に効果ありと判定できる」となります。両側・片側検定の使い分け：「効果があるかどうか（増減どちらでも）」は両側検定、「高くなるかどうか」のように方向を事前に仮定できる場合は片側検定を使います。片側検定の方が同じ統計量でも棄却しやすいですが、方向の仮定が事前に正しく設定されていなければなりません。 t分布表の読み方： t分布表は「行＝自由度（）、列＝確率（上側確率または片側確率）」で構成されています。両側5%の検定では「片側2.5%」の列を見る。自由度24の行を見ると自由度が増えると（サンプルが大きくなると）棄却値は 1.96（正規分布の値）に近づく自由度∞の行が正規分布の値（）に対応する試験ポイント：「統計的に有意」は「実際に重要」を意味しません。サンプルサイズを増やすと、ごく小さな差でも有意になります。p値の大小は「実用的な重要性」ではなく「偶然では説明しにくい度合い」を表します。よくある誤解・つまずき初学者が間違えやすいポイントです。試験でもよく問われます。 p値は「帰無仮説が正しい確率」ではありません。 p値は「が正しいと仮定したとき、今回のような極端な結果が出る確率」です。「が正しい確率」とは別物です。「有意でなかった＝差がない」ではありません。棄却できなかったのは「差がある証拠が足りなかった」だけで、「差がないと証明された」わけではありません（第2種の誤りの可能

※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。