← study-apps.com 学習サイト集トップへ

P値の解釈・検定の誤り・検出力

P値の正しい読み方と、「見逃し」を防ぐ検出力の設計を学びます。

このモジュールで学ぶこと 「P値が 0.03 です——この薬は効果がありますか?」この質問に正確に答えるには、P値の意味を深く理解する必要があります。このモジュールでは、P値の正しい解釈・2種類の誤り・そして「本物の効果を見逃さない」確率(検出力)の設計方法を学びます。 「無実を前提とした裁判」のような仮説検定 仮説検定は法廷の裁判によく似ています。 帰無仮説 (無実の仮定):「薬の効果はゼロだ(差がない)」——まず無実と仮定してスタート 対立仮説 (証明したいこと):「薬に本当の効果がある(差がある)」 検定統計量:「証拠の強さを1つの数値に変換したもの」。帰無仮説が正しいと仮定したとき、この統計量がどんな分布に従うかがわかっているのがポイントです 棄却域:「この範囲に検定統計量が入ったら帰無仮説を否定(棄却)する」という領域。有意水準 に基づいて設定します P値:「無実と仮定したとき、今回の証拠(データ)以上に不利な状況が偶然起きる確率」。P値 ⟺ 検定統計量が棄却域に入る、は同値です 有意水準 :「この確率がこれ以下なら有罪と判断する」という基準(通常 5%) P値が小さい=「無実なら滅多に起きないことが起きた」=無実という仮定が疑わしい、ということです。 P値の正しい解釈 具体例:新薬Aがプラセボより血圧を下げるか調べます。50人ずつ2グループに分け1か月後の血圧低下量を測定しました。 新薬グループの平均低下:8.2 mmHg プラセボグループの平均低下:4.7 mmHg 差:3.5 mmHg → P値:0.03 読み方:「帰無仮説 のもとで、検定統計量 (データから計算した証拠の強さの指標)の絶対値が、今回の観測値 (obsはobserved=観測されたの略)以上になる確率」。 は絶対値(プラスでもマイナスでも差の大きさだけを見る)、 は「 が正しいと仮定したとき」という条件を表します。 P値 0.03 が意味すること:「もし本当に差がないなら、今回のような差(3.5 mmHg 以上)が偶然出る確率は 3%」。この確率が有意水準 5% より小さいため「偶然とは言いにくい → 差がある」と判断します。 P値についてよくある誤解 2種類の誤りとトレードオフ 検定では「本物の差があっても見逃す」または「差がないのに差があると誤判定する」という2種類の間違いが起きえます。 (有意水準):冤罪リスク。通常 5% に設定 :見逃しリスク。下げることが実務の目標 検出力():「本当に効果があるとき、正しく検出できる確率」。医療試験では 80% 以上を目標にします 検出力を上げる3つの方法(試験頻出) サンプルサイズ を増やす:最も確実 有意水準 を緩める(例:5%→10%):ただし冤罪リスクが増える 効果量を大きくする:実験デザインで比較する差を明確にする サンプルサイズ設計 臨床試験を設計する前に「何人集めれば良いか」を計算します。 なぜ の「和」か——帰無仮説側の棄却域()と、対立仮説側から見た検出力の余裕()の両方をクリアする距離が必要だからです。ここで は「標準正規分布の上側 点」を意味します。例:、検出力 (、)のとき係数は 。効果量 なら 人(各グループ)必要と計算できます。 多重検定問題とボンフェローニ補正 複数の検定を繰り返すと全体の第1種の過誤率が膨らみます(例:20回検定すれば全て差がなくても偶然1回は有意になりやすい)。ボンフェローニ補正では有意水準を検定回数で割ります(5回なら )。

確認クイズ(抜粋)

Q1. P値の正しい定義は?

A. 帰無仮説のもとで観測値以上に極端なデータが得られる確率

Q2. 「本当は差がないのに差があると判断する」誤りを何と呼ぶ?

A. 第1種の過誤

Q3. 検出力(Statistical Power)を正しく表す式は?

A.

全10問のクイズはサイトのインタラクティブ版でお試しください。

第4章の他のモジュール

※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。