母比率の推定・検定
母比率の点推定・信頼区間・z検定の考え方と計算を学びます。
このモジュールで学ぶこと
「推定」・「仮説検定」モジュールでは「連続型の量的データ(身長・血圧・点数など)の平均」を推定・検定してきました。今回はデータの種類が変わります。
「この薬の治癒率は本当に50%より高いか?」「内閣支持率は前回から変わったか?」——結果が「治癒した・しない」「賛成・反対」のような2値データでは、「平均」ではなく母比率 (母集団における成功の割合)が関心の母数です。基本的な考え方(標本から信頼区間を作り、仮説検定を行う)は母平均の場合と同じですが、使う分布と計算式が変わります。
母比率の点推定と区間推定
個の独立な試行で成功が 回だったとします。標本比率 は母比率 の不偏推定量です。
(二項分布)なので 、 です。中心極限定理より が大きいとき:
標準誤差 ですが は未知なので で代入します。母比率の近似 信頼区間は:
例:、(治癒40%)の95%信頼区間。
なので、信頼区間の幅を半分にするには を4倍にする必要があります( で SE が半分になるため)。
母比率の仮説検定(z検定)
「治癒率が50%より高い()か」を検定したいとき、帰無仮説 を立てます。
が正しいとすると は近似的に に従うので、検定統計量は:
信頼区間と検定で SE の計算が変わる理由: 信頼区間は「 が何かわからないから推定する」ので、 の代わりに手元の を使います。検定は「 が正しいと仮定した世界での分布」を作るので、仮定した値 を使います。同じ標本データを使っていても、目的が違うから SE の計算式が変わります。
例:, , の片側検定。
有意水準5%の片側棄却域 に入らないので を棄却できない。
試験ポイント: 母比率の検定では に (帰無仮説の値)を使い、信頼区間では (標本比率)を使う。この使い分けを問う問題が頻出です。
※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。