← study-apps.com 学習サイト集トップへ

2母集団の推定・検定

2つの母集団の平均差・比率差・分散比を推定・検定する手法を学びます。

このモジュールで学ぶこと 「新薬を投与したグループとプラセボ(偽薬)グループで血圧の平均に差があるか?」「女性と男性の支持率に違いがあるか?」——2つの集団を比較する問いは現実のデータ分析の中心です。これまでは1つの母集団の平均や比率を推定・検定してきました。このモジュールでは「2つの集団の差」を扱う手法を体系的に学びます。試験頻出の最重要テーマです。 2母平均の差の検定:母分散既知の場合 2グループAとBの血圧の平均を比べたいとします。AとBからそれぞれ独立に標本を取り、 と を計算します。「差 がゼロかどうか」を検定するのが2標本z検定です。 母分散 ・ が既知のとき、 の分散は (独立なら分散を足せる)です。帰無仮説 のもとの検定統計量は: 母平均の差 の95%信頼区間は: 分母が「2つの標準誤差を合成したもの」であることを理解すると、式を覚えやすいです。 2標本z検定の分母 = (独立なら分散は加算)。 2母平均の差の検定:母分散未知の場合 現実には母分散が既知なことは稀です。この場合、不偏分散 ・ を使いますが、等分散を仮定するかどうかで手法が異なります。 等分散を仮定する場合:2グループの分散が等しい()と考え、プールされた分散で推定します: 検定統計量は自由度 のt分布に従います: 等分散を仮定しない場合(ウェルチのt検定):分散が異なる可能性があるとき、より安全な手法としてウェルチ(Welch)のt検定を使います。統計量は を分母にし、自由度はウェルチ-サタースウェイト近似で計算します(計算が複雑なため試験では与えられることが多い)。 等分散なら自由度 。不等分散ならウェルチ検定。まず等分散の検定(F検定)を行ってから方法を選ぶのが正式な手順です。 対応のある2標本:ペアデータの扱い方 「同一の患者に投薬前後の血圧を測る」「双子の兄弟に異なる教育法を適用する」——このように同じ個体(またはペア)から2回測定したデータは「対応のある(paired)」データといいます。2回の測定は独立ではないため、2標本t検定をそのまま使うと誤りです。 対応のあるデータでは、各ペアの差 を計算してから1標本t検定を適用します: (差の平均)と (差の標準偏差)を使い、自由度はペア数 より 。対応を無視して2標本t検定を使うと、個体間のばらつきが検定力を下げます——ペアの相関を活かすことで検定力が上がります。 対応あり → 差をとって1標本t検定(自由度 )。ペアデータに2標本t検定を使うのは誤り。 2母比率の差の検定 「新製品への支持率:A地域で60/100人、B地域で45/100人——差は有意か?」のような問いが2母比率の差の検定です。各標本比率 、 を計算し、帰無仮説 のもとでは母比率が等しいと仮定してプールされた比率を使います: 検定統計量は標準正規分布に従います(大標本のとき): 分母で を使う(各グループの 、 でなく合算したプール比率)のは、帰無仮説「母比率が等しい」という前提のもとで最も効率的な推定量を使うためです。 2母比率検定:分母にプールされた を使う。信頼区間の場合は帰無仮説なしで各グループの 、 をそのまま使います。 2母分散の比の検定(F検定) 「2グループの分散(ばらつき)が等しいか」を検定するのがF検定です。等分散t検定の前提確認にも使います。帰無仮説 のもとで: F分布は非対称(右裾が長い)で、値が1から大きく外れるほど分散が異なることを示します。慣例として大きい方の不偏分散を分子に置き(F≥1にする)、右側の棄却域のみを使うことが多いです。F分布の自由度は(分子の自由度 , 分母の自由度 )のペアで指定されることに注意が必要です。 F検定:。大きい分散を分子にすると F ≥ 1 となり右側の棄却域だけ使える。

※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。