← study-apps.com 学習サイト集トップへ

標本分布と中心極限定理

大数の法則・中心極限定理・t分布・$\chi^2$分布・F分布を理解します。

このモジュールで学ぶこと 「スープ鍋を一口味見すれば全体の味がわかる」——これが標本調査の発想です。しかし「たまたまよい場所をすくった」可能性はゼロではありません。標本平均という推定値がどれくらいブレるのか——その「ブレ方の分布」を学ぶのがこのモジュールです。推定・検定の理論的土台になります。 標本平均は確率変数:毎回違う値が出る クラス30人の中から5人を無作為に選んで身長を測る、という調査を10回繰り返すと、毎回違う5人が選ばれ、毎回違う平均身長が計算されます。つまり標本平均 自体がランダムに変わる確率変数です——毎回固定の数ではありません。 この「標本平均という確率変数がどの値をとりやすいか」を表す分布が標本分布です。標本分布の形がわかれば「今回得られた標本平均がどれほど信頼できるか」を評価できます。まず、分布の形を問わず成り立つ保証から始めましょう。 チェビシェフの不等式はどんな分布にも適用できる普遍的な限界です: なら「平均から2標準偏差以上外れる確率は高々25%」が保証されます。正規分布では実際は約4.6%ですが、分布の形が未知でもこの上限が成り立ちます。 大数の法則と中心極限定理:標本を増やせば何が起きるか 標本の数 を増やすと、標本平均はどうなるでしょうか?大数の法則は「 を無限に増やせば標本平均が必ず母平均に収束する」と保証します。「無限に」というのが重要で、有限の では多少のブレは残ります。 より実用的なのが中心極限定理(CLT: Central Limit Theorem)です。「母集団の分布がどんな形でも——一様分布でも指数分布でも——標本サイズ が十分大きければ標本平均の分布は正規分布に近づく」というものです: 程度で近似精度が十分になることが多いです。自由度スライダーを動かして、t分布が の増加とともに正規分布にどう近づくかを確認しましょう。 中心極限定理:母集団の形によらず、n大のとき は正規分布に近づく。推定・検定理論の根幹です。 標準誤差:「標本平均のブレ幅」を測る 中心極限定理より は平均 ・分散 の正規分布に近似されます。この ——標本平均の標準偏差——を標準誤差(SE: Standard Error)といいます: を4倍にすると SE は半分になります()。これは「標本を2倍集めても精度は 倍にしかならない」ことを示しており、大規模調査のコストと精度のトレードオフを理解するうえで重要です。 標準誤差 = 。n を4倍にすると SE は半分。推定精度の向上は標本コストの増加より遅い。 t 分布・カイ二乗分布・F 分布:現実の検定で使う分布 正規母集団 から標本を取るとき、実用上は母分散 が未知であることがほとんどです。そのため不偏分散 で代用しますが、この置き換えによって分布の「裾が重くなる」——それがt 分布です: 自由度()が小さいほど裾が重く(外れ値が出やすく)、自由度が大きくなるにつれて標準正規分布 に近づきます。次のグラフで確認してください。 分散の推定・検定にはカイ二乗分布()が使われます:。2グループの分散を比較する等分散検定や分散分析にはF 分布が使われます:。 母分散未知のとき → t 分布(自由度 )。t 分布は自由度 で正規分布に収束。 二項分布の正規近似:離散分布を連続分布で近似する 中心極限定理の応用として、二項分布を正規分布で近似する方法があります。 回のベルヌーイ試行で成功確率 のとき、成功回数 の平均は 、分散は です。 が十分大きければ中心極限定理により: つまり は近似的に に従います。「十分大きい」の目安は かつ です。例えば では 、 なので で近似できます——平均30・分散 です。 二項分布の正規近似: かつ のとき 。平均と分散を正確に計算することが重要です。

※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。