ポアソン・幾何・多項分布:件数と待ち時間の分布
稀な事象の件数、待ち時間、多択の結果——3つの分布を使い分けます。
このモジュールで学ぶこと
「1時間に何件のコールが来るか?」「初めて成功するまで何回かかるか?」「3種類の結果が出る試行を繰り返すとどうなるか?」——前モジュールで二項分布族を学びました。ここでは待ち時間・稀な件数・多択結果を記述する3つの分布を学びます。
「何件起きるか」から「いつ起きるか」へ
二項分布が「 回試行して何回成功するか」を問うのに対し、ポアソン分布は「稀な事象が単位期間に何件起きるか」、幾何分布は「何回試行して初めて成功するか(待ち時間)」を問います。現象の性質によって使い分けることが重要です。
ポアソン分布
「ある交差点で1時間に起きる交通事故の件数」「1ページの誤植の数」——稀な事象が一定期間・一定範囲内に起きる件数はポアソン分布(Poisson Distribution)に従います。
パラメータ (ラムダ)は単位期間あたりの平均発生件数です。例:1時間あたり平均2件なら 。
ポアソン分布の美しい性質:期待値と分散がともに に等しい。
独立なポアソン変数の和もポアソン分布になります:、 が独立なら 。
ポアソン分布の導出(少数法則)
二項分布 で 、、 の極限をとるとポアソン分布に収束します。これが「少数法則」です。
ポアソン分布の正規近似: が大きいとき(目安 )、ポアソン分布は正規分布で近似できます:(期待値 分散 を利用)。二項分布の正規近似と合わせて、大きなパラメータの確率計算に使います。
連続修正(Continuity Correction):ポアソン分布も二項分布も「整数値しかとらない離散分布」です。これを連続な正規分布で近似するとき、「整数 は実数軸の区間 を代表する」と考えて を加減する補正が連続修正です。どちらの分布を正規近似するときも同じルールを使います。
例: で を正規近似するとき、連続修正なしだと 、連続修正ありだと として計算します( を加える理由:整数 が の区間全体を代表するから)。
試験頻出:「 の正規近似」では 、「 の正規近似」では とします( は近似に使う正規確率変数)。
ポアソン分布で「何件起きるか」がわかりました。次は視点を変えて「初めて成功するまでに何回かかるか」という待ち回数の分布を学びます。
幾何分布・負の二項分布
「コインを投げて初めて表が出るまでの回数」——前モジュールで学んだベルヌーイ試行(1回の成功確率 、各試行が独立)を繰り返す状況で、初めての成功まで何回かかるかを記述するのが幾何分布(Geometric Distribution)です。
「 回目に初めて成功する」とは——最初の 回が独立に失敗し(各回の確率 )、ちょうど 回目に成功する(確率 )ことです。各試行が独立なので確率を掛け合わせると:
期待値 (成功確率 の逆数——平均 回試行すれば1回成功する)、分散 。
無記憶性(Memoryless Property):——「すでに 回失敗していても、あと 回以内に成功する確率は最初から変わらない」性質。連続型では指数分布が同じ性質を持ちます。
負の二項分布(Negative Binomial Distribution)は幾何分布の一般化で、「 回成功するまでの試行回数」を記述します。幾何分布は の特殊ケースです。期待値 、分散 (幾何分布の 倍になっています)。
多項分布
二項分布が「成功か失敗か(2択)」なら、多項分布(Multinomial Distribution)は「3択以上」への拡張です。 種類の結果が確率 ()で起きる試行を 回繰り返したとき、各結果が 回起きる同時確率:
各周辺分布は二項分布 になります。なぜかというと、 番目の結果だけに注目すると「 が出る(確率 )か出ない(確率 )か」の2択に帰着するためです。品質管理(良品・不良A・不良B)や選挙の得票率分析などに使われます。
確認クイズ(抜粋)
Q1. ポアソン分布の「期待値と分散」の関係として正しいものはどれか?
A. 期待値 = 分散 =
Q2. 幾何分布の「無記憶性」とはどういう性質か?
A. 過去の失敗回数に関わらず、次の試行の成功確率は のまま変わらない
Q3. 1日あたり平均3件の注文があるオンラインショップ。1日に5件以上注文が入る確率を求めるに最も適した分布はどれか?
A. ポアソン分布
全10問のクイズはサイトのインタラクティブ版でお試しください。
第2章の他のモジュール
※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。