連続型確率分布
正規分布・指数分布など連続分布の性質を理解します。
このモジュールで学ぶこと
「身長がちょうど170.0000cmの人の確率は?」——連続的な量を扱うとき、特定の一点の確率はゼロです。代わりに「170〜171cmの範囲に入る確率」のように区間で確率を考えます。このモジュールでは、連続型確率変数の「確率 = 面積」という考え方と、最重要の正規分布を学びます。
確率密度関数:「確率 = 面積」
身長データのヒストグラムを想像してください。縦軸を「度数÷区間幅」(密度)にして、区間幅を限りなく細かくしていくと、なめらかな曲線が得られます。この曲線が確率密度関数(PDF: Probability Density Function) です。
の値そのものは確率ではありません——確率は「曲線の下の面積」です。(インテグラル)は「面積を求める操作」を表す記号で、 から までの区間の確率は:
全区間の面積は必ず1(すべての確率の合計)です。また「 が 以下になる確率」を表す関数を累積分布関数(CDF) といい、PDFを積分した値に対応します。
連続分布では「確率 = 面積(積分)」。(1点の確率は常にゼロ)。
正規分布:自然界で最も多く現れる分布
人の身長・テストの得点・測定誤差——これらは「平均付近に最も多く、離れるほど少ない」という釣鐘型の形をします。この形を表す分布が正規分布 (ミュー・シグマ二乗)です。(ミュー)は平均、(シグマの2乗)は分散です。
正規分布の最重要特性は「経験則(68-95-99.7則)」です。身長(平均170cm・標準偏差6cm)で具体的に確認しましょう:
平均 (164〜176cm):全体の約 68%——だいたいの人はここに収まる
平均 (158〜182cm):全体の約 95%——ほぼ全員。これより外れると「珍しい」
平均 (152〜188cm):全体の約 99.7%——この外は0.3%のレアケース
と のスライダーを動かすと、分布の位置と広がりがどう変わるか確認できます。
正規分布の確率を計算するときは で標準化して、平均0・標準偏差1の標準正規分布 に変換します。標準正規分布表は (左側の面積)の値を与えます。例えば なので、両側5%の臨界値が となります。
68-95-99.7則()は丸暗記必須。 標準化の手順:。なお は「95%信頼区間の臨界値」( より)であり、68-95-99.7則の「」とは別の数値——混同しないこと。
一様分布:「どこでも同じ確率」
「1から10の間の乱数を発生させる」——区間のどこにも等しい確率で値をとる分布が一様分布 です。確率密度は区間の全幅に均等に分配されます:
この という値は「全面積 = 幅 × 高さ = 」を確保するためです。平均は区間の中央点 、分散は です。
指数分布:「次のイベントまでの待ち時間」
コールセンターに平均2分に1件の電話がかかってきます——では「次の電話まで3分以上待つ確率」はどう求めるでしょうか?ポアソン分布が「一定時間内の件数」を表すのに対し、指数分布 は「次のイベントまでの待ち時間」を表します:
平均待ち時間は (2分に1件なら平均2分)、分散は です。指数分布も幾何分布と同じ無記憶性を持ちます——「すでに2分待っていても、これからさらに1分以上待つ確率は最初から待つ場合と同じ」という性質です。
指数分布の平均 = 。ポアソン分布(件数)と指数分布(間隔)はセットで理解する。
※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。