連続型確率分布
確率密度関数・正規分布・標準化を学び、連続型確率変数の確率計算をマスターします。
このモジュールで学ぶこと
前のモジュールで学んだ離散型確率変数では、期待値 や分散 を「確率 × 値の和」で計算しました。連続型でも同じ概念が使われます——違いは、確率の計算が足し算から積分に変わる点だけです。
「サイコロの目は1〜6の整数しかとらないが、人間の身長は165.3cmや170.1cmなど小数点以下の値もとる」——この違いが離散型と連続型確率変数の本質的な差です。連続型では「ちょうど165.000...cmになる確率」は0であり、「165cm以上170cm以下の確率」というように区間で確率を考えます。このモジュールでは確率密度関数(PDF)と、最も重要な連続型分布である正規分布・標準化を学びます。大数の法則と中心極限定理は次のモジュールで扱います。
確率密度関数(PDF)と累積分布関数(CDF)
離散型確率変数では「 になる確率」 のように特定の値の確率が意味を持ちます。一方、連続型確率変数では「ちょうど165.000...cmになる確率」は0です。なぜなら実数の直線上で特定の1点は長さ0の区間だからです。
そこで連続型では「ある区間に入る確率」を面積として考えます。グラフで想像してください——縦軸に関数 (確率の「密度」)、横軸に変数 をとったとき、「 以上 以下の確率」はそのグラフの から の間の面積に等しいです。この関数 を確率密度関数(PDF: Probability Density Function)といい、面積を計算する操作を数式では「積分」と書きます。
自体は「確率」ではなく「確率の密度(単位区間あたりの確率の大きさ)」です。そのため の値をとることもあります(例えば非常に集中した分布では)。ただし全区間で積分すると必ず1になります:。
累積分布関数(CDF) は「 が 以下になる確率」を表し、 で計算できます。
正規分布:自然界に広く現れる「鐘型」の分布
日本人男性の身長を1万人測ってヒストグラムを描くと、平均約170cm付近が最も多く、そこから離れるほど人数が減る左右対称の山型になります。これが正規分布(Normal Distribution)です。身長に限らず、測定誤差・試験の点数・製品の寸法誤差など自然界の多くのデータがこの形に従います。
(平均)が分布の中心の位置を決め、(標準偏差)が分布の広がりを決めます。 が大きいほど山は低く横に広がり、 が小さいほど山は高く細くなります。
68-95-99.7ルール: に約68%、 に約95%、 に約99.7%のデータが含まれます。身長(, )なら、164〜176cmの間に約68%、158〜182cmの間に約95%の人が含まれる計算です。
「身長が に従うとき、182cm以上の確率は?」——このような確率を求めるには正規分布表(付表)を参照する必要がありますが、表には無限種類の正規分布の表は載せられません。そこで標準化を使います。
標準化とは、平均 ・標準偏差 の正規分布を「平均0・標準偏差1」の標準正規分布 に変換する操作です。これにより、どんな と の正規分布も標準正規分布表1枚で扱えます。
、 の身長分布で を標準化すると です。「182cmは平均から標準偏差2つ分高い位置にある」と解釈できます。
標準正規分布表の読み方: ここで大文字 は標準正規分布に従う確率変数、小文字 は「表で調べたい境界となる具体的な数値(分位点)」を指します。表には「」( が 以下になる確率 = 左側の面積)が載っています。例えば のとき です。なぜ 1.96 が95%信頼区間に使われるのか——両側から5%ずつ除くため、片側 残す点を探すと となる が求まります。
信頼水準と対応する 値(必ず覚える):
信頼水準 90%:(片側 5%)
信頼水準 95%:(片側 2.5%)
信頼水準 99%:(片側 0.5%)
信頼水準を上げると 値が大きくなり、信頼区間の幅も広くなります。「より確実に母平均を捉えようとするほど、区間は広くなる」という直感と一致します。
確率を求める3ステップ(試験頻出パターン):
「身長が (, )に従うとき、180cm以上の人の割合は?」
① 標準化:
② 表を引く: 標準正規分布表から
③ 確率を計算: の確率は右側の面積なので 1 から引きます。
「 の確率なら表をそのまま読む」「 の確率なら1から引く」「区間の確率なら2つの表の値の差」——この3パターンを押さえれば、ほぼすべての正規分布の確率問題を解けます。
次のモジュールへ: 正規分布が重要なのは「自然界に広く現れるから」だけではありません。次のモジュール「大数の法則と中心
※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。