← study-apps.com 学習サイト集トップへ

確率分布の基礎:PMF・PDF・CDF・期待値・分散

PMF・PDF・CDF・期待値・分散——確率分布を数学的に記述する道具を学びます。

このモジュールで学ぶこと 「この試験の平均点は60点」という情報だけでは、「80点以上が何%いるか」はわかりません。分布の形全体——どの値がどのくらい出やすいか——を記述するには、確率分布という道具が必要です。このモジュールでは確率分布の数学的な表現方法(PMF・PDF・CDF)と、分布の中心と広がりを数値で表す期待値・分散・モーメントを学びます。 離散と連続:確率の表し方は2種類ある 確率変数(Probability Variable) とは、試行の結果に応じて値が決まる変数です。たとえばサイコロを1回振った目の数は確率変数で、値は必ず整数(1〜6)になります。これが離散型確率変数です。一方、日本人男性の身長のように連続的な値をとる変数を連続型確率変数と呼びます。2種類で確率の表し方が変わります。 確率質量関数(PMF)と確率密度関数(PDF) サイコロを1回振る——次の目は不確かですが「1が出る確率は1/6」と言えます。目の数は1, 2, …, 6のどれかに確定しています。これが離散型の確率の表し方です。一方、「日本人男性の身長が170〜172cmに入る確率は?」——身長は任意の実数をとり、点1点に確率を割り当てることができません。この2種類の「確率の測り方」の違いを見ていきます。 離散型では「 になる確率」を直接 と書けます。この対応を確率質量関数(Probability Mass Function, PMF)と呼びます。サイコロの例では で、全部足すと1になります。 連続型では、特定の1点(例:身長がぴったり170.0000…cm)の確率は 0 です——連続的な実数は無限通りあり、各点に有限の確率を与えると合計が発散してしまうからです。代わりに「区間内に入る確率」を計算します。直感的には「棒グラフの各棒の面積(高さ×幅)が確率」という考え方を連続化したものです。幅を限りなく細かくして「面積 = 確率」のまま連続化した関数が確率密度関数(Probability Density Function, PDF) です: PMF と PDF に共通する性質: すべての値で (確率は負にならない) 合計(離散)または全区間の積分(連続)が 1 になる 試験頻出:PDF の値 自体は確率ではありません(1より大きくなることもあります)。確率はあくまで「面積(積分)」で表されます。 累積分布関数(CDF)と生存関数 PMF や PDF が「各点の出やすさ」を表すのに対し、「 以下になる確率」をまとめて表すのが累積分布関数(Cumulative Distribution Function, CDF)です: 試験の得点分布を例にすると、 は「60点以下が全体の50%」を意味します。CDF の性質:、、単調非減少。 生存関数(Survival Function) は、信頼性工学や医学研究で「 時間以上生存する確率」として使われます。CDF と生存関数は互いに補完する関係にあり、一方から他方が計算できます。 連続型では CDF を微分すると PDF が得られます。 なので、両辺を で微分すると です(微積分の基本定理): PMF・PDF・CDF で「どの値がどのくらい出やすいか」という分布の形を記述できるようになりました。次は、その分布全体を1〜2個の数値に要約する指標——期待値と分散——を学びます。 期待値・分散・モーメント 分布全体の「中心」と「広がり」を1つの数値で要約する指標が期待値と分散です。 期待値(Expected Value) は確率による加重平均です。サイコロ(1〜6が等確率)の期待値は です。一般形: 分散(Variance) は「期待値からのズレの二乗の平均」で、広がりを表します。この定義式を展開すると計算で便利な形が導かれます: (途中で 、 という期待値の線形性を使っています。)標準偏差は です。 次モーメント(Moment)は です。なぜ期待値・分散だけでなくモーメントが必要なのか——同じ平均・分散でも分布の形が全く異なる場合があるからです。高次のモーメントを加えるほど分布の形をより細かく区別できます。 1次モーメント :期待値(分布の中心) 2次モーメント :分散の計算式 の構成要素 中心モーメント は「平均からのずれ」に注目したモーメントです。3次中心モーメントを で割ったものが歪度(分布の左右の非対称さ)、4次中心モーメントを で割ったものが尖度(裾の重さ)——詳細は次のモジュールで学びます。 期待値・分散の基本性質 「給与を全員一律に10万円上げたら、平均と分散はどう変わるか?」——この問いへの答えが、どんな分布でも成り立つ変換のルールです。 期待値の線形性:定数 , に対して 定数倍・定数加算は期待値の外に出せます。また分布の種類を問わず も成立します(独立かどうか不問)。独立な場合はさらに が成立します。 試験頻出:期待値の線形性は が有限に存在する限り成立します。期待値が発散する分布(例:コーシー分布)では適用できません。 分散の変換公式: (平行移動)は分散に影響しません——分布の形を変えずにシフトするだけです。 のスケール変換は二乗されます。 独立な確率変数の和の分散: と が独立なとき: 独立でない場合は共分散(Covariance) が加わります: 連続型の端点の性質:連続型では1点の確率がゼロなので、端点を含むか否かで確率の値は変わりません: 離散型では端点の扱いで確率が変わるため、この性質は連続型に特有です。

確認クイズ(抜粋)

Q1. 確率密度関数(PDF) の値について正しい説明はどれか?

A. は確率ではなく、区間内の積分が確率を表す

Q2. 累積分布関数(CDF) の性質として誤っているものはどれか?

A. 値域は である

Q3. 確率変数 の分散を計算する公式 を用いて、、 のとき分散はいくらか?

A.

全10問のクイズはサイトのインタラクティブ版でお試しください。

第2章の他のモジュール

※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。