多変量正規分布・変数変換・極値分布
多次元正規分布の性質、ヤコビアンによる変数変換、最大値の極限分布を学びます。
このモジュールで学ぶこと
1変数の連続型分布(指数・ガンマ・ベータなど)を学んだ次のステップとして、このモジュールでは「複数の変数が同時に絡む」3つのテーマを扱います。多変量正規分布(複数の変数が正規分布に従う場合)、変数変換(ある変数から別の変数に変換した後の分布)、そして極値分布(最大値・最小値が従う分布)です。
「変換」と「多次元」が共通キーワード
このモジュールのテーマはすべて「1変数の分布から出発して、何らかの変換・拡張をしたとき分布がどう変わるか」という問いに答えます。ヤコビアンは「1変数変換の面積補正」、多変量正規分布は「正規分布の多次元拡張」として統一的に理解できます。
多変量正規分布
「身長と体重を同時に測ると、身長が高い人ほど体重も重い傾向がある」——2つの変数が互いに関係しながら「正規分布的」に散らばる状況を記述するのが多変量正規分布です。1変数の正規分布を 次元に拡張したもので: 次元ベクトル の PDF は:
: 次元平均ベクトル
: 分散共分散行列(対角成分が分散、非対角成分が共分散)
多変量正規分布の重要な性質:周辺分布・条件付き分布も正規分布、任意の線形変換も正規分布、相関係数が0 ⟺ 統計的独立(正規分布に限り成立する特別な性質)。
試験頻出:一般の分布では「無相関 ⟹ 独立」は成立しません。しかし多変量正規分布に限り「無相関 ⟺ 独立」が成立します。この方向性の違いに注意しましょう。
変数変換
確率変数 を関数 で変換したとき、 の分布を求めるにはヤコビアン(Jacobian)を使います。
なぜ をそのまま使えないのでしょう?変換 は確率の「面積」を引き伸ばしたり縮めたりするからです。例えば なら横軸が2倍に伸び、同じ確率が「幅2倍の区間」に散らばります。ヤコビアン はこの伸縮率を補正して「確率の総量が変わらない」ことを保証する係数です。
が単調増加(または単調減少)の場合、 の PDF は:
例:、 のとき は対数正規分布になります。、 なので:
試験頻出:確率変数の線形変換 では 、。 なら 。
極値分布
「100年に一度の洪水の水位」「 個の電球のうち最初に切れるものの寿命」——最大値・最小値が従う分布が極値分布(Extreme Value Distribution)です。
個の独立同分布の観測値の最大値を適切に正規化すると、 で3種類の分布のいずれかに収束します(Fisher-Tippett-Gnedenko の定理):
ガンベル分布(Gumbel / Type I):指数型の裾(正規分布・指数分布など)の最大値が収束。(二重指数の形は「指数的に小さくなる確率が 個の独立な最大値取り合いから生まれる」ことによる)。気象・土木分野で最頻出。
フレシェ分布(Fréchet / Type II):べき乗則の重い裾(コーシー・パレートなど)の最大値が収束。金融リスク・地震規模などに使われる。
ワイブル分布(Weibull / Type III):有界な分布(一様分布など)の最大値が収束。信頼性工学(部品の寿命)で多用される。
これら3族を統一した一般極値分布(GEV: Generalized Extreme Value)は形状パラメータ で切り替わります: がガンベル、 がフレシェ、 がワイブルです。
確認クイズ(抜粋)
Q1. 多変量正規分布において「相関係数が0」が意味することは何か?
A. 統計的独立(正規分布に限り成立)
Q2. 確率変数 の線形変換 のとき、 を で表すとどうなるか?
A.
Q3. (平均2、分散9)のとき、 はどんな分布に従うか?
A. (標準正規分布)
全10問のクイズはサイトのインタラクティブ版でお試しください。
第2章の他のモジュール
※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。