分布の特性値:歪度・尖度・変動係数
歪度・尖度・変動係数——分布の「形」を数値で読む3つの道具を習得します。
このモジュールで学ぶこと
「同じ平均・分散でも、分布の形が全く違う場合があります。なぜ?」——前のモジュールで期待値・分散という道具を学びました。このモジュールでは、分布の「歪み」「裾の重さ」「相対的なばらつき」を数値で読む3つの指標を習得します。これらは準1級の試験で直接問われる重要な内容です。
なぜ期待値・分散だけでは足りないのか
「年収の平均500万円、標準偏差200万円」と言われても、それだけでは「高所得者が少数ながら分布を右へ引っ張っているのか、それとも左右対称なのか」がわかりません。2つの分布が同じ平均・分散を持ちながら形が全く違うことがあります。分布の「形」を完全に把握するには、3次以上のモーメントを使った指標が必要です。
歪度:分布の「左右の非対称さ」
期待値(平均)と分散(広がり)を学んだので、次は分布の「傾き(非対称さ)」を数値化します。
「年収分布」を想像してください。ほとんどの人は年収200〜600万円くらいに集まっていますが、一部の超高所得者(1億円超)が分布を右に引っ張っています。これが右裾が長い(正の歪み)分布です。逆に、簡単な試験の得点分布では、ほとんどの人が高得点で、一部の低得点者が左に裾を引きます。これが左裾が長い(負の歪み)です。
この「左右の非対称さ」を1つの数値で表したのが歪度(わいど)(Skewness)です。なぜ3次のべき乗を使うのか——3乗はプラス・マイナスの符号を保ちます。平均より右に外れた値()は3乗してもプラス、左に外れた値()は3乗してもマイナス。右への外れが多ければ合計がプラス、左への外れが多ければマイナスになります。これを で割って単位を消したものが歪度です:
歪度 = 0:左右対称(正規分布がその典型です)
歪度 > 0(右裾が長い):右に長い尾がある。平均 > 中央値になる(年収分布・地震規模など)
歪度 < 0(左裾が長い):左に長い尾がある。平均 < 中央値になる(簡単な試験の得点分布など)
尖度:分布の「裾の重さ」
歪度で「左右の非対称さ」がわかりました。次は「分布の裾がどれだけ重いか(外れ値が出やすいか)」を表す指標を学びます。
「株価の日次変動」を想像してください。ほとんどの日は小さな変動(%以内)ですが、年に数回は大暴落や急騰(%以上)が起きます。正規分布を使うと「10%以上の変動は確率的にほぼゼロ」と予測してしまいますが、現実はそうではありません。このような「裾が重い」分布を正規分布と区別するための指標が尖度(せんど)(Kurtosis)です。
4次のべき乗は常にプラスで、平均から遠い値(外れ値)ほど値が爆発的に大きくなります。つまり外れ値が多いほど尖度は大きくなります。後で学ぶ正規分布の尖度はちょうど 3 になります。「超過尖度(= 尖度 − 3)」として正規分布を基準(0)にした定義も広く使われます。
尖度 > 3(超過尖度 > 0):裾が重く外れ値が出やすい(株価変動、保険の大災害)
尖度 = 3(超過尖度 = 0):正規分布と同じ裾の重さ(比較の基準値)
尖度 < 3(超過尖度 < 0):裾が軽くなだらかな形(一様分布など)
試験頻出:正規分布の歪度は 0、尖度は 3(超過尖度は 0)。この2値は定番問題です。
上の図は歪度・尖度の値が異なる分布を比較したものです。正の歪度(右裾が長い形)・負の歪度(左裾が長い形)の違い、そして尖度の大小による裾の重さの変化を視覚的に確認してください。
変動係数:「単位が違うデータ」を比べる
「身長のばらつき(標準偏差 6 cm)」と「体重のばらつき(標準偏差 10 kg)」——単位が違うのでそのまま比べられません。また「100円のお菓子と8万円のパソコンの価格ばらつき」も絶対額では比べにくいです。
このような場合に使うのが変動係数(Coefficient of Variation, CV)です。標準偏差を平均で割ることで「平均を1としたときの相対的なばらつき」を求めます:
例えば、お菓子(平均100円、 = 30円、CV = 0.30)とパソコン(平均80000円、 = 10000円、CV = 0.13)なら、お菓子の方が相対的にばらつきが大きいとわかります。なお、平均 (正の値)のときに意味のある指標です。
モーメント母関数(MGF)について
「全次数のモーメントをまとめて扱える強力な道具・モーメント母関数(MGF)」は、正規分布などの具体的な分布と一緒に学ぶと意味が実感できます。MGF は正規分布の章で具体例とともに解説します。
確認クイズ(抜粋)
Q1. 正規分布の歪度と尖度(ピアソン定義)の値として正しい組み合わせはどれか?
A. 歪度 = 0、尖度 = 3
Q2. 歪度が正(プラス)の分布の形の特徴はどれか?
A. 右裾が長く、高い値側に外れ値が出やすい(平均 > 中央値)
Q3. 尖度(ピアソン定義)が3より大きい分布の特徴はどれか?
A. 正規分布より山が高く裾が重い(外れ値が出やすい)
全10問のクイズはサイトのインタラクティブ版でお試しください。
第2章の他のモジュール
※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。