← study-apps.com 学習サイト集トップへ

データの活用:標準化と変動係数

標準化・z得点・変動係数・指数化でデータを比較可能にします。

このモジュールで学ぶこと 「数学80点と英語75点、どちらの方が優秀だったか?」——科目ごとに平均や難しさが違うので、点数そのものを比べても意味がありません。このモジュールでは、単位や規模の違いを取り除いてデータを公平に比較する方法——z得点・変動係数・指数化——を学びます。 z得点:「何標準偏差分離れているか」 数学(平均60点・標準偏差10点)で80点を取った生徒Aと、英語(平均70点・標準偏差5点)で75点を取った生徒B——どちらが相対的に優れているでしょうか?点数だけでは判断できませんが、「平均からどれだけ離れているか」を標準偏差の単位で測れば比較できます。 各データ値と平均の差を偏差といいます:。偏差の総和は必ず0になります(正と負が打ち消し合うためです)。この偏差を標準偏差で割って「何標準偏差分離れているか」を表したのがz得点(標準化スコア)です: なら平均より上、 なら平均より下。先ほどの例では生徒A(数学)の 、生徒B(英語)の なので、生徒Aの方が相対的に優秀です。z得点に変換したデータ全体の平均は0、標準偏差は1になります。 z得点 = 偏差 ÷ 標準偏差。単位の異なるデータや、平均の異なるデータを同じ土台で比較するときに使います。 変動係数:規模の違うデータの「相対的な散らばり」を比べる z得点は「どの位置にあるか」を表しますが、「どれだけばらついているか」を異なる規模のデータ間で比較したいときはどうすればよいでしょうか?たとえば「成人の体重(平均60kg・標準偏差8kg)」と「大学生の月の小遣い(平均15,000円・標準偏差3,000円)」のどちらの方が相対的にばらついているかは、標準偏差を直接比べても単位が違うため意味がありません。 変動係数(CV: Coefficient of Variation)は標準偏差を平均で割ることで無次元化し、相対的な散らばりを表します: 体重のCV = 、小遣いのCV = となり、小遣いの方が相対的な散らばりが大きいとわかります。CVが大きいほど、平均に対してばらつきが大きいことを意味します。 変動係数は「単位が違うデータ間の散らばり比較」に使う。平均が大きく異なる2つのデータ群を比べるときにも有効です。 指数化:「基準との比」で時系列・グループを比べる 変動係数が「同時点での比較」に役立つのに対し、「時間の経過による変化」を見たいときに使うのが指数化です。「2020年より2024年の売上はどれだけ増えたか」を表す方法として、基準時点の値を100として相対値に変換します: が基準時点の値、 が比較時点の値です。たとえば2020年の売上が1,000万円(基準100)、2024年が1,300万円なら指数は130——「30%増加」したことが一目でわかります。物価指数(CPI)や株価指数などはこの原理で作られています。 複数の商品の価格変動を一つの指数にまとめるときは、各商品の「重要度(ウェイト)」を掛けて加重平均をとります(ラスパイレス指数など)。 指数 = (比較値 ÷ 基準値) × 100。基準年が100、それより高ければ「基準より増加」、低ければ「基準より減少」です。

※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。