← study-apps.com 学習サイト集トップへ

散布図・相関・クロス集計

散布図と相関係数で2変数の量的関係を、クロス集計表で質的変数の関係を分析します。

このモジュールで学ぶこと 前のモジュールではヒストグラムや箱ひげ図で「1つの変数の分布」を見ました。では「2つの変数の関係」はどうやって可視化するのでしょうか。「勉強時間が長いほどテストの点は高いのか?」「性別によってコーヒーの好みに違いはあるか?」——このような問いに答えるのがこのモジュールで学ぶツールです。 散布図と相関係数:2変数の量的関係を見る 2つの量的変数の関係を視覚化するツールが散布図です。「広告費(X軸)と売上(Y軸)」「勉強時間(X軸)とテスト点数(Y軸)」のように、各データ点を平面上の1点として打ちます。 散布図から読み取れる関係の種類: 正の相関:右上がりの点の群。広告費が多いほど売上も多い。 負の相関:右下がりの点の群。気温が下がるほどコーヒーの販売量が増える。 無相関:点がランダムに散らばる。靴のサイズと英語の成績には関係がない。 共分散:2変数が同じ方向にずれるかを測る 散布図から読み取れる「関係の向き」を数値化する第一歩が共分散(covariance)です。 が平均 より大きいとき も平均 より大きければ「同じ方向にずれている」——このずれの積を全データで平均したものが共分散 です。 具体例で確かめる: 3人のデータで広告費 (万円)と売上 (万円)を考えます。、 とします。 Aさん:(3, 30) ⇒ ズレ (−2, −10) ⇒ 積 +20 Bさん:(5, 40) ⇒ ズレ ( 0, 0) ⇒ 積 0 Cさん:(7, 50) ⇒ ズレ (+2, +10) ⇒ 積 +20 ——広告費が高い人ほど売上も高い(正の方向に一緒にずれている)ことが数値で確認できます。 と が同じ方向にずれれば積は正、逆方向なら負になります。ただし共分散には「単位の影響を受ける」という欠点があります——cmとkgの共分散とcmと点数の共分散を比較しても意味がありません。そこで共分散を ・ それぞれの標準偏差の積で割り正規化したものが相関係数です。 この関係の強さを−1から1の数値で表したものがピアソン相関係数 です。 ここで (X の分散)、(Y の分散)です。 は X・Y それぞれの標準偏差の積になります。 分子が共分散の中心部分—— が平均より大きく も大きければ積は正、 が大きく が小さければ積は負になります。分母でそれぞれの「散らばりの大きさ」(標準偏差の積)を割ることで、単位・スケールに依存しない −1〜1 の無次元量に正規化しています。 なら「強い正の線形関係」、 なら「弱い正の関係」、 なら「強い負の関係」のように、 が1に近いほど関係が強いです。散布図で の場合は点が細い右上がりの帯に並び、 の場合は広がりのある右上がりの雲のような形になります。 相関 ≠ 因果: 相関係数が高くても「原因と結果の関係がある」とは限りません。「アイスクリームの売上と溺死者数に正の相関がある」——なぜでしょう?アイスが原因で溺死するわけではありません。夏の気温が高いとアイスもよく売れ、水遊びも増えて溺死者も増える——つまり気温という第3の変数が両方に影響しているだけです。このように第3の変数が見かけ上の相関を作り出すことを疑似相関(擬相関)といいます。 クロス集計表(分割表):2変数の質的関係を整理する 散布図と相関係数は「身長と体重」のような量的変数(数値)2つの関係を見るツールでした。クロス集計表(分割表)は、「性別」「血液型」「合否」のような質的変数(カテゴリ変数)2つの関係を整理する表です。 「性別(男・女)とコーヒーの好み(好き・嫌い)」を100人に調査した結果を例に見ます。 男性(計50人):好き 30人、嫌い 20人 女性(計50人):好き 40人、嫌い 10人 全体(計100人):好き 70人、嫌い 30人 クロス集計表を読む際、「%」の計算方法は3種類あります。 行%(行合計に対する割合): 「男性の中で好きな人は 30/50 = 60%、女性では 40/50 = 80%」——グループ内の構成比を比較するのに使う 列%(列合計に対する割合): 「コーヒーが好きな人の中で男性は 30/70 ≈ 43%、女性は 57%」——特定の結果の中での属性比を見るのに使う 全体%(総計に対する割合): 「全体のうち男性でコーヒーが好きなのは 30/100 = 30%」 試験ポイント: 「原因→結果」の方向で比べたいときは行%が基本です。「性別が原因で好みが結果」なら行%を使い「女性は男性より20ポイント多くコーヒーが好き」と読みます。

※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。