← study-apps.com 学習サイト集トップへ

データの可視化

棒グラフ・ヒストグラム・茎葉図・度数分布表・箱ひげ図で1変数のデータを視覚化します。2変数の関係(散布図・相関・クロス集計)は次のモジュールで学びます。

このモジュールで学ぶこと 「数値の表を眺めているだけでは気づかなかったことが、グラフを描いた瞬間に見えてくる」——これがデータ可視化の醍醐味です。たとえば100人分の身長データが数字の羅列として並んでいても、分布の形・外れ値の存在は一目ではわかりません。適切なグラフや表を選んで描くことで、データが「語りかけてくる」ようになります。このモジュールでは1変数のデータを整理・可視化する基本ツールを学びます。2変数の関係(散布図・相関係数・クロス集計)は次のモジュール「散布図・相関・クロス集計」で扱います。 基本的な統計グラフ:目的に合わせて選ぶ 統計グラフは「何を伝えたいか」によって使い分けます。グラフの種類を間違えると、データの特徴が正確に伝わりません。試験では「このデータにはどのグラフが適切か」という問いが頻出です。 1変数のデータを見るグラフ: 棒グラフ:「血液型別の人数」「月別の販売数」など、カテゴリごとの数量を比較する。棒の高さが値を表し、棒の間に隙間がある。 積み上げ棒グラフ:棒グラフを積み上げた形。各棒の中に複数のカテゴリを積み上げ、合計値とその内訳の構成比を同時に比較できる。「月別の商品カテゴリ別売上の推移」のような用途に適する。100%積み上げ棒グラフ(帯グラフ)は割合の比較に特化する。 折れ線グラフ:「月別の気温推移」「年別の人口変化」など、時間の経過とともに変化する量を表す。点を線で結ぶことで趨勢(トレンド)を読み取れる。 円グラフ:全体を100%として「構成比(割合)」を表す。扇形の角度が各カテゴリの比率を示す。「年代別の支持率」など全体に占める割合を強調したいときに使う。 帯グラフ:棒を100%に揃えて積み上げた比率のグラフ。複数のグループ間で構成比を比較するのに適している。例:「年代別の投票先の割合比較」 レーダーチャート(蜘蛛の巣グラフ):複数の指標を放射状の軸で表し、多角形の面積・形で総合評価を視覚化する。例:「ある選手の攻撃力・守備力・スピード・スタミナ・テクニック」5項目の比較。バランスの良し悪しが一目でわかるが、軸の順番によって見た目が変わる点に注意。 ローソク足(ローソクチャート):株価など時系列の金融データで使われるグラフ。1本のローソクが「始値・終値・高値・安値」の4値を表す。終値が始値より高ければ陽線(白/赤)、低ければ陰線(黒/青)で表示。時系列グラフの一種で、上昇・下降トレンドや価格の変動幅を視覚化する。 2変数以上のデータを見るグラフ: 散布図:2変数の関係を点で表す(次のセクションで詳しく学ぶ) バブルチャート:散布図に第3の変数を「バブル(円)の大きさ」として加えたグラフ。X軸・Y軸・バブルサイズの3変数を同時に視覚化できる。例:「GDP(X軸)・平均寿命(Y軸)・人口(バブルサイズ)」で国別データを表示する。 モザイク図:2つの質的変数の関係を面積で表すグラフ。クロス集計表を視覚化したもので、各カテゴリの割合を縦・横の幅で同時に表す。「性別と血液型の分布」のような2カテゴリ変数の関係を把握するのに有効 複合グラフ(2軸グラフ):棒グラフと折れ線グラフを重ねて、単位の異なる2変数(例:売上額と成長率)を同時に表示する 試験ポイント: 「時間の変化を見るなら折れ線グラフ」「構成比を見るなら円グラフ・帯グラフ」「複数指標の総合比較ならレーダーチャート」「3変数の関係ならバブルチャート」「金融の4値データならローソク足」という使い分けを押さえましょう。棒グラフとヒストグラムの違い(棒グラフは離散カテゴリ、ヒストグラムは連続量を区間に分けたもの)も頻出です。 ヒストグラム:分布の「形」を読む 50人のクラスのテスト点数を分析するとします。データを「0〜9点」「10〜19点」...「90〜100点」のような等幅の区間(階級またはビン)に分け、各階級に何人いるかを棒の高さで表したグラフがヒストグラムです。 ヒストグラムを描くと、分布の「形状」が見えてきます。 左右対称(山型):多くの人が平均点付近に集中している標準的な状態。 右裾が長い(右歪み):ほとんどの人が低得点だが、少数の高得点者がいる状態。年収分布の典型例です。 左裾が長い(左歪み):高得点者が多く、低得点者が少ない状態。簡単すぎるテストに多い形です。 双峰型(2つの山):得点層が2つに分かれているサイン。男女など2つのグループが混在している可能性があります。 ヒストグラムは「1変数のデータ全体の分布形状」を把握するためのグラフです。棒グラフとの本質的な違いは横軸にあります——棒グラフは「血液型A・B・O・AB」のようなカテゴリを横軸にしますが、ヒストグラムは「60点以上70点未満」のように連続した数値を等

※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。