昨日この話に触れて、そういえば私も学部生のときはイマイチ理解できていなかったなと思い、記事にすることにしました。
折れ線グラフと散布図の使い分けをきちんと理解できていますか?
図1:折れ線グラフの例(東京都の住居費の推移)
(参考:e-Stat 統計で見る日本 都道府県・市町村のすがた)
図2:散布図の例(都道府県ごとの人口密度と住居費の関係)
(参考:e-Stat 統計で見る日本 都道府県・市町村のすがた)
上のグラフが折れ線グラフ、下のグラフが散布図です。
線があるのが折れ線グラフで、点だけのが散布図だ!
はい、この認識は間違いです。
図3:散布図の例②(時間経過に伴うお湯の温度変化)
このグラフも「散布図」になります。線の有無は関係ないです。
…………。
次から詳しく説明していきます。
折れ線グラフと散布図の違いは何?
端的に言うと、
折れ線グラフは、横軸(X軸)が項目軸(又は日付軸)で、縦軸(Y軸)が数値軸のグラフ
散布図は、横軸(X軸)も縦軸(Y軸)も数値軸のグラフ
という違いがあります。
横軸も縦軸も数値データの場合に「折れ線グラフ」を選択するのは、グラフの作り方として間違っています。
知恵袋などでも、「折れ線グラフで横軸を等間隔にしない方法は?」などの質問が見つかりますが、横軸が等間隔でなければ、そもそも折れ線グラフではありません。
……どういうこと?
折れ線グラフの横軸とは何か?
先程出した、お湯の冷め方の散布図がこちらです。
図3:散布図の例②(時間経過に伴うお湯の温度変化)
ではこれを折れ線グラフで表すとどうなるのでしょうか。
予想できますか?
図4:時間経過に伴うお湯の温度変化(折れ線グラフ)
散布図と形が全然違う!横軸が変……?
何故このようになってしまうのでしょうか?
これは、折れ線グラフの横軸が単なる直線ではなく、項目軸という特殊な軸であることが原因です。
図5:項目軸
項目軸は、Excel内部で番号によりそれぞれ管理されています。
その番号に対応する項目名がグラフには表示されます。
そのため、項目軸は必ず等間隔で配置されます。
図6:項目軸と項目番号
そもそも、折れ線グラフは縦方向の大小関係を見るためのグラフで、横方向の大小関係を見るためのものではありません。
2つの数値データの関係を表わすグラフを折れ線グラフでつくることが間違っています。
図7:折れ線グラフの見方
散布図の横軸とは?
折れ線グラフの横軸が項目軸だったのに対して、散布図では、縦軸と横軸ともに数値軸です。
数値軸が2本あるので縦方向と横方向の大小関係が正しくなり、2つの数値の関係性が分かります。
図8:散布図の見方
ただし、散布図の横軸は数値軸のため、項目名(文字列)は表示されません。
よく見るグラフだと、エビングハウスの忘却曲線とかはほぼ100%横軸が数値軸ではないので気持ち悪くて発狂しそうになります。気になる方は画像検索でもしてみてください。
どちらを使うべきかの見分け方
分かったような分かってないような……これはどっちを使うべきなんだろう?
どちらを使うか迷うときもあると思います。
ひとつの考え方として、いまグラフを作ろうとしているデータで棒グラフを作れるかどうかを考えてみると分かりやすいと思います。
棒グラフと折れ線グラフは似た関係で、数値の大小を見たいか、数値の変化を見たいか、で使い分けがされます。
そのデータで棒グラフを作ろうとして作れなければ、ほぼ散布図を使うのが正しい場面です。
例えば、先程の「お湯の冷め方」のデータで棒グラフを作ろうとは思えませんよね。この場合は散布図です。
少々乱暴ですが、分からないときはこのように考えたら大体合ってるかと思います。
まとめ
・折れ線グラフは、横軸(X軸)が項目軸、縦軸(Y軸)が数値軸のグラフ
・散布図は、横軸(X軸)も縦軸(Y軸)も数値軸のグラフ
・そのデータで棒グラフが作れないときは、ほぼ折れ線グラフを使うべき場面ではない
散布図は結構使う場面多いよ!
またいつか、色々なグラフの使い分けに関しても説明したいと思います。
コメント