「分布図」とは? – 2つの変数について、その相関関係を視覚化するグラフの一種について解説
分布図とは?
分布図は、2つの変数の相関関係を視覚化するためのグラフの一種です。横軸には1つの変数を、縦軸にはもう1つの変数をとり、それらの値を散布図としてプロットします。
例えば、身長と体重の2つの変数がある場合、身長を横軸に、体重を縦軸にとってプロットした散布図が分布図となります。これにより、身長と体重の相関関係を可視化することができます。
分布図の使い方
分布図は、相関関係があるかどうかを確認するために使用されます。相関係数を計算する前に、分布図で確認することで大まかな傾向をつかむことができます。
また、分布図は、異常値(外れ値)を検出するためにも使用されます。異常値は、一般的な傾向から外れた極端な値であり、分布図にプロットされた点から容易に発見することができます。
分布図の例
例として、身長と体重のデータから作成した分布図をご覧ください。
![分布図例](https://example.com/sample.png)
この分布図からは、身長が高くなるにつれて体重も増加する傾向があることがわかります。また、外れ値として、身長160cm付近で体重100kg以上の値があります。
まとめ
今回は、分布図について解説しました。分布図は、2つの変数の相関関係を視覚化するために使用され、異常値の検出にも有効です。分布図は、データ分析において基本中の基本であり、ぜひ活用していただきたいグラフの一つです。