中央値とは?
中央値とは、統計学において代表値の一つであり、データを大きさ順に並べた場合に、中央に位置する値を指します。つまり、データの中央に位置する値を表す指標であり、データ全体の平均よりも外れ値の影響を受けにくいという特徴があります。
中央値の求め方
中央値は、データを大きさ順に並べた際に、真ん中に位置する値を求めることで算出されます。データ数が奇数の場合は、中央に位置する値が中央値になります。一方、データ数が偶数の場合は、中央に位置する2つの値の平均が中央値となります。
例えば、以下のデータがあった場合に中央値を求めてみましょう。
10, 20, 30, 40, 50
データを大きさ順に並べると、10, 20, 30, 40, 50となります。データ数が奇数であるため、中央に位置する値が中央値になります。したがって、中央値は30になります。
次に、以下のデータがあった場合に中央値を求めてみましょう。
10, 20, 30, 40, 50, 60
データを大きさ順に並べると、10, 20, 30, 40, 50, 60となります。データ数が偶数であるため、中央に位置する2つの値である30と40の平均が中央値になります。したがって、中央値は35になります。
中央値の有用性
中央値は、外れ値の影響を受けにくいという特徴があります。例えば、あるクラスのテストの点数が以下のようになっていたとします。
50, 60, 70, 80, 90, 100, 200
この場合、平均値を求めると、(50+60+70+80+90+100+200)÷7=94.3となりますが、200という外れ値の影響を受けてしまっています。一方、中央値を求めると、中央に位置する値である80が中央値となります。外れ値の影響を受けずにデータ全体の傾向を把握することができます。
また、中央値は、データの分布が左右対称である場合に、平均値とほぼ同じ値になります。逆に、左右非対称の分布である場合には、平均値よりも中央値の方がデータ全体の傾向を反映することができます。
まとめ
中央値は、データ全体の中央に位置する値を表す指標であり、外れ値の影響を受けにくいという特徴があります。中央値は、データの平均よりも分布の傾向を反映することができるため、統計学において重要な指標の一つです。