データの代表はどれが最適?平均値・中央値・最頻値の求め方の違いと使い分け

最後までお読みいただき、ありがとうございます。ツイッターやブログ等でシェアしていただけると、非常に励みになります

12556514904_1126259172_z

いきなりですが、3秒クイズです。

次のAとB、どちらのグループの方が全体的に数が大きい傾向があるでしょうか?

groups

「いきなり言われても分からないよ…」「直感ではAグループかなぁ」と思われた方も多いかと思います。

人間が一度に処理できる情報の数はだいたい5~7個程度が限界だと言われています。

そのため、上図のようにデータが多くなってくると、グループの傾向をパッと見で判断するのは難しくなってしまいますよね。

そこで重要になってくるのが、集団全体の特徴を1つの数字で表現できる「代表値」です。

代表値は、「Aグループの平均は54で、Bグループの平均は55。だからBグループの方が全体的に大きい傾向がある」といったように、少ない情報量で集団全体の特徴を知るのに役に立つ値です。

ただし、どんな代表値にも弱点があります。

各代表値の弱点を知らずに、「集団の代表として適切ではない」ときにその代表値を使ってしまうと、判断を大きく誤ったり、思わぬ損をする危険性があるんです。

そこで今回は、主な代表値とその強み・弱点について書いていこうかと思います。

photo credit:Lucky Lynda

平均値の求め方

代表値として最も有名なのが、平均値です。

一般的には、平均値と言ったら算術平均のことを指します。

算術平均

算術平均とは、各データの値の合計をデータの個数で割って得られる値のこと。

エクセルではAVERAGE関数で求められる値です。

average

算術平均はすべてのデータからの影響を考慮した値になるので、少ない情報量で集団全体の特徴を知るのに非常に便利な値です。

しかし、データの中に他の値から大きく離れた『外れ値』が含まれていると、その影響を大きく受けてしまうという弱点もあります。

average22

平均年収や平均貯蓄額といった「一部の人が非常に大きな値になりやすい」データにおいては、算術平均は必ずしも集団全体の実態を反映できているとは限らないということを覚えておくと、データに騙されにくくなりますよ。

算術平均は、それ単体で使うのではなく標準偏差と併用するのがオススメです。

幾何平均

算術平均とは少し異なる平均が、幾何平均です。

幾何平均とは、データの個数をn個とすると「n個のデータの値の積のn乗根」を指します。

エクセルではGEOMEAN関数で求められます。

average3

なぜn乗根というややこしい計算を使うのかというと、成長率や利息・利回り率といった『複利効果』があるデータで算術平均を使ってしまうと、予測を見誤ってしまう恐れがあるからです。

average4

成長率や利回りの平均を計算をするときは、算術平均ではなく幾何平均を使うようにしましょう。

中央値の求め方

中央値とは、データを小さい順に並べたときにちょうど中央に位置する値のことです。

データの数が偶数個の場合は、中央に位置する2つの値の算術平均をとります。

エクセルでは、MEDIAN関数を使うことで求められます。

medians

中央値は、平均値と違って外れ値の影響をほとんど受けないため、「普通のデータ」の値を知りたいときは平均よりも中央値の方が適しています。

たとえば、「普通の人はどのくらい給料をもらっているのか?」を知りたい場合は、平均年収よりも年収の中央値を見たほうがいいでしょう。

median2

ただし、平均値と違ってすべてのデータからの影響を考慮しているわけではないので、「前年度と比べて全体的に減少傾向があるのに中央値が増加する」というケースもある点に注意が必要です。

median2

前年度との比較をする際には、中央値は参考程度にとどめておきましょう。

最頻値の求め方

最頻値とは、データの中で最も頻繁に出現する値のこと。

エクセルではMODE関数で求められる値です。

mode

最頻値は「最も頻繁に出現する値」のみを反映するため、他の値から大きく離れた『外れ値』の影響を一切受けないという強みがあります。

ただし、データの数が少ないと「2回しか出現していない値」が最頻値になるなど、「本当にその集団を代表しているのか?」と疑問に思うような値が選ばれたり、複数の値が最頻値になる可能性がある点に注意が必要です。

最頻値はデータの数が少ない時はあまり役に立たないと覚えておくと良いでしょう。

どの代表値にも、それぞれに強みと弱点があります。「そのデータからどんな情報を読み取りたいのか?」を考えながら、適切な代表値を選ぶように心がけたいところですね。