中央値と四分位数の求め方。四分位範囲・四分位偏差とは何か?

 

中央値(メジアン)とは、データを大きさの順に並べたときに全体の中央に位置する値のことです。

 

同じく、データを大きさの順に並べたときに全体の25%点・50%点・75%点に相当する値のことを第1四分位数・第2四分位数・第3四分位数と言います。(第2四分位数は中央値と同じ)

中央値は英語でMedian、四分位数の読み方は「しぶんいすう」で英語ではQuartileと言います。

 

特に四分位数の求め方には複数の流儀があり、混乱しやすいです。試験ではヒンジと呼ばれる簡易的な四分位数が問われることが多いので、そちらの求め方をじっくりと見ていきましょう。

 

中央値(メジアン)の求め方

中央値は、以下の3つのステップから求められます。

  1. データを小さい順に並べる
  2. データの数が「奇数個 or 偶数個」のどちらなのか調べる
  3. 奇数個ならちょうど真ん中の数、偶数個なら真ん中の2つの数の平均値を調べる

データの数が奇数個の場合

データが奇数個の場合は「小さい順に並べたときに真ん中に来る数」が中央値となります。

問題1:7個のデータ \(62,67,78,50,62,54,71\) の中央値を求めて下さい。

データの数が偶数個の場合

データが偶数個の場合は「小さい順に並べたときに真ん中に来る2つの数の平均値」が中央値となります。

問題2:8個のデータ \(62,67,78,50,62,80,54,71\) の中央値を求めて下さい。

 

 

平均値・中央値・最頻値の使い分け方・メリット・デメリットについては以下の記事で詳しく解説しているので参考にしてみてください。

3つの代表値、平均値・中央値・最頻値の使い分け。データの代表はどれが最適?

2016.07.28

 

四分位数(ヒンジ)の求め方

四分位数の求め方には複数の流儀がありますが、高校の数学Ⅰで教えられている四分位数(ヒンジ)の求め方は以下の通りです。

  1. データを小さい順に並べる
  2. 中央値を求める(第2四分位数)
  3. 中央値より小さい「前半データ」と中央値より大きい「後半データ」に分ける
  4. 前半データ内での中央値が第1四分位数、後半データ内での中央値が第3四分位数
  5. 第3四分位数から第1四分位数を引いた値を四分位範囲という
  6. 四分位範囲の \(1/2\) 倍を四分位偏差という

 

問題3:11個のデータ \(50,54,62,62,67,71,78,80,82,86,87\) の四分位偏差を求めて下さい。

四分位偏差は \(20×1/2=10\) となります。

 

問題4:10個のデータ \(50,54,62,62,67,71,78,80,82,86\) の四分位偏差を求めて下さい。

四分位偏差は \(18×1/2=9\) となります。

 

問題5:9個のデータ \(50,54,62,62,67,71,78,80,82\) の四分位偏差を求めて下さい。

四分位偏差は \(21×1/2=10.5\) となります。

 

問題6:8個のデータ \(50,54,62,62,67,71,78,80\) の四分位偏差を求めて下さい。

四分位偏差は \(16.5×1/2=8.25\) となります。

四分位範囲・四分位偏差とは

第3四分位数から第1四分位数を引いた値を四分位範囲。

第3四分位数から第1四分位数を引いた値の \(1/2\) 倍を四分位偏差と言います。

 

どちらも標準偏差と同じくデータのばらつきの大きさ(散らばり具合)を表す指標です。 

 

四分位範囲・四分位偏差は標準偏差と比べると、①計算が簡単②外れ値(極端な値)に引っ張られにくいというメリットがあります。

一方で、標準偏差には正規分布において68%95%ルールが成立するという大きなメリットがあります。(詳しくは下記記事を参照)

標準偏差とは何か?その求め方や公式の意味・使い方をわかりやすく説明します

2016.02.01

状況に応じて使い分けていきましょう。

 

Excelの四分位数(Quartile関数)の求め方

Excelで四分位数を求める関数としてはQuartile関数があります。

Quartile関数は厳密な25%点・75%点を求める関数のため、さきほどの四分位数(ヒンジ)とは若干異なる値が出てくる点に注意が必要です。

 

例えば、10個のデータ \(1,2,3,4,5,6,7,8,9,10\) の第3四分位数を求める場合、先ほどの求め方だと \(8\) になるはずですが、Quartile関数だと \(7.75\) という答えが返ってきます。(中央値は同じ答え)

 

 

このExcelの四分位数(Quartile関数)の求め方は以下の通りです。

  1. データを小さい順に並べる
  2. 「データ数から \(1\) を引いた値」に25%、50%、75%をかける
  3. 答えが整数 \(k\) なら \(k+1\) 番目の数が四分位数
  4. 答えが \(k+0.25\) なら \(k+1\) 番目の \(0.75\) 倍+ \(k+2\) 番目の \(0.25\) 倍が四分位数
  5. 答えが \(k+0.5\) なら \(k+1\) 番目の \(0.5\) 倍+ \(k+2\) 番目の \(0.5\) 倍が四分位数
  6. 答えが \(k+0.75\) なら \(k+1\) 番目の \(0.25\) 倍+ \(k+2\) 番目の \(0.75\) 倍が四分位数

 

Tooda Yuuto
厳密な四分位数は計算がややこしくなる割に、簡易的な四分位数(ヒンジ)と比べてもそこまで優れた指標というわけでもないので、数学Ⅰで教えられる四分位数(ヒンジ)の求め方だけ覚えておけば十分だと思います。

 

SPONSORED LINK

 

ツイッターやブログ等でシェアしていただけると、非常に励みになります。

Tooda Yuuto
大阪大学を卒業後、数字とにらめっこする日々を送る社会人。当たり前なようでアタリマエじゃないことを日々探しています。