統計学

離散型の確率変数とは?離散確率分布と確率関数の性質

3718047309_b1f12e01f1_z

 

確率に従って様々な値をとる変数である確率変数は、離散型の確率変数連続型の確率変数の2種類に分類することができます。

 

risan-renzoku

 

「サイコロの目」のように 1,2,3…ととびとびの値をとるのが、離散型の確率変数。

「ある人の身長」のように小数点以下の値をどこまでも細かくできる(例えば、172cmと一言にいっても、正確には172.0829…cmと無限に続く)のが、連続型の確率変数です。

 

「当たり前のことだな」と侮られがちですが、この2つの違いをキチンと理解しておかないと意外なところでつまずきやすくなってしまう重要なポイントです。

 

今回は、離散型の確率変数について見ていきましょう。

photo credit:daBinsi


スポンサーリンク

離散型は、とびとびの値をとる

離散型の確率変数とは、とびとびの値しか取らないものを指します。

 

例えば、「1日にかかってくる電話の回数」の場合、「1回」の次は「2回」であり、1.4回といった値は取りませんよね。

「サイコロを2回振って出た目の平均」の場合も、「3」の次は「3.5」であり、3.197といった値は取りません。

 

risan

 

そのため、例えば「1以上6以下」の中で取りうる値の数は

「1日にかかってくる電話の回数」なら{1,2,3,4,5,6}の6個だけですし

「サイコロを2回振って出た目の平均」なら{1,1.5,2,2.5,3,3.5,4,4.5,5,5.5,6}の11個だけです。

連続型の確率変数であれば「1.758や1.000…001や√3」など無限に取りうる値が存在しますが、離散型の場合はそうではないという意味です。

 

このように、取りうる値が有限個(または無限個であっても可算無限)しかない確率変数。

それが、離散型の確率変数です。

 

離散確率分布

その確率変数が離散型である場合の確率分布を、離散確率分布と言います。

 

離散確率分布は、確率変数 X の取りうる値 x1,x2,…,xn の1つ1つに対応する確率 P(X=xi) が存在し、以下の条件を満たします。

 

risan-joken2
P(A)とは、Aという事象が起きる確率のこと。つまり、P(X=xi)とは確率変数 X が xという値をとる確率を意味します。

 

①は、それぞれの値をとる確率は 0 以上 1 以下(0%~100%)である

②は、「全ての事象の確率を合わせれば100%になる」

ということを言っています。

 

例えば、「偏りのないコインを2回投げて表が出る回数」を確率変数 X とおく場合、以下のようにこの条件を満たしていることが分かります。

 

risan-ex

確率関数

取りうる値の個数が少ない時はP(X=x1)=△、P(X=x2)=□、…と1つずつ書いていっても問題ありませんが、取りうる値の個数が多くなってくると、流石に厳しくなってきますよね。

 

そんなときは、確率変数 X が xという値をとる確率 P(X=xi) を、f(xi) という関数で表すと何かと便利です。

 

risan-kansu

 

この f(xi) (i=1,2,…,n)のことを確率関数と呼びます。(確率質量関数とも)

 

例えば、「偏りのないコインを2回投げて表が出る回数」を確率変数 X とおく場合、その確率関数はこんな式になります。

 

prob-function

 

特に、二項分布ポアソン分布の確率関数は見かけることも多いので、ぜひ覚えておきたいところです。

コイン投げから分かる二項分布。正規分布やポアソン分布との関係性と近似について コインを投げると、試行結果は基本的に「表」か「裏」かの2通りだけですよね。 ※試行:コイン投げのように同じ条件で何度も繰り返す...
ポアソン分布とは何か。その性質と使い方を例題から解説 【馬に蹴られて死ぬ兵士の数を予測した数式】 1年あたり平均0.61人の兵士が馬に蹴られて死ぬ軍隊において、「1年に何人の兵士が馬に蹴られて死ぬかの確率の分布」を求める。 ...

 

離散型を理解したら、次は「連続型の確率変数って何?連続確率分布と確率密度関数を紐説く」の記事も読んでみてください。