評価、分析について

国際開発学分野の評価や統計的分析手法について勉強しています。日々学んだことを記録していきます。

確率分布と確率変数の話

統計学とは

統計学とは関心のある現象を確率変数によって表現し、まだ起こっていない事象の可能性を推定したり予測することです。統計学は主に「記述統計」と「推測統計」に分類されます。「記述統計」は得られたデータの範囲内でその特徴や規則性を分析すること、「推測統計」は統計データの背後にあってそのデータを生み出したものの持つ規則性を分析することをいいます。

 

例えば100人の中学1年生の女子学生の身長を測定し、100人分のデータを得られたとします。私たちが知りたいのは1人の身長ではなくそれら100人の女子学生のデータを集めてわかる平均身長や個人間のばらつきです。ただしある特定のグループから1回データを取得する場合、別の機会に100名を選んだ場合は違う結果が出ると予想されます。本来多くの回数の観察によってわかる事象を、1回あるいは小数回の観察にもとづいて推測することを「推測統計」あるいは「統計的推測」といいます。これに対し、ある1回の試験の結果それ自体についての分析、つまりある特定のデータの分析結果を「記述統計」あるいは「統計的記述」をいいます。 

 

■確率変数

「推測統計」つまり推定や予測の際に重要な概念が「確率変数」です。確率変数とは、一般的に「その取りうる各値に対してそれぞれある一定の確率が付与され(あるいは対応し)ているような変数」、つまり、ある一定の範囲の中でどんな値にもなる可能性があり、かつそれぞれの値をとる確率が定まっているような変数です。まとめると、以下の性質を持つものを一般的に「確率変数」と呼びます。

 

  1. xは変数

  2. xは取りうる値の範囲が決まっている

  3. xが特定の値をとる確率が定まっている

 

確率変数xがとる確率はP(x)と表されます。例えば、1枚のサイコロを投げるとき、確率変数の値(=サイコロの出る目)をXとおくと次のように表すことができます。P(X)=1/6(X=1,2,3,4,5,6)右側のカッコの中はXがとる値の範囲であり、この例では「確率変数Xが1から6までの整数の値を取る」ことを表しています。

 

  • P(X=3)=1/6

  • P(3)=1/6 

 

■確率分布

確率変数と、その各々の値に対してとる確率を示したものが確率分布です。 

X

1

2

3

4

5

6

P(X)

 1/6

 1/6

 1/6

 1/6

 1/6

 1/6

 

 

 <今後の学習>

・確率分布(二項分布、ポアソン分布)を学ぶ  

 

 

<参考>

基本統計学 第4版

基本統計学 第4版