確率分布と確率変数の話
■ 統計学とは
統計学とは関心のある現象を確率変数によって表現し、まだ起こっていない事象の可能性を推定したり予測することです。統計学は主に「記述統計」と「推測統計」に分類されます。「記述統計」は得られたデータの範囲内でその特徴や規則性を分析すること、「推測統計」は統計データの背後にあってそのデータを生み出したものの持つ規則性を分析することをいいます。
例えば100人の中学1年生の女子学生の身長を測定し、100人分のデータを得られたとします。私たちが知りたいのは1人の身長ではなくそれら100人の女子学生のデータを集めてわかる平均身長や個人間のばらつきです。ただしある特定のグループから1回データを取得する場合、別の機会に100名を選んだ場合は違う結果が出ると予想されます。本来多くの回数の観察によってわかる事象を、1回あるいは小数回の観察にもとづいて推測することを「推測統計」あるいは「統計的推測」といいます。これに対し、ある1回の試験の結果それ自体についての分析、つまりある特定のデータの分析結果を「記述統計」あるいは「統計的記述」をいいます。
■確率変数
「推測統計」つまり推定や予測の際に重要な概念が「確率変数」です。確率変数とは、一般的に「その取りうる各値に対してそれぞれある一定の確率が付与され(あるいは対応し)ているような変数」、つまり、ある一定の範囲の中でどんな値にもなる可能性があり、かつそれぞれの値をとる確率が定まっているような変数です。まとめると、以下の性質を持つものを一般的に「確率変数」と呼びます。
-
xは変数
-
xは取りうる値の範囲が決まっている
-
xが特定の値をとる確率が定まっている
確率変数xがとる確率はP(x)と表されます。例えば、1枚のサイコロを投げるとき、確率変数の値(=サイコロの出る目)をXとおくと次のように表すことができます。P(X)=1/6(X=1,2,3,4,5,6)右側のカッコの中はXがとる値の範囲であり、この例では「確率変数Xが1から6までの整数の値を取る」ことを表しています。
-
P(X=3)=1/6
-
P(3)=1/6
■確率分布
確率変数と、その各々の値に対してとる確率を示したものが確率分布です。
X |
1 |
2 |
3 |
4 |
5 |
6 |
P(X) |
1/6 |
1/6 |
1/6 |
1/6 |
1/6 |
1/6 |
<今後の学習>
・確率分布(二項分布、ポアソン分布)を学ぶ
<参考>