母分散の推定
母分散の推定
母集団の分布を特徴付ける定数を母数(パラメータ)といい、母数の値を標本をもとに推定する。
母数の値を推定することを点推定といい、母数の値の範囲を推定することを区間推定という。
母分散の区間推定
正規分布(μは未知)に従う母集団から無作為に抽出した標本を使って新たな確率変数を以下のように定義する。
これが自由度(n-1)の分布に従うことから、分布表から、
となる。
について解くと、母分散の信頼係数1-aの信頼区間は次のように示される。
問題
あるスーパーに入荷したリンゴの中から20個を無作為に選び重さを測定した。平均が120.3gで不偏標準偏差が8.6gの時、入荷したリンゴの平均の重さを信頼係数95%で区間推定せよ。
また、リンゴの重さの分散を信頼係数95%で区間推定せよ。ただしトマトの重さは正規分布に従うとする。
推定区間は
の信頼区間に関してまとめると以下のとおり。
有意水準a | 0.05 |
標本数n | 20 |
標準分散 | 8.6^2 |
32.35 | |
8.91 | |
の信頼区間 |
情報量
情報量とは
確率p(>0)で起こる事象を観測したときの自己情報量という。
、単位はbitであらわされる。
情報量は工学系からきていて、対数の底は2とすることが多い。
また、その確率が小さいほど情報量が大きくなるという反比例の特徴を持つ。
例えば、
ジョーカーを除いたトランプから一枚抜くとき、引いたカードがスペードであることがわかっているときは
引いたカードがエースであることのみ教えられたときは
以上のように、確率でみればP(スペード)=1/13<P(エース)=1/4
であるものの、情報量はI(p)(スペード)>I(p)(エース)である。
平均情報量
情報量の平均(期待値)は
例題
当たり、はずれが入っているくじのなかから一枚引いたとき当たりがでる確率
p(当たり)=4/10
p(はずれ)=6/10
独立性の検定
独立性の検定
母集団で2つの変数の間に関連性があると言えるかどうかを、クロス表をもとにして判定する。カテゴリ変数の相関をみる時に用いる。連続変数の場合は、相関係数を算出する。ただし、連続変数の場合もカテゴリに分類しダミー変数を作れば独立性の検定を行うことができる。
検定の手順
1. 仮説の設定
帰無仮説:母集団では2つの変数は統計的に独立である(関連性ない)
対立仮説:母集団では2つの変数は統計的に独立でない(関連性あり)
※なお、 値は必ず0以上の値しかとらないので、片側検定、両側検定という区別はない。
2. 臨界値を確認する
自由度が(クロス表の行数-1)x(クロス表の列数-1)の 分布表で臨界値を確認する。
3. 値を算出する
\begin{align}x^{2} = \sum_{n=1}^{\infty} \frac{(O_j-E_j)^2}{E_j}
\end{align}
(Oは観察度数、Eは期待度数)
期待度数とは独立であったならばの確率。例えば、相関に関係がないなら各列(各行)の比は一定であるはず(全体の割合×全体の割合で決まる)。
4. 仮説検定
で求めた値がで確認した臨界値を超えていない→帰無仮説棄却されない。
臨界値を超えている→帰無仮説棄却。対立仮説採択される。
問題1
新聞A,B,Cのどれが好きか、男女それぞれに調査したところ、以下のような結果を得た。
A | B | C | |
男 | 35 | 120 | 45 |
女 | 65 | 80 | 155 |
男女により好みに差があると言えるか、有意水準5%で検定せよ。
1.
帰無仮説:男女により好みに差がない(男女と新聞の好みが独立)
対立:男女により好みに差がある(独立でない)
2.
自由度(3-1)(2-1)=2、有意水準5%で片側(右側)なので棄却域は
3.
200*1/5=40...で各行計算すると以下のようになる。
A | B | C | 計 | |
男 | 40 | 80 | 80 | 200 |
女 | 60 | 120 | 120 | 300 |
計 | 100 | 200 | 200 | 500 |
統計量は
4.
より帰無仮説は棄却され、男女で好みに差があると言える。
問題2
曜日ごとの小売店Aへの問い合わせの回数を調査したところ以下のような結果を得た。
曜日 | 月 | 火 | 水 | 木 | 金 | 土 | 日 | 合計 |
回数 | 6 | 4 | 5 | 3 | 6 | 8 | 10 | 42 |
曜日により問い合わせの回数に差があると言えるか、有意水準5%で検定せよ。
1.
帰無仮説:曜日により問い合わせの回数に差がない(独立)
対立:曜日により問い合わせの回数に差がある(独立でない)
2.
自由度(7-1)(2-1)=6、有意水準5%で片側(右側)なので棄却域は
3.
期待度数を計算すると以下のとおりになる。
曜日 | 月 | 火 | 水 | 木 | 金 | 土 | 日 | 合計 |
回数 | 6 | 6 | 6 | 6 | 6 | 6 | 6 | 42 |
統計量は
4.
より帰無仮説は棄却できない
確率分布とモーメント
モーメント
モーメントは確率分布の特徴を表す量のこと。確率分布の平均、分散などをモーメントで表すことができる。モーメントはモーメント母数関数によって導かれる。
確率変数Xの原点まわりのモーメントは以下のように表される。
確率分布の平均(期待値)は確率変数の取りうる値×頻度(その値が取りうる確率の合計)で表される。これを数式で表すと離散確率変数の期待値は
これを一般の場合に拡張して「確率変数Xの関数」の期待値を以下のように定義する。
この時、の特殊な場合として、先ほどのモーメントを代入すると、
離散確率変数は
連続確率変数は
と表される。
また、期待値(平均)まわりのモーメントはで表される。これを先ほどと同様に代入すると、
離散確率変数は
連続確率変数は
と表される。
また、r次の標準モーメントは以下のように表される。
まとめ
確率変数Xの原点まわりのモーメントはで表される。
平均まわりのモーメントはで表される。
モーメントはモーメント母関数によって導かれる(次回)。
結合確率分布
例題
次の表は2つの離散型確率変数の結合確率分布を示す。
1 | 2 | 3 | |
0 | 3/20 | 1/10 | 3/20 |
1 | 1/10 | 0 | 1/10 |
2 | 3/20 | 1/10 | 3/20 |
この時、
(a) Xの周辺分布とYの周辺分布を求めよ。
(b) E(X),E(Y),E(XY),V(X),V(Y)を求めよ。
(c) E(XY)=E(X)E(Y)は成り立つが、XとYは独立ではないことを示せ。
(d) Z=X+Yの分散を求めよ。
(a)周辺分布
Xの周辺分布
x | 0 | 1 | 2 |
P(X=x) | 2/5 | 1/5 | 2/5 |
Yの周辺分布
y | 1 | 2 | 3 |
P(Y=y) | 2/5 | 1/5 | 2/5 |
(b)期待値と分散
(c)独立性
が成り立つ。
しかし、たとえば
であるから独立ではない。
(d)の分散
Zの確率分布の表を作成すると、以下のようになる。
Z(x+y) | 1 | 2 | 3 | 4 | 5 |
P(Z=z) | 3/20 | 1/5 | 3/10 | 1/5 | 3/20 |
であるから
=1+2=3