評価、分析について

国際開発学分野の評価や統計的分析手法について勉強しています。日々学んだことを記録していきます。

不偏性と一致性

母集団の特徴を知りたいとき、母集団が小さければ全数調査を行うことができるが大きい場合は困難。そのようなときに母集団の一部(標本)を抽出し、抽出した標本の特徴を知ることによって母集団全体の特徴を把握する。

 

標本を要約し、母集団の母数の推測に使われるものを統計量と呼ぶ。ある統計量が母数の推定に対してどの程度良い性質を持っているかを判断する基準に、一致性、不偏性がある。

 

1. 不偏性

不偏性があるとは、標本から求めた統計量の期待値が母集団の真の値(母数)に等しいことをいう。統計量自体にばらつきはあるものの、平均して母数に等しいこと。

 

2. 一致性

一致性があるとは、サンプルサイズが無限に大きい場合において、統計量が母数に一致すること。

 

(出典)

https://bellcurve.jp/statistics/glossary/12817.html

 

標本平均の不偏性と一致性

標本X_1,X_2,...X_nは母集団分布(\mu, \sigma^2)に従う独立な確率変数である。標本から計算された平均、分散を標本平均、標本分散と呼ぶ。

 

標本平均は

\displaystyle{X=\frac{X_1+...+X_n}{n}}

で定義される。

 

ここで独立な確率変数の加法性を復習。

E(XY)=E(X)E(Y)=\mu

V(XY)=V(X)V(Y)(X,Yが独立の場合)

V(XY)=V(X)V(Y)2Cov(X,Y)=V(X)V(Y)2\rho_{XY}D(X)D(Y)(独立でない場合)

 

①より\bar{X}の平均は

\displaystyle{E(\bar{x}=\frac{(X_1+...+X_n)}{n}=\frac{n\mu}{n}=\mu}

となって、期待値が母平均\muと一致する。

従って、標本平均\bar{X}は母平均\muの不偏推定量である。

 

また、傾向として\bar{X}\muに集中する傾向にある。

②より期待値\bar{X}の分散は

\displaystyle{V(\bar{X})=S^2=V\left ( \frac{1}{n}(X_1+...+X_n) \right )=\frac{1}{n^2}V(X_1+...+X_n)=n\sigma^2/n^2=\sigma^2/n}

従って、n \rightarrow \inftyのとき\bar{x}の分散は0に近づき、\bar{x} \rightarrow \mu(母平均)のように、確率収束していく。

 

標本分散の不偏性

標本分散は

\displaystyle{s^2=\frac{1}{n-1}\left ((X_1-\bar{X})^2+(X_2-\bar{X})^2...+(X_n-\bar{X})^2 \right)}

で定義される。

ここで先ほどの分散との違いで注意しなくてはならないのが、n-1で割っていること。

 

この標本分散s^2は、期待値が

E(s^2)=\sigma^2

と母分散に一致する。

 

先ほどの\displaystyle{V(\bar{X})=S^2=V\left ( \frac{1}{n}(X_1+...+X_n) \right )=\frac{1}{n^2}V(X_1+...+X_n)=n\sigma^2/n^2=\sigma^2/n}も標本分散だが、不偏分散ではない。その差は

 

\displaystyle{E(S^2)=\frac{n-1}{n}\cdot\sigma^2}

で表される。nが小さいと\sigma^2の過小評価が起こる。

 

 

統計学入門 (基礎統計学?)

統計学入門 (基礎統計学?)