評価、分析について

国際開発学分野の評価や統計的分析手法について勉強しています。日々学んだことを記録していきます。

確率変数に関する公式一覧

備忘録として、今まで学んだ公式を一覧にしました。

平均値と分散

平均、分散、標準偏差

算術平均

{{\displaystyle\frac{Σx_i}{n}}}

分散

s^2={{\displaystyle\frac{1}{n}}}Σ(x_i-\overline{x})^2

標準化

z={{\displaystyle\frac{x-μ}{σ}}}

確率変数と確率分布

期待値と分散

期待値

E(Y)=Σy_ip_i

分散

σ^2_Y=var(Y)=E(Y-μ_Y)^2=Σ(y_i-μ_Y)^2p_i

主な確率分布

ベルヌーイ分布

平均

p

分散

p(1-p)

確率変数の線形確率

平均

E(Y)=μ_Y=a+bμ_X

分散

σ^2_Y=b^2σ^2_X

歪度

{\displaystyle\frac{E(Y-μ_Y)^3}{σ^3_Y}}

尖度(せんど)

{\displaystyle\frac{E(Y-μ_Y)^4}{σ^4_Y}}

標本分布

標本平均

Y={\displaystyle\frac{1}{n}(Y_1+Y_2…+Y_n)}={\displaystyle\frac{1}{n}ΣY_i=μ_Y}

標本分散

var(Y)={\displaystyle\frac{σ^2_Y}{n}}

標本標準偏差

var(Y)={\displaystyle\frac{σ_Y}{√n}}

標準正規分布への近似(中心極限定理

nが十分に大きいとき標準正規分布に近似的に従う
{\displaystyle\frac{(Y-μ_Y)}{\frac{√σ^2_Y}{√n}}}

母集団平均を推定する

母集団分散が既知の場合

標本数が大きければ、\overline{Y}の標本分布はN(μ_{Y,0},σ^2_\overline{Y})に従う。

σ^2_\overline{Y}={\displaystyle\frac{σ^2_Y}{n}}

母集団分散が未知の場合

標本分散

母集団平均μが未知で推定する必要があるため平均μを\overline{Y}に置き換える。自由度n-1で割る
s^2_Y={\displaystyle\frac{1}{n-1}}Σ(Y_i-\overline{Y})^2

標準偏差

(\overline{Y})標準偏差は、σ_\overline{Y}={\displaystyle\frac{σ_Y}{√n}}なので、
母集団標準偏差σの一致推定量という前提のもと、{\displaystyle\frac{S_Y}{√n}}σ_\overline{Y}の推定量として使用できる

SE(\overline{Y})=\hat{\overline{σ}}_Y={\displaystyle\frac{s_Y}{√n}}

t統計量

標準化された標本平均{\displaystyle\frac{\overline{Y}-μ_{Y,0}}{SE({\overline{Y}})}}は統計的な仮説検定において中心的な役割を果たし、
仮説検定を行う際に使われるテスト統計量と呼ばれる。
標本数nが大きいとき、S^2_Yσ^2の分布に高い確率で近づき、近似的に{\displaystyle\frac{\overline{Y}-μ_{Y,0}}{σ_\overline{Y}}}の分布と同一となり、中心極限定理により標準正規分布N(0,1))に従う。

t={\displaystyle\frac{\overline{Y}-μ_{Y,0}}{SE({\overline{Y}})}}