今月の勉強目標
あまりにもやりたいことが多すぎて混乱してきたため、毎月の勉強目標を立てることにしました。10月に数学検定を受験しようと思っているため、今月は数学の勉強を中心に行いたいと思います。
【今月の勉強目標】
10月に数学検定準一級を受験します。今月は数IIIの教科書を読みます。時間は平日2時間、休日3時間が目安です。頑張ります。
不偏性と一致性
母集団の特徴を知りたいとき、母集団が小さければ全数調査を行うことができるが大きい場合は困難。そのようなときに母集団の一部(標本)を抽出し、抽出した標本の特徴を知ることによって母集団全体の特徴を把握する。
標本を要約し、母集団の母数の推測に使われるものを統計量と呼ぶ。ある統計量が母数の推定に対してどの程度良い性質を持っているかを判断する基準に、一致性、不偏性がある。
1. 不偏性
不偏性があるとは、標本から求めた統計量の期待値が母集団の真の値(母数)に等しいことをいう。統計量自体にばらつきはあるものの、平均して母数に等しいこと。
2. 一致性
一致性があるとは、サンプルサイズが無限に大きい場合において、統計量が母数に一致すること。
(出典)
https://bellcurve.jp/statistics/glossary/12817.html
標本平均の不偏性と一致性
標本は母集団分布()に従う独立な確率変数である。標本から計算された平均、分散を標本平均、標本分散と呼ぶ。
標本平均は
で定義される。
ここで独立な確率変数の加法性を復習。
①
②(X,Yが独立の場合)
③(独立でない場合)
①よりの平均は
となって、期待値が母平均と一致する。
従って、標本平均は母平均の不偏推定量である。
また、傾向としてはに集中する傾向にある。
②より期待値の分散は
従って、のときの分散は0に近づき、(母平均)のように、確率収束していく。
標本分散の不偏性
標本分散は
で定義される。
ここで先ほどの分散との違いで注意しなくてはならないのが、n-1で割っていること。
この標本分散は、期待値が
と母分散に一致する。
先ほどのも標本分散だが、不偏分散ではない。その差は
で表される。nが小さいとの過小評価が起こる。
- 作者: 東京大学教養学部統計学教室
- 出版社/メーカー: 東京大学出版会
- 発売日: 1991/07/09
- メディア: 単行本
- 購入: 158人 クリック: 3,604回
- この商品を含むブログ (79件) を見る
系列相関
系列相関とは
系列相関とは自己相関ともいい、時系列データを用いた回帰分析で問題になる。誤差項の間に相関関係があることを意味する。
通常の回帰分析においては、誤差項には系列相関がないことが仮定されている。もし系列相関がある状態で回帰分析を行うと、回帰係数はBLUEにはならず、推定値に疑問が残る。
具体的には、t値、F値、決定係数を大きめに計算してしまい、本当は有意でないものを有意であるとみなしてしまう。
系列相関がある例
誤差項uに1階の系列相関がある場合
被説明変数が一期前の自己の値とによって説明されるモデルを1階の自己回帰モデルという。AR(1)モデルと表される。
,
は自己回帰係数、は確率誤差項。
このとき、は、が正で大きければ、一期前のと同じ方向に動く。もしが-1に近ければ、 は、と反対に動く。
系列相関と自己共分散
自己回帰係数はとの間の相関を表す。つまり、
自己共分散=
自己相関係数=
誤差項に系列相関が生じる原因
・重要な説明変数がモデルから欠落している
・経済行動(消費、貯蓄、投資、輸出入など)における習慣性
・あるショックの経済的影響が期間内で終息せず、次期以降にも及ぶ場合。
・関数型の特定かの失敗
・時系列の回帰分析の時間単位が短いほど前期の影響を受けやすい
ダービン・ワトソン(DW)統計量
1階の系列相関が存在しているかどうかをチェックするための統計量。
OLSの残差をとすると、
ダービン・ワトソン統計量DWは、サンプル数が十分大きいとき、次式によって近似される。
系列相関とDW統計量の関係
p | DW | |
負の相関関係 | -1<p<0 | 2<DW<4 |
系列相関なし | p=0 | DW=2 |
正の相関関係 | 0<p<1 | 0<DW<2 |
DW検定
1階の正の系列相関を見つける場合
帰無仮説 | H0 | p=0 |
対立仮説 | H1 | p>0 |
を棄却(1階の正の系列相関あり)
を棄却も採択もできない(判定不能)
を採択(系列相関なし)
1階の負の系列相関を見つける場合
帰無仮説 | H0 | p=0 |
対立仮説 | H1 | p<0 |
を棄却(1階の負の系列相関あり)
を棄却も採択もできない(判定不能)
を採択(系列相関なし)
DW検定留意点
・定数項のない回帰モデルではDW検定は利用できない。
・回帰モデルの説明変数の中に、ラグ付き説明変数が入っている時も利用できない。→ダービンのh統計量を用いる。
・高次の系列相関には利用できない。→ブロシュ・ゴドフレイ検定
回帰分析モデルの診断
回帰分析の診断
モデルが必要な仮定を満たしているのかを確認する。満たしていない場合は回帰分析で得られた結果は信頼できない可能性があり、モデルを再考(変数変換や交互作用の追加など)する必要がある。
残差の仮定
回帰モデルが正しい推定であることを決める仮定。
仮定1 誤差項の期待値は0
仮定2 説明変数Xと誤差項の独立性
仮定3 等分散性
誤差項の分散はすべてのiについて等しい。
仮定4 誤差項の独立性
誤差項に系列相関は存在しない。
仮定の診断
仮定2 説明変数Xと誤差項の独立性、仮定3 等分散性
モデル診断:散布図を描く
一般的にクロスセクションデータでは誤差項の分散が不均一であるケースが見られる。
残差と予測値、あるいは残差と説明変数による散布図を描いてみて、0を中心に均一に散らばっていれば等分散性に問題はない。
しかし、Xが増加(減少)するにつれ,残差のばらつきが増加(減少)しているような場合はモデルがうまく特定できていない。
チェック方法としては他に、Breusch-PaganテストやWhiteテストがある。
仮定3 等分散性
モデル診断:予測値に対する標準化した残差の絶対値の平方根のプロット(Scale-Location)
残差の変動状況を見る。標準化した残差の絶対値の平方根を縦軸にし、予測値を横軸にした散布図。
モデルが正しければ、プロットは大体一定となる。プロットが予測値に対して増加または減少する傾向がある場合は等分散性が成り立っていないと判断される。
仮定1 誤差項の期待値0、仮定3 等分散性
モデル診断:予測値に対する残差のプロット(Residuals vs Fitted)
モデルがデータに完璧に当てはまるならば誤差 は存在しない。残差はすべてx = 0の水平線上にプロットされる。
あるいは、誤差変動が均一ならば、残差はx = 0の水平線の上下に均等に散らばってプロットされ、一直線に近くなる。
仮定4 独立性
特に時系列データの場合、1期前のデータから生じた残差に相関が存在することがある。これを系列相関といい、残差の独立性が失われることを意味する。系列相関が存在する場合、標準誤差を過小評価することで、回帰係数の検定で本来有意でない結果までも有意とする結果を生む可能性がある。ダービン・ワトソン比(DW)はこれをチェックする方法として知られている。
対応としては、ダミー変数を用いて除去する、コクラン・オーカット法、一般化最小二乗法(GLS)、最尤法などがある。
仮定5 残差の正規性
モデル診断:残差のQ-Qプロットを描く(Normal Q-Q)
データが正規分布しているかを判断するためのプロット。縦軸は標準化した残差の値を表し、横軸は残差の期待値を標準化した値(正規分布の理論値で、残差が正規分布している場合、プロットは対角線上一直線に並ぶ。
外れ値
モデル診断:leverageに対する標準化したプロット(Residuals vs Leverage)
クック距離。個々のデータが推定に与える影響を表した距離(そのデータがない場合とある場合の予測値の変化量)。大きいと外れ値の可能性がある。0.5 を超えると影響力あり、1を超えると異常に影響力があるとされる。
横軸は梃子値で、縦軸は標準化した残差。点線がクックの距離を示す。
母分散比の検定
母分散比に対する仮説検定
二つの異なる母集団の母分散が等しいかどうかを検定する。
二つの正規母集団の母平均が等しいか否かの検定の際に、母分散が等しいかどうかによって検定方法が異なるため、母平均の検定の際にはまず母分散比を確認する必要がある。
仮説設定
帰無仮説は
対立仮説は
検定統計量
母分散の比の検定は、検定統計量
を用いる。
ただし、 ,
帰無仮説が正しい場合、Fは自由度(m-1, n-1)のF分布(m-1, n-1)に従う。
仮説検定
対立仮説が両側検定の場合
のとき帰無仮説棄却しない。
対立仮説が右片側検定の場合
のとき帰無仮説を棄却する。
対立仮説が左片側検定の場合
のとき帰無仮説を棄却する。
注意
問題
ある工場では製造機械A,Bを導入したところ、機械Aでは11個のサンプルで重さの標本標準偏差が1.1kgであり、機械Bでは11個のサンプルで重さの標本標準偏差が0.9kgだった。この二つの機械で製品の均一さに違いがあるか、有意水準5%で検定せよ。
2標本の母分散比について検定する。
帰無仮説は
対立仮説は
自由度のF分布を用いる
有意水準5%で両側検定なので、棄却域はとなる。
計算すべき統計量は
したがって、帰無仮説は棄却されない。A,Bに差はないと言える。