評価、分析について

国際開発学分野の評価や統計的分析手法について勉強しています。日々学んだことを記録していきます。

8月の勉強目標

7月の勉強内容 7月は微積分の復習を行いました。平日2時間を目標としていましたが、仕事が忙しくなりあまりできませんでした。。 休日は計画通り3時間勉強しました。 8月の勉強目標 11月に統計検定準一級と一級、専門統計調査士を受験する予定です。今月は過…

今月の勉強目標

あまりにもやりたいことが多すぎて混乱してきたため、毎月の勉強目標を立てることにしました。10月に数学検定を受験しようと思っているため、今月は数学の勉強を中心に行いたいと思います。 【今月の勉強目標】 10月に数学検定準一級を受験します。今月は数I…

不偏性と一致性

母集団の特徴を知りたいとき、母集団が小さければ全数調査を行うことができるが大きい場合は困難。そのようなときに母集団の一部(標本)を抽出し、抽出した標本の特徴を知ることによって母集団全体の特徴を把握する。 標本を要約し、母集団の母数の推測に使…

系列相関の対処

コクラン•オーカット法 1階の系列相関が検出された→相関を除去する方法 新たな説明変数を加える モデルの関数型を変える ダミー変数を加える それでも除けない場合はOLSに代わるパラメータ推定量を採用。コクラン•オーカット法(CO)、プレイス•ウィンスライン…

系列相関

系列相関とは 系列相関とは自己相関ともいい、時系列データを用いた回帰分析で問題になる。誤差項の間に相関関係があることを意味する。 通常の回帰分析においては、誤差項には系列相関がないことが仮定されている。もし系列相関がある状態で回帰分析を行う…

回帰分析モデルの診断

回帰分析の診断 モデルが必要な仮定を満たしているのかを確認する。満たしていない場合は回帰分析で得られた結果は信頼できない可能性があり、モデルを再考(変数変換や交互作用の追加など)する必要がある。 残差の仮定 回帰モデルが正しい推定であることを…

母分散比の検定

母分散比に対する仮説検定 二つの異なる母集団の母分散が等しいかどうかを検定する。二つの正規母集団の母平均が等しいか否かの検定の際に、母分散が等しいかどうかによって検定方法が異なるため、母平均の検定の際にはまず母分散比を確認する必要がある。 …

母分散の推定

母分散の推定 母集団の分布を特徴付ける定数を母数(パラメータ)といい、母数の値を標本をもとに推定する。 母数の値を推定することを点推定といい、母数の値の範囲を推定することを区間推定という。標本により推定した、推定量の平均(期待値)()が、母数(…

情報量

情報量とは 確率p(>0)で起こる事象を観測したときの自己情報量という。 、単位はbitであらわされる。 情報量は工学系からきていて、対数の底は2とすることが多い。 また、その確率が小さいほど情報量が大きくなるという反比例の特徴を持つ。 例えば、 ジョー…

独立性の検定

独立性の検定 母集団で2つの変数の間に関連性があると言えるかどうかを、クロス表をもとにして判定する。カテゴリ変数の相関をみる時に用いる。連続変数の場合は、相関係数を算出する。ただし、連続変数の場合もカテゴリに分類しダミー変数を作れば独立性の…

確率分布とモーメント

モーメント モーメントは確率分布の特徴を表す量のこと。確率分布の平均、分散などをモーメントで表すことができる。モーメントはモーメント母数関数によって導かれる。 確率変数Xの原点まわりのモーメントは以下のように表される。 確率分布の平均(期待値…

結合確率分布

例題 次の表は2つの離散型確率変数の結合確率分布を示す。 1 2 3 0 3/20 1/10 3/20 1 1/10 0 1/10 2 3/20 1/10 3/20 この時、 (a) Xの周辺分布とYの周辺分布を求めよ。 (b) E(X),E(Y),E(XY),V(X),V(Y)を求めよ。 (c) E(XY)=E(X)E(Y)は成り立つが、XとYは独立…

相関係数

相関係数の求め方 1. 平均値を求める ・データの平均値を求める。平均は次の計算式で求められる 2. 共分散を求める ・共分散は次の計算式で求められる 3. 標準偏差を求める ・標準偏差は分散の平方根 4. 相関係数を求める rxy=Sxy/SxSy エクセルでの計算 Exc…

2つの異なる母集団の平均の差

1992年から2004年の平均賃金の変化を見る エクセルでの算出方法 1. 検定の準備:標本の基本統計量を算出する ・標本平均:AVERAGE関数 ・標準偏差:STDEV関数 ・標準誤差:標準偏差/√サンプル数 2. 平均の差の検定:t検定を行う 検定プロセス (1)の標準誤…

標準偏差と標本誤差について

標本標準偏差 ・標本標準偏差は母集団から得られたデータのばらつきを表す。 ・標本標準偏差は母集団標準偏差の推定量となる。 ・不偏分散(標本の分散)の平方根で表される。 エクセルでの求め方 ・STDEV(数字の範囲) 標本標準誤差 ・標本平均の標準誤差(s…

Excelによる実証分析

推測統計 標本調査 統計学の目的の一つは母集団の特徴を推定すること。ただし母集団の全てを調査することは時間や費用がかかり現実的ではありません。そこで利用されるのが標本調査という手法です。標本調査は母集団から無作為にサンプルデータを抽出しそこ…

Excelによる実証分析

記述統計学 基本統計量とは データの特徴を見るために必要な数値。記述統計量、要約統計量とも呼ばれる。平均、中央値、最頻値、分散、標準偏差などがある。特に、標本データの分布の特徴を見るためには平均値、中央値、さらに平均からどのくらいばらつきが…

Excelによる実証分析

統計手法を用いて分析する際にExcelやSPSS, STATA, Rなど様々な分析ツールがあると思いますが、初めは基本を学びたいと思い、Excel分析入門を読んでみることにしました。7日間で基本的な分析を一通り学べるという書籍に出会い、今日から読んでいきたいと思い…

確率変数に関する公式一覧

備忘録として、今まで学んだ公式を一覧にしました。 平均値と分散 平均、分散、標準偏差 算術平均 標準偏差 分散 標準化 確率変数と確率分布 期待値と分散 期待値 分散 主な確率分布 ベルヌーイ分布 平均 p 分散 p(1-p) 確率変数の線形確率 平均 分散 歪度 …

確率変数の和

確率変数の和に関する平均と分散 2つの確率変数XとYの和の平均は、それぞれの平均を合計したものになります。 つまり、 一方、XとYの和の分散は、それぞれの分散を合計したものに両者の共分散を加えたものになります。 つまり、 ただし、もしXYが独立ならば…

標本平均とランダム・サンプリング

母集団と標本 例えば日本の平均賃金を知りたいとき、労働者の賃金情報を入手する必要がありますが、全国すべての就労男性、女性にアンケートをとることは難しいです。時間と費用がかかり現実的ではありません。 統計学ではすべての人にアンケートを取らなく…

統計学の基本用語

確率と事象 キーワード 内容 事象 起こりうる互いに重複しない結果 確率 長い時間をかけてみてその事象が発生する時間的な割合 標本空間 起こりうるすべての事象の集合 イベント 標本空間の中の部分集合 確率変数 確率的な事象を数値を使って表現したもの 離…

確率変数と離散確率分布

<前回の復習> 確率変数とは確率的な事象を数値を使って表現したもの。 この確率が離れ離れのものを離散的確率、連続的なものを連続的確率変数と呼ぶ。 離散的確率は宝くじの当たる確率やパソコンが故障する確率などが挙げられる。これに対し、気温や距離な…

確率分布と確率変数の話

■ 統計学とは 統計学とは関心のある現象を確率変数によって表現し、まだ起こっていない事象の可能性を推定したり予測することです。統計学は主に「記述統計」と「推測統計」に分類されます。「記述統計」は得られたデータの範囲内でその特徴や規則性を分析す…