パネル・データの分析

Post on 31-Dec-2015

88 views 0 download

description

パネル・データの分析. 内容. パネル・データとは パネル・データの分析方法 fixed effects model ダミー変数による方法,階差方程式による方法 random effects model パネル分析の実際 データ・セットの作成 推定. パネル・データとは. クロスセクション・データ 時系列データ パネル・データ クロスセクション・データ × 時系列 クロスセクションデータを時系列的にプールしたデータ 例) 都道府県別データ (県民所得,物価,地価等のデータ)を数年分あつめたデータ - PowerPoint PPT Presentation

Transcript of パネル・データの分析

パネル・データの分析

内容• パネル・データとは• パネル・データの分析方法– fixed effects model• ダミー変数による方法,階差方程式による方法

– random effects model• パネル分析の実際– データ・セットの作成– 推定

パネル・データとは• クロスセクション・データ• 時系列データ• パネル・データ– クロスセクション・データ × 時系列

• クロスセクションデータを時系列的にプールしたデータ– 例)

• 都道府県別データ(県民所得,物価,地価等のデータ)を数年分あつめたデータ

• 個票データ × 時系列 (調査対象の個人,世帯を数年にわたって追跡したデータ)

• balanced panel と unbalanced panel

パネル・データとは (2)nr year black exper hisp hours lwage married

13 1980 0 1 0 2672 1.19754 013 1981 0 2 0 2320 1.85306 013 1982 0 3 0 2940 1.344462 013 1983 0 4 0 2960 1.433213 013 1984 0 5 0 3071 1.568125 013 1985 0 6 0 2864 1.699891 013 1986 0 7 0 2994 -0.72026 013 1987 0 8 0 2640 1.669188 017 1980 0 4 0 2484 1.675962 017 1981 0 5 0 2804 1.518398 017 1982 0 6 0 2530 1.559191 017 1983 0 7 0 2340 1.72541 017 1984 0 8 0 2486 1.622022 017 1985 0 9 0 2164 1.608588 017 1986 0 10 0 2749 1.572385 017 1987 0 11 0 2476 1.820334 018 1980 0 4 0 2332 1.515963 118 1981 0 5 0 2116 1.735379 118 1982 0 6 0 2500 1.631744 118 1983 0 7 0 2474 1.998229 1

wagepan.raw 賃金や労働時間についてのパネル・データ

個人の識別番号

特定の個人についての複数年のデータ:人種ダミー,経験年数,労働時間,賃金,結婚ダミー

時間を通じて変化しない変数もある(人種ダミー等)。労働時間,賃金は年によって異なる値。

パネル・データ利用の利点• サンプル数の増加,変数の変動性が大きくなる

– 推計値の信頼度が高まる• クロスセクション・データやマクロ時系列データで

は個々の主体の異質性をうまく捉えられない。– パネル・データを利用することで克服できる場合もある

• 動学的効果を捉えることができるかもしれない– マクロ時系列データ

• 集計された経済主体の行動(個々の主体の意思決定がうまく捉えられない)

– 社会資本整備の効果地価に反映される社会資本整備計画のアナウンスの前後のデータがあれば

パネル・データの分析方法• 次のモデルを考える。– i :  個人 i– t : 時点 t

– yit :  被説明変数 個人 i ,時点 t

– xj,it :  説明変数 xj(j=1,2,...,k)  個人 i ,時点 t

– uit : 誤差項 個人 i ,時点 t

ititkkititit uxxxy ,,22,110 uit の想定 pooling data での OLS ,   fixed effects model , random effects model

fixed effects model

0,cov

0,covbut

0,cov,var,0E

effectindividual:

,

,

,2

,,22,110

itjit

ktii

itjititit

i

itiit

ititkkititit

xu

x

xvvv

vu

uxxxy

individual effects は個人 i の説明変数と相関があるかもしれない例) 賃金方程式の推計  個人の生来の資質は観察できない individual effects に反映    しかし,個人の生来の資質は学歴と相関があるかもしれない

random effects model

0,cov

effectindividual:

,

,,22,110

ktii

i

itiit

ititkkititit

x

vu

uxxxy

fixed effects model random effects model はミスリーディングな用語もともとは,文字通りの意味: fixed effects は非確率変数(固定値), random effects は確率変数という想定だった。

パネル分析 その他• 一般的には, individual effects は個々の主体

(クロスセクション)に関連• 場合によっては,時点特有のショックをコン

トロールするために,時点に関連させる場合もある

• unobserved effects model– 個々の主体に特徴的な,観察されない変数の影響

をうまく処理するための手法– 狭い意味でのパネル・データの分析に限定されな

fixed effects model

itiitkkititit vxxxy ,,22,110

1,,,1

,,22,11

,where

itjitjitjititit

ititkkititit

xxxyyy

vxxxy

各変数の t に関しての平均を求め,平均からの乖離をとる

こうした変形で, individual effect を表す項は消去され,他のパラメータを推定できる。個別の主体 i ごとのダミー変数を作って,推計するのと同じ。 (注意) t=1,2,..,T ; i= 1,2,..,n のとき, fixed effects model の自由度はn(T-1) – k であることに注意:  i ごとの平均を求めるために,その分自由度は失われる

itiititiit

ititkkititit

xxxyyy

vxxxy

,,

,,22,11

,

あるいは, 1 階の階差モデルを考える

パネル分析の実際• wagepan.raw を Eviews に読み込む• 賃金と教育等の関係についてのパネル・データ– クロスセクションデータで import ,その後,パネル・

データに変換する方法– パネル・データとして import する方法

• 回帰式の推定– 単純な回帰(プールされたデータで)– fixed effects model

• ダミー変数を用いる• 1 階の階差方程式

– random effects model

wagepan.des

4360 個のオブザベーション=545 のクロスセクション×8 年

最初に空のデータセットを作成

Eviews を起動し, cross section data として読み込むための準備を行う

menu から File New Workfile を選択

左の画面でworkfile structure type として Unstructured/ Undated を選択し, Observationsを 4360 とする OK をクリック

これで空のワークファイルが完成

wagepan.des から変数名をペースト

テキストデータのインポート

最初にwagepan.des を秀丸等で読み込んでおく(変数名をコピーするため)

File Import Readと進んで, wagepan.raw を読み込む左上の欄(赤で囲った部分)に変数名をペーストOK をクリックしてデータセット読み込みの完了

うまく読み込むことができれば左のようになる

データセットができたら適当な名前をつけて保存する

注意: Eviews 7 の画面なので,バージョンによってはメニューや画面が異なることがある

クロスセクションデータをパネルデータに変換するためには,このあたりをクリックするか,menu から Proc Structute/ Resize Current.... を選択

workfile structureで  Dated Panelを選択

個人を識別する変数を入力

時点を表す変数を入力

Frequency や Start date , End date も入力した方がいい場合もある(このデータでは自動的に判別された)

パネル・データへの変換 : 前頁の操作を行うと次の画面が表れる

パネルデータとして識別された

1980-87 年×545 人のデータ =4360obs

パネルデータから通常のundated cross section データへの変換もできる  Proc Structure/Resize .. とたどるか,左の赤で囲った部分( Range あたり)をクリック

最初からパネルデータとして import する方法

Workfile structure type として Balanced Panel を選択

Frequency: Annual を選択(データの期間の指定:月次、四半期などあり)

Start date, End date,No. of Cross sections を指定ここで用いるデータは、1980 年から 1987 年のデータで、各年 545 の固体のデータ  545 x 8 = 4360 obs.

最初からパネルデータとして import する方法 (2)

Menu から File Import Readを選択し、 wagepan.raw を import する

Wagepan.des から変数名をコピーしてペーストCross section idDate id は自動的に作成される

最初からパネルデータとして import する方法 (3)

Cross section id が作成された( nr とは別に)

Date id が作成された( yearとは別に)

ここをクリックすれば、 structure type を変更できる

パネル分析

左のような回帰式を推計する

パネル分析のオプションはこのタブから選択できる

パネル分析のオプションcross section None Fixed Effects Random Effects

Period None Fixed Effects Random Effects

が選択できる

次の方程式を推計• wagepan.raw• lwage = f( educ, black, hisp, exper, married,

union)– educ (教育年数) ,   black (黒人ダミー) ,

hisp (ヒスパニックダミー)は一定の値– exper(labor market experience) • labor market から撤退していなければ(出産等?),基本的には year と同じく,1年ずつ増えていく

パネル分析• 通常の OLS• プールデータでの OLS と同じ• Cross Section : None Period : Fixed

– プールデータで年ダミーを入れた OLS• Cross Section : Fixed Period : None

– プールデータで個人ダミーを入れた OLS– 普通の fixed effects model

• Cross Section : Fixed Period : Fixed– 自由度が不足する

• Cross Section : Radom Period : None– 普通の random effects model

• Cross Section : Radom Period : Fixed

OLSexper を外した OLS

OLS(2)exper を説明変数に加えた場合

OLS(3)時点ダミー( d81- d87) を加えた場合

period fixed effects model と同じ

Period : Fixed EffectsCross Section: None

前のモデルの固定効果:

estimation output の画面からview Fixed / Random Effects を選択していく

cross section : Fixed Effects

period: None

時間を通じて一定の変数は説明変数に加えることはできない  educ, 人種ダミー

1 階の階差モデルと同じ

cross section: random effects

問題 1

• Crime2.raw  – 46市の失業率 (unem) と犯罪発生率 (crmrte) , 1982

年と 1987 年– crmrte を被説明変数, unem を説明変数にして OLS

を,各年ごと,およびプールしたデータで行え。– 各都市の犯罪発生率に結び付く観察不可能な変数が

あるかもしれない。これを考慮して, fixed effects model で crmrte と unem の関係を推計せよ( 2 時点のデータなので,階差モデルで推計すればよい:crmrte,unem の 2 時点間の変化はデータセットに変数として含まれている)。

問題 2• kielmc.raw  – 1978 年, 81 年の 2 時点のデータ– 1978 年時点では焼却場の建設の噂なし, 81 年時点で

はあり(実際には 85 年に建設)被説明変数: 住宅価格( rprice: 1978 年実質)説明変数:   nearinc (住宅がゴミ焼却場の近くなら 1 ) ,  

    y81(81 年なら 1 ) y81* nearinc を説明変数にして, OLS を行え。

– 住宅の質(広さ,築年数等),住宅の周辺環境を表すその他の変数も住宅価格に影響を与える。このことを考慮して(他の適切な説明変数を加えて),焼却場建設の予定が住宅価格を低下させたかどうかを調べよ。

問題 3

• wagepan.raw • 1980 年から 87 年の 8 時点のデータ• 賃金,教育年数,経験年数,人種ダミー,結婚ダミー, ...

1. 次のモデルを pooled OLS で推定せよ1. 被説明変数  lwage   ( 賃金の対数値)2. 説明変数  educ (教育年数) , black (黒人ダミー) , hisp

(ヒスパニック・ダミー)2. random effects model で推計し, pooled OLS との結果と比較せよ。

3. 説明変数を追加して, .1. と 2. の回帰を行え4. fixed effects model +  フルセットの説明変数で回帰を行

え(注意:学歴,人種ダミー等を説明変数に加えることはできない)。