Econometric Analysis with R

24

description

Econometric Analysis using R

Transcript of Econometric Analysis with R

Page 1: Econometric Analysis with R
Page 2: Econometric Analysis with R

R을이용한계량경제분석Econometric Analysis with R

김동일

홍익대학교

Philosophy & Art

Page 3: Econometric Analysis with R

R을이용한계량경제분석

저자 |김동일

발행인 |이미애

발행처 | Philosophy & Art

출판등록 | 2008년 1월 8일제152호

주소 |대전시유성구도룡동 380-39

홈페이지 | http://philosophyart.com

c© 2011,김동일

값 18,000원

ISBN 978-89-961425-5-3 93320

2011년 2월 21일 1판 1쇄발행

Page 4: Econometric Analysis with R

머리말

이책은고급수준의계량경제학을배우려는학부생,행렬과외계어로쓰여

진고급계량경제학책에풀이죽은대학원생,이전에는계량경제학을잘알았지

만 지금은 잘 기억이 나지 않는 대학과 연구소의 전문가들을 위한 계량경제분

석의 책이다. 이 책은 고급수준의 계량경제학의 다양한 주제를 간결하게 기술

하였지만 해당 주제의 데이터에 R 프로그램을 응용하는 실전적 내용을 담고

있어 계량경제학을배우려는 학생들뿐 아니라 연구자들에게요긴하게 사용될

수있을것이다.

이 책을 비롯하여, 계량경제분석 시리즈로 Stata를 이용한 계량경제분석,

EViews를 이용한 계령경제분석, SAS를 이용한 계량경제분석이 함께 출판되는

데, 서로 다른 통계프로그램으로 같은 주제의 분석기법과 데이터를 다루는 이

시리즈의책들은서로다른통계프로그램에익숙한연구자들의학문적소통을

돕는데도기여하리라고생각한다.

이 책의 모든 데이터와 데이터에 대한 설명은 http://philosophyart.com에

서 얻을 수 있으며, 책에서 발견되는 오류들에 대한 정오표 역시 같은 곳에서

제공될예정이다.

김동일

2011년 2월

Page 5: Econometric Analysis with R

차례

차례 vii

표차례 xiv

그림차례 xv

제1장 R 1

1.1 R의실행 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

R의소개 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

R의실행방법 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

R의프로그램파일의실행 . . . . . . . . . . . . . . . . . . . . . . . . 3

R명령문의문장규칙 . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2 벡터와행렬 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

벡터의생성 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

벡터의조작 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

행렬의생성 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

행렬의조작 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.3 데이터프레임 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

데이터프레임의생성 . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

데이터프레임의조작 . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.4 시계열오브젝트 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

vii

Page 6: Econometric Analysis with R

viii 차례

시계열오브젝트의생성 . . . . . . . . . . . . . . . . . . . . . . . . . . 18

시계열오브젝트의조작 . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.5 통계 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

요약통계 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

표와그래프 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

확률계산과확률표본의추출 . . . . . . . . . . . . . . . . . . . . . . . 25

1.6 기타 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

패키지 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

시뮬레이션프로그래밍 . . . . . . . . . . . . . . . . . . . . . . . . . . 27

새로운 R함수 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

제2장 고전적선형회귀모형과 OLS추정 31

2.1 고전적선형회귀모형 . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

선형회귀모형 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

강외생성 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

식별성 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

구형교란 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

고전적선형회귀모형의변형 . . . . . . . . . . . . . . . . . . . . . . . 36

2.2 OLS추정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

잔차제곱합과 OLS추정량의정의 . . . . . . . . . . . . . . . . . . . . 37

정규방정식과 OLS추정량 . . . . . . . . . . . . . . . . . . . . . . . . 38

적합도 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

2.3 OLS추정량의성질 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

비편향성 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

Gauss-Markov정리 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

분산의추정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

2.4 정규분포의가정과가설검정 . . . . . . . . . . . . . . . . . . . . . . . 46

정규분포의가정와 OLS추정량의분포 . . . . . . . . . . . . . . . . 46

신뢰구간 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

가설검정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

Page 7: Econometric Analysis with R

차례 ix

2.5 대표본에서의 OLS추정량의성질 . . . . . . . . . . . . . . . . . . . . 55

일치성 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

점근분포와점근분산 . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

가설검정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

2.6 계량경제분석의예 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

Melanoma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

제3장 ML추정 69

3.1 ML추정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

ML추정량 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

ML추정량의일치성과점근분포 . . . . . . . . . . . . . . . . . . . . 70

3.2 가설검정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

LR검정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

Wald검정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

LM검정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

3.3 모형의비교 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

AIC와 BIC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

McFadden의 pseudo-R2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

3.4 고전적선형회귀모형의 ML추정 . . . . . . . . . . . . . . . . . . . . 76

ML추정량 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

AIC와 BIC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

3.5 계량경제분석의예 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

Melanoma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

제4장 회귀모형의선택과비교 81

4.1 모형의선택 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

누락변수와부적합한변수 . . . . . . . . . . . . . . . . . . . . . . . . 81

모형의선택 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

4.2 모형의비교 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

조정된결정계수 R̄2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

AIC와 BIC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

Page 8: Econometric Analysis with R

x 차례

4.3 계량경제분석의예 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

Melanoma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

제5장 비구형교란과 OLS추정 91

5.1 비구형교란과선형회귀모형 . . . . . . . . . . . . . . . . . . . . . . . 91

에르고딕강안정성 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

외생성 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

식별성 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

마팅게일차분 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

OLS추정량의일치성 . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

OLS추정량의점근분포와가설검정 . . . . . . . . . . . . . . . . . . 94

가설검정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

5.2 이분산 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

이분산의검정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

가설검정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

5.3 자기상관 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

시계열데이터의자기상관 . . . . . . . . . . . . . . . . . . . . . . . . 98

자기상관의검정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

가설검정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

5.4 계량경제분석의예 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

Melanoma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

Cigar1992 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

Cigar1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

제6장 내생성과 GMM추정 109

6.1 내생성 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

내생성의문제 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

누락변수 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

측정오차 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

연립방정식모형 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

시차종속변수와자기상관 . . . . . . . . . . . . . . . . . . . . . . . . 112

Page 9: Econometric Analysis with R

차례 xi

6.2 도구변수와선형회귀모형 . . . . . . . . . . . . . . . . . . . . . . . . 113

도구변수 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

선형회귀모형의가정 . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

도구변수의수와식별의조건 . . . . . . . . . . . . . . . . . . . . . . 114

6.3 GMM추정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

MM추정량 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

GMM추정량 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

효율적 GMM추정량 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

구형교란과 2SLS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

비구형교란과효율적 GMM추정의실행 . . . . . . . . . . . . . . . 123

6.4 도구변수와독립변수에대한검정 . . . . . . . . . . . . . . . . . . . 124

도구변수의외생성 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

도구변수의적절성 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

6.5 계량경제분석의예 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

Klein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

제7장 제한종속변수 135

7.1 이항선택 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

선형확률모형과이항선택모형 . . . . . . . . . . . . . . . . . . . . . 136

이항선택모형의 ML추정 . . . . . . . . . . . . . . . . . . . . . . . . . 137

Porbit모형과 Logit모형 . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

7.2 중도절단데이터 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

표준 Tobit모형 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

표준 Tobit모형의 ML추정 . . . . . . . . . . . . . . . . . . . . . . . . 139

7.3 계량경제분석의예 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

Participation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

Affairs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145

제8장 시계열데이터분석 149

8.1 안정적 ARMA과정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

안정적시계열 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

Page 10: Econometric Analysis with R

xii 차례

ARMA과정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

ARMA과정의가역성과안정성 . . . . . . . . . . . . . . . . . . . . . . 153

8.2 단위근의검정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

단위근과 ARIMA과정 . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

단위근의검정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

8.3 ARMA모형의추정과선택 . . . . . . . . . . . . . . . . . . . . . . . . . 161

ARMA모형추정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161

ARMA모형의선택 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

ARMA모형의진단 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

8.4 VAR과정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166

VAR과정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166

Granger-인과관계검정 . . . . . . . . . . . . . . . . . . . . . . . . . . 167

8.5 공적분과 VEC모형 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

공적분 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

VEC모형 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

공적분과 Granger-인과관계검정 . . . . . . . . . . . . . . . . . . . . 169

8.6 계량경제분석의예 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

USmacro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

제9장 패널데이터분석 181

9.1 패널데이터와패널데이터모형 . . . . . . . . . . . . . . . . . . . . . 181

패널데이터 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181

패널데이터모형 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182

9.2 패널데이터모형의추정 . . . . . . . . . . . . . . . . . . . . . . . . . . 183

OLS추정량 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

FE추정량 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184

FD추정량 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

RE추정량 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

2SLS추정량 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

추정량의선택 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193

Page 11: Econometric Analysis with R

차례 xiii

9.3 AR패널데이터모형의추정 . . . . . . . . . . . . . . . . . . . . . . . . 195

AR패널데이터모형 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195

GMM추정량 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196

9.4 계량경제분석의예 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200

Cigar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200

Wages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

부록 A 벡터와행렬과다변량확률변수 207

A.1 벡터와행렬 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207

정사각형행렬과대칭행렬 . . . . . . . . . . . . . . . . . . . . . . . . 207

선형형태와이차형태 . . . . . . . . . . . . . . . . . . . . . . . . . . . 208

양의정부호와양의준정부호 . . . . . . . . . . . . . . . . . . . . . . 209

선형형태와이차형태의벡터미분 . . . . . . . . . . . . . . . . . . . . 209

A.2 다변량확률변수 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210

다변량확률변수의평균과분산 . . . . . . . . . . . . . . . . . . . . . 210

부록 B 통계학이론 213

B.1 분포이론 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213

다변량정규분포 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213

카이제곱분포 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214

t-분포와 F -분포 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214

B.2 대표본이론 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215

확률수렴과분포수렴 . . . . . . . . . . . . . . . . . . . . . . . . . . . 215

큰수의법칙과중심극한정리 . . . . . . . . . . . . . . . . . . . . . . 217

참고문헌 221

용어찾아보기 225

인명찾아보기 233

Page 12: Econometric Analysis with R
Page 13: Econometric Analysis with R

제1장

R

1.1 R의실행

R의소개

R은다음과같이간단히소개할수있다.

• R은 1997년 Ross Ihaka와 Robert Gentleman이 S프로그램언어를이용하

여 통계계산 및 그래프 프로그램으로 개발하였으며, 두 사람의 이름 첫

글자를따서이름이지어졌다.

• R은 GNU일반공중라이선스(GNU General Public License)에따라무료로

배포되고있으며, R에대한보다자세한설명은 http://www.r-project.org

에서확인할수있다.

• R을 실행하면 그림 1.1과 같은 창이 열린다. 창 아래의 >를 명령문 프롬프트(command prompt)라고한다.

R의실행방법

R은다음과같이상호작용을하는식으로(interactively)실행할수있다.

1

Page 14: Econometric Analysis with R

2 1. R

그림 1.1: R의창

• 다음과 같이, 명령문 프롬프트에 명령문을 입력하고 Enter키를 치면 명

령문이 실행되고, 실행된 결과는 다음 줄의 [1] 기호 뒤에 출력된다([1]

의의미는뒤에설명).

> x="Hello World!"

> print(x)

[1] "Hello World!"

여기서=는왼쪽의변수 x에오른쪽의변수값 "Hello World!"를할당(asign)

한다는의미를가지고,명령문 print는변수 x의데이터를출력한다.

Page 15: Econometric Analysis with R

1.1. R의실행 3

R의프로그램파일의실행

R은다음과같이프로그램파일을일괄처리하는식으로실행할수도있다.

• 그림 1.2에서와 같이, 텍스트 에디터로 일련의 명령문으로 이루어진 프

로그램파일을작성하고 hello.R로저장한다.

그림 1.2: 프로그램파일

• 그림 1.3에서와 같이, 터미널의 창에서 프로그램파일을 실행한다 (Win-

그림 1.3: 프로그램파일의실행

dows의경우시스템의경로에 R의경로를추가해야할수도있다).명령

문 R CMD BATCH는 hello.R의프로그램파일을처리하고,그림 1.4에서와

같이,그결과를 hello.Rout파일에저장한다.

Page 16: Econometric Analysis with R

4 1. R

그림 1.4: 프로그램파일의실행결과

R명령문의문장규칙

R의명령문은다음과같은문장규칙을따른다.

• R의명령문은대문자-소문자에민감하다(case-sensitive).즉 print와 Print

는다르다.

• 변수이름과함수이름은알파벳(A-Z, a-z),숫자(0-9),밑줄부호(_),마침표

(.)만사용할수있으며,단알파벳으로시작한다.

• 명령문과명령문은세미콜론(;)또는새로운줄로구분된다.

• #으로시작하는줄은무시된다.즉 #으로시작하는줄에프로그램에대

한설명을넣을수있다.

• 위아래화살표를사용하여이전의명령문을다시부를수있다.

• 줄의끝에서명령문이완결되지않으면,명령문이완결될때까지 R은연

속프롬프트 +를다음줄에표시한다.

Page 17: Econometric Analysis with R

제6장

내생성과 GMM추정

6.1 내생성

내생성의문제

정의 6.1. (내생성) 선형회귀모형에서 E(x iεi) 6= 0이면, 독립변수는 내생

성을가진다고한다.

독립변수의내생성은다음과같은의미를가진다.

• 독립변수가내생성을가지면, OLS추정량은일치추정량이아니다.

b = β +� 1

N

N∑

i=1

x i x′i

�−1 1

N

N∑

i=1

x iεip−→ β +

E(x i x′i)�−1E(x iεi) 6= β

• 독립변수의 내생성은 다음에 설명하는 누락변수, 측정오차, 연립방정식

모형,시차종속변수,등의경우에발생한다.

109

Page 18: Econometric Analysis with R

110 6. 내생성과 GMM추정

누락변수

정의 6.2. (누락변수)정의 4.1에서설명되었지만,편의를위해서다시되

풀이하면,식 (6.1)의회귀모형이참이지만식 (6.2)의회귀모형을추정하

는경우,

yi = x ′iβ + z′iγ+ νi (6.1)

yi = x ′iβ + εi (6.2)

누락변수(ommitted variables)의문제가발생한다고한다.

누락변수가있는경우 OLS추정은다음과같은문제점을가진다.

• E(x iνi) = 0이라고가정하면,식 (6.2)의회귀모형에서 E(x iεi) = E(x iz′i)γ

이다.식 (6.1)의회귀모형이참이면 γ 6= 0이므로,식 (6.2)의회귀모형에

서독립변수의내생성은결국변수 x i와 zi의상관관계에달려있다.

• 일반적으로 같은 관측치의 독립변수들은 상관관계를 가질 확률이 매우높다.누락변수가존재하고,독립변수가누락변수와상관관계를가지면,

독립변수는내생성을가지고, OLS추정량은일치추정량이아니다.

Page 19: Econometric Analysis with R

6.1. 내생성 111

측정오차

정의 6.3. (측정오차)식 (6.3)의회귀모형이참이지만,독립변수 x?i2가직

접 관찰되지 않고, 식 (6.4)에서와 같이 측정오차 ui를 가진 변수 x i2로 관

찰되고,식 (6.5)의회귀모형을추정하는경우,

yi = x ′1β1 + β2 x?i2 + νi (6.3)

x i2 = x?i2 + ui (6.4)

yi = x ′i1β1 + β2 x i2 + εi (6.5)

측정오차(measurement error) 또는 변수내오차(errors in variables)의문제

가발생한다고한다.

측정오차가있는경우 OLS추정은다음과같은문제점을가진다.

• 식 (6.5)의 회귀모형에서 E(x i2εi) = E�

(x?i2 + ui)(νi − β2ui)�

6= 0이고, 따

라서 측정오차를 가진 독립변수 x i2는 내생성을 가지고, OLS 추정량은

일치추정량이아니다.

연립방정식모형

정의 6.4. (연립방정식모형)다음의두회귀모형에서 yi1, yi2는종속변수,

x i1, x i2는독립변수, εi1,εi2는오차항이며,종속변수 yi1, yi2는두연립방정

식을통해동시에결정된다.

yi1 = β11 yi2 + x ′i1β12 + εi1 (6.6)

yi2 = β21 yi1 + x ′i2β22 + εi2 (6.7)

이와 같이, 여러 종속변수가 연립방정식을 통해 동시에 결정되는 회귀모

형을연립방정식모형(simultaneous equations model)이라고한다.

Page 20: Econometric Analysis with R

128 6. 내생성과 GMM추정

6.5 계량경제분석의예

Klein

• Klein.csv는 미국의 거시경제에 대한 1921년-1941년의 연간 시계열데이

터이고, Klein(1950)의 미국경제의 계량경제모형의 데이터이다. 다음과

같이, 명령문 str로 데이터의 내용을 살펴보면 11개 변수에 대해 21개의

관측치가있음을알수있다.

> d=read.csv(Klein/Klein.csv)

> str(d)

’data.frame’: 21 obs. of 11 variables:$ year : int 1921 1922 1923 1924 1925 1926 1927 ...

$ c : num 41.9 45 49.2 50.6 52.6 55.1 56.2 ...

$ p : num 12.4 16.9 18.4 19.4 20.1 19.6 19.8 ...

$ plag : num 12.7 12.4 16.9 18.4 19.4 20.1 19.6 ...

$ wp : num 25.5 29.3 34.1 33.9 35.4 37.4 37.9 ...

$ i : num -0.2 1.9 5.2 3 5.1 5.6 4.2 3 5.1 1 ...

$ klag : num 183 183 184 190 193 ...

$ elag : num 44.9 45.6 50.1 57.2 57.1 61 64 64.4 ...

$ wg : num 2.7 2.9 2.9 3.1 3.2 3.3 3.6 3.7 4 ...

$ g : num 3.9 3.2 2.8 3.5 3.3 3.3 4 4.2 4.1 ...

$ t : num 7.7 3.9 4.7 3.8 5.5 7 6.7 4.2 4 7.7 ...

여기서 year은연도, c는소비(consumption), p는민간이윤(private profit),

plag는 pt−1, wp는 민간임금(private wages), i는 순투자(net investment),

k는자본금(capital stock)이고 klag는 kt−1, e는민간생산(private product)

이고 elag는 et−1, wg는정부임금(government wages), g는정부의비임금

지출(government non-wage spending), t는간접세금(indirect taxes)이다.

• Klein(1950)의소비함수의모형은다음과같다.

ct = β1 + β2pt + β3plagt + β4(wpt +wgt) + εt (6.44)

Page 21: Econometric Analysis with R

6.5. 계량경제분석의예 129

Klein은 식 (6.44)에서 변수 pt와 wpt(따라서 변수 wpt + wgt)는 연립방

정식 모형에서 함께 정해지기 때문에 내생성을 가지고, 상수항과 pt−1,

그리고 yeart , gt , tt , wgt , kt−1, et−1은외생성을가진다고가정했다.

• 상수항, pt−1, yeart , gt , tt , wgt , kt−1, et−1를도구변수로하는식 (6.44)의

회귀모형의 2SLS추정은패키지 systemfit의 systemfit,또는패키지 sem의

명령문 tsls로다음과같이실행할수있다.

> eq=c˜p+plag+I(wp+wg)

> eq.iv=˜plag+year+g+t+wg+klag+elag

> m=tsls(eq,eq.iv,data=d)

> summary(m)

2SLS Estimates

Model Formula: c ˜ p + plag + I(wp + wg)

Instruments: ˜plag + year + g + t + wg + klag + elag

Residuals:Min. 1st Qu. Median Mean 3rd Qu. Max.

-1.890 -0.616 -0.246 0.000 0.885 2.000

Estimate Std. Error t value Pr(>|t|)

(Intercept) 16.55475 1.46798 11.2772 2.587e-09

p 0.01730 0.13120 0.1319 8.966e-01

plag 0.21623 0.11922 1.8137 8.741e-02

I(wp + wg) 0.81018 0.04474 18.1107 1.505e-12

Residual standard error: 1.1357 on 17 degrees of freedom

• Hansen의 J와 Sargan의통계는일치하며,다음과같이구할수있다.

Page 22: Econometric Analysis with R

130 6. 내생성과 GMM추정

> m.aug=lm(m$residuals˜plag+year+g+t+wg+klag+elag,data=d)

> J=nrow(d)*summary(m.aug)$r.squared

> J;pchisq(J,8-4,lower.tail=F)

[1] 8.771508

[1] 0.06707146

상수항, pt−1, yeart , gt , tt , wgt , kt−1, et−1가외생성을가진다는귀무가설

은유의수준 5%에서기각할수없다.

• 상수항, pt−1, yeart , kt−1, et−1의변수의외생성은쉽게예상되며,다음과

같이검정할수있다.

> eq.iv.s=˜plag+year+klag+elag

> m.s=tsls(eq,eq.iv.s,data=d)

> m.s.aug=lm(m.s$residuals plag+year+klag+elag,data=d)

> J.s=nrow(d)*summary(m.s.aug)$r.squared

> J.s;pchisq(J.s,5-4,lower.tail=F)

[1] 0.2849590

[1] 0.5934692

상수항, pt−1, yeart , gt , tt , wgt , kt−1, et−1가외생성을가진다는가정하에

서,변수 gt , tt , wgt가외생성을가지는지의여부는다음과같이검정한다.

> J-J.s;pchisq(J-J.s,8-5,lower.tail=F)

[1] 8.486549

[1] 0.03695694

유의수준 5%에서변수 gt , tt , wgt가외생성을가진다는귀무가설을기각

할수있다.

• 상수항, pt−1, yeart , gt , tt , wgt , kt−1, et−1의도구변수가적절한도구변수

인지,또는약한도구변수가아닌지에대한검정은다음과같이실행한다.

Page 23: Econometric Analysis with R

6.5. 계량경제분석의예 131

> m.1st.1=lm(p˜plag+year+g+t+wg+klag+elag,data=d)

> m.1st.2=lm(I(wp+wg)˜plag+year+g+t+wg+klag+elag,data=d)

> summary(m.1st.1)$fstatisticvalue numdf dendf

8.82098 7.00000 13.00000> summary(m.1st.2)$fstatistic

value numdf dendf

51.14605 7.00000 13.00000

Stock and Watson(2007)에따르면,변수 pt의경우에는 F -통계의값이 10

미만이므로약한도구변수의문제가우려되며,변수 wpt +wgt의경우에

는약한도구변수의문제가우려되지않는다고할수있다.

• 비구형교란을가정하는,식 (6.44)의회귀모형의효율적인 GMM추정은

패키지 gmm의 gmm으로다음과같이실행할수있다.

Page 24: Econometric Analysis with R