한국 여성의 총 출산 결정요인 분석 -...

15
통계연구(2015), 제20권 제2호, 31-45 한국 여성의 총 출산 결정요인 분석 1) 장은진 2) 송호신 3) 요약 본 연구에서는 한국 여성의 총 출산 결정요인을 실증적으로 분석하였다. 총 출산이 비음인 정수 라는 특징을 이용하여 포아송 모형을 분석의 시발점으로 삼았다. 또한 표본에서 관측되는 총 출 산의 선택이 0에서 4사이에서 이루어지는 특징을 감안하여, 총 출산 결정요인을 분석하는 보완 적인 방법으로서 순서형 프로빗 모형을 이용하였다. 마지막으로 내생적인 설명변수가 있는 경우, 일반화된 적률법(Generalized Method of Moments, GMM)을 이용하여 비선형인 조건부 평균식 을 추정하는 방안을 제안하였다. 모든 추정 결과에서 공통적으로 발견되는 특징은 여성의 소득, 종교 더미변수 그리고 혼인연령이 총 출산에 유의하게 영향을 미쳤다는 점이다. 주요용어 : 총 출산, 포아송, 순서형 프로빗, 일반화된 적률법 1. 서론 본 논문에서는 한국 여성의 총 출산(number of births) 결정 요인을 분석하고자 한다. 총 출산 결정 요인을 분석하기 위하여 실질적으로 아이를 더 이상 낳지 않으면 서 경제활동도 활발하게 하고 있는 만 40세부터 45세까지의 기혼 여성들을 본 연구의 관심 집단으로 삼는다. 따라서 이 집단에 속한 여성들의 자녀수를 일생동안의 총 출 산으로 가정한다. 4) 또한 총 출산 횟수가 비음인 정수라는 특징을 고려하여, 총 출산횟 수가 포아송(Poisson) 분포를 따른다고 가정하고, 포아송 모형을 분석의 시발점으로 삼는다. 본 연구와 유사하게 총 출산이 포아송 분포를 따른다는 가정 하에 총 출산 결정요 인을 분석한 기존 연구로는 Al-Qudsi(1998)와 김현숙(2007)이 있다. Al-Qudsi(1998)는 오만, 쿠웨이트, 요르단 그리고 팔레스타인의 중동 국가별 미시자료를 사용하였다. 포 아송 모형을 이용하여 출산의 결정요인을 분석한 뒤 아랍여성의 출산이 여성의 고용 율에 미치는 영향을 연구하였다. 연구결과에 따르면, 여성의 혼인 당시의 나이, 여성 의 학력, 유아사망률, 남아 선호 여부가 출산에 유의하게 영향을 주는 것으로 나타났 다. 김현숙(2007)은 2003년에 조사된 ‘전국출산력 및 가족보건복지실태조사’를 이용하 1) 본 논문은 장은진의 석사학위논문『우리나라의 출산결정요인 분석: 포아송추정을 중심으로』 를 수정·발전시킨 것이다. 2) 서울특별시 서대문구 이화여대길 52, 이화여자대학교 경제학과, 석사과정. E-mail: eunjin810@ gmail.com 3) 교신저자. 서울특별시 서대문구 이화여대길 52, 이화여자대학교 경제학과, 조교수. E-mail: [email protected] 4) 실질적으로 유산 등과 같은 이유로 출산수와 자녀수는 다를 수 있으나, 분석의 편의상 본고 에서는 양자를 동일한 것으로 가정한다.

Transcript of 한국 여성의 총 출산 결정요인 분석 -...

Page 1: 한국 여성의 총 출산 결정요인 분석 - kostat.go.krkostat.go.kr/file_total/20-2-01.pdf · 의 관점에서 내생성의 문제를 제기하고, gmm을 이용하여 내생성

통계연구(2015), 제20권 제2호, 31-45

한국 여성의 총 출산 결정요인 분석1)

장은진2) ․ 송호신3)

요약

본 연구에서는 한국 여성의 총 출산 결정요인을 실증적으로 분석하였다. 총 출산이 비음인 정수

라는 특징을 이용하여 포아송 모형을 분석의 시발점으로 삼았다. 또한 표본에서 관측되는 총 출

산의 선택이 0에서 4사이에서 이루어지는 특징을 감안하여, 총 출산 결정요인을 분석하는 보완

적인 방법으로서 순서형 프로빗 모형을 이용하였다. 마지막으로 내생적인 설명변수가 있는 경우,

일반화된 적률법(Generalized Method of Moments, GMM)을 이용하여 비선형인 조건부 평균식

을 추정하는 방안을 제안하였다. 모든 추정 결과에서 공통적으로 발견되는 특징은 여성의 소득,

종교 더미변수 그리고 혼인연령이 총 출산에 유의하게 영향을 미쳤다는 점이다.

주요용어 : 총 출산, 포아송, 순서형 프로빗, 일반화된 적률법

1. 서론

본 논문에서는 한국 여성의 총 출산(number of births) 결정 요인을 분석하고자

한다. 총 출산 결정 요인을 분석하기 위하여 실질적으로 아이를 더 이상 낳지 않으면

서 경제활동도 활발하게 하고 있는 만 40세부터 45세까지의 기혼 여성들을 본 연구의

관심 집단으로 삼는다. 따라서 이 집단에 속한 여성들의 자녀수를 일생동안의 총 출

산으로 가정한다.4) 또한 총 출산 횟수가 비음인 정수라는 특징을 고려하여, 총 출산횟

수가 포아송(Poisson) 분포를 따른다고 가정하고, 포아송 모형을 분석의 시발점으로

삼는다.

본 연구와 유사하게 총 출산이 포아송 분포를 따른다는 가정 하에 총 출산 결정요

인을 분석한 기존 연구로는 Al-Qudsi(1998)와 김현숙(2007)이 있다. Al-Qudsi(1998)는

오만, 쿠웨이트, 요르단 그리고 팔레스타인의 중동 국가별 미시자료를 사용하였다. 포

아송 모형을 이용하여 출산의 결정요인을 분석한 뒤 아랍여성의 출산이 여성의 고용

율에 미치는 영향을 연구하였다. 연구결과에 따르면, 여성의 혼인 당시의 나이, 여성

의 학력, 유아사망률, 남아 선호 여부가 출산에 유의하게 영향을 주는 것으로 나타났

다. 김현숙(2007)은 2003년에 조사된 ‘전국출산력 및 가족보건복지실태조사’를 이용하

1) 본 논문은 장은진의 석사학위논문『우리나라의 출산결정요인 분석: 포아송추정을 중심으로』를 수정·발전시킨 것이다.

2) 서울특별시 서대문구 이화여대길 52, 이화여자대학교 경제학과, 석사과정. E-mail: eunjin810@ gmail.com

3) 교신저자. 서울특별시 서대문구 이화여대길 52, 이화여자대학교 경제학과, 조교수. E-mail: [email protected]

4) 실질적으로 유산 등과 같은 이유로 출산수와 자녀수는 다를 수 있으나, 분석의 편의상 본고에서는 양자를 동일한 것으로 가정한다.

Page 2: 한국 여성의 총 출산 결정요인 분석 - kostat.go.krkostat.go.kr/file_total/20-2-01.pdf · 의 관점에서 내생성의 문제를 제기하고, gmm을 이용하여 내생성

32 장은진 ‧ 송호신

여 우리나라 가구의 자녀수 결정요인을 분석하였다. 포아송 모형을 추정한 결과 과소

산포(underdispersion) 현상을 확인하여 감마 카운트(gamma count) 모형을 이용하여

보완적인 분석을 하였다. 김현숙(2007)이 추정에 사용한 설명변수는 가구의 주택 소유

여부, 가구의 소득, 여성의 일자리 유무, 여성의 교육수준, 여성의 연령, 인공유산 횟

수, 여성의 결혼 당시 나이, 자녀양육 도움 여부, 아들선호 여부, 남편의 장남 여부, 여

성 및 남편의 형제·자매수 그리고 거주하는 도시 등이다. 추정 결과, 가구의 자녀수는

가구 소득과 유의한 양의 관계를, 그리고 결혼 당시의 나이와 여성의 교육기간과는

유의한 음의 관계를 보이는 것으로 나타났다. 김현숙(2007)과 본 연구는 포아송 모형

에 기초하였다는 점에서는 유사하나, 이용 자료, 분석 방법 그리고 추정결과에 있어서

는 상이하다. 먼저, 본 연구는 2012년 여성가족패널 자료를 이용한다. 그리고 포아송

모형에 대한 보완적인 분석으로 감마 카운트 모형을 이용하는 대신 순서형 프로빗

(ordered probit) 모형을 이용한다. 더 나아가 총 출산을 비선형 회귀모형의 관점에서

바라봄으로써 내생성 문제를 제기하고 GMM을 이용하여 해결하는 방안을 제안한다.

출산 결정에 관한 해외 연구로는 Winkelmann(1995)과 Rindfuss와 John(1983)을

주목할 필요가 있다. Winkelmann(1995)는 탈출률(hazard rate)과 과대산포(overdispersion)

또는 과소산포(underdispersion)와의 관계에 주목하여 감마 카운트(gamma count) 모

형을 제안하였다. 그는 독일의 사회 경제 패널(German Socio-Economic Panel) 자료

를 이용하여 출산 결정 문제를 분석하였다. 설명변수로는 여성의 교육, 고등교육여부

혹은 직업훈련여부, 국적, 종교, 출생년도, 그리고 결혼당시 나이를 사용하였다. 추정

결과, 특히 종교 및 국적과 같은 설명변수들이 유의한 영향을 주는 것으로 나타났다.

구체적으로 여성이 독일 국적을 가진 경우 상대적으로 출산수가 낮은 경향을 보인 반

면, 여성이 지방에 거주하거나 카톨릭 혹은 무슬림 신자인 경우에는 출산수가 높은

것으로 나타났다. Rindfuss와 John(1983)은 여성의 첫 출산 시점을 결정하는 사회적

결정요인을 분석하였다. 여성의 첫 출산 시기에 영향을 미치는 설명변수로 결혼당시

의 교육수준이 유의하게 양의 영향을 미치는 것으로 나타났다. 또한 인종과 종교 그

리고 청소년기의 흡연경험 여부를 설명변수로 사용하였다.

본 논문의 전개과정은 다음과 같다. 먼저, 실증분석을 다루는 2장의 1절에서는 분

석의 기초를 이루는 포아송 모형을 소개하고 그 추정결과를 제시한다. 2절에서는 과

소산포성의 문제를 우회하는 보완적인 추정방법으로서 순서형 프로빗 모형을 이용하

는 것을 제안하고 총 출산 결정 요인을 분석한다. 마지막으로, 3절에서는 비선형 모형

의 관점에서 내생성의 문제를 제기하고, GMM을 이용하여 내생성 문제를 해결하는

방안을 제시한다. 결론인 3장에서는 본 연구의 요약과 한계점 등에 관하여 언급한다.

4장은 부록이다.

Page 3: 한국 여성의 총 출산 결정요인 분석 - kostat.go.krkostat.go.kr/file_total/20-2-01.pdf · 의 관점에서 내생성의 문제를 제기하고, gmm을 이용하여 내생성

한국 여성의 총 출산 결정요인 분석 33

2. 실증 분석

2.1 포아송 모형

일생동안의 총 출산수를 나타내는 확률변수 Y가 포아송 분포를 따른다고 가정하

면, 의 특징을 가진 임의의 번째 여성의 총출산이 일 조건부 확률 P[Y= y i|x i]

는 다음과 같다.

P[Y= y i|x i]=exp(-λ i)λ

y ii

y i!.

(2.1)

여기에서 포아송 분포를 결정하는 모수 λi는 조건부 평균과 조건부 분산이다. 구

체적인 분석을 위하여 λi를 다음과 같이 가정한다.

λi= exp(x i'β). (2.2)

식(2.2)는 피설명변수가 음이 아닌 정수라는 사실을 고려한 것으로서, 포아송 분포

의 조건부 평균으로 많이 채택하는 가정이다. 식(2.1)과 식(2.2)에 기초하여 다음 식

(2.3)과 같은 포아송 최우추정량을 구할 수 있다.

argmaxlogL , (2.3)

여기에서 logL i n log이고, P(y i|x i,β)는 다음과 같다.

P(y i|x i,β)=exp(-exp(x i'β))exp(y ix i'β)

y i!.

추정에서 이용한 설명변수는 앞에서 언급한 기존 연구들과 여성가족 패널 데이터

에서의 이용 가능 여부를 고려하여 선택하였다. 출산이라는 결정이 여성의 경제 능력

및 배우자의 경제능력과 연관이 클 것으로 판단되어 여성의 소득과 교육년수(years

of education), 그리고 배우자의 소득을 고려하였다. 총 출산과 관련한 여성과 배우자

의 경제적 능력은 평생소득을 고려하는 것이 합리적일 것이다. 그러나 여성과 배우자

의 평생소득은 관측되지 않으므로 평생소득을 가늠하는 변수로서 월평균 소득을 이용

Page 4: 한국 여성의 총 출산 결정요인 분석 - kostat.go.krkostat.go.kr/file_total/20-2-01.pdf · 의 관점에서 내생성의 문제를 제기하고, gmm을 이용하여 내생성

34 장은진 ‧ 송호신

하였다.5) 여성의 건강상태를 반영하기 위하여 흡연경험을 반영하는 더미변수(dummy)

“흡연” 및 결혼 시점의 연령을 선택하였으며, 출산에 대한 문화적 그리고 정신적인 태

도를 고려하기 위하여 종교 변수를 포함하였다. “흡연”은 흡연경험이 있으면 1, 그렇

지 않으면 0이다. “종교”도 더미(dummy) 변수로서 종교를 가지고 있으면 1의 값을,

그렇지 않으면 0의 값을 가진다. 피설명 변수와 설명변수에 대한 기초 통계량은 4장

부록에 제시하였다.

본 연구에서는 포아송 모형을 이용하여 두 가지의 식을 추정하였다. 추정식 (1)에

서는 여성과 배우자 각각의 소득이 설명변수로 이용된 반면, 추정식 (2)에서는 부부합

산의 소득이 이용되었다.6) 두 식의 추정결과는 <표 2.1>에 제시되어 있다. 추정결과

를 보면, 소득을 제외한 여타 설명변수의 계수들에 대한 추정 결과는 대체로 비슷한

것을 알 수 있다. 구체적으로 언급하면, 혼인 시점의 연령이 낮을수록 총 출산이 많은

것으로 유의하게 나타났으며, 종교를 가진 여성이 그렇지 않은 여성에 비하여 출산을

더 많이 하는 것으로 유의하게 나타났다. 한편, 흡연과 교육년수의 계수는 음수로 추

정되었으나 유의성은 없는 것으로 나타났다. 소득의 경우 다소 흥미로운 결과를 보였

다. 여성 소득의 계수는 유의한 음수로 추정되어 여성의 소득이 높을수록 출산이 줄

어드는 것으로 나타났다. 배우자의 소득은 양수로 추정되었으나 유의성이 없는 것으

로 나타났다. 개별 소득 대신 부부합산 소득을 설명변수로 이용한 경우, 합산 소득은

양수로 추정되었으나 유의성은 없는 것으로 나타났다.

<표 2.1>에는 각 설명변수가 한 단위 증가할 때 총 출산이 평균적으로 증가하는

정도를 나타내는 평균 한계 효과(average marginal effect)가 추정결과와 함께 제시되

어 있다. 총 출산에 가장 큰 영향을 주는 요인은 혼인 연령으로 혼인시점의 연령이

한 살 적어지면 평균적으로 총 출산은 약 0.06명 증가하는 것으로 추정되었다. 또한

종교가 있는 여성이 그렇지 않은 여성에 비하여 총 출산이 약 0.1명 더 많은 것으로

나타났다. 추정 (1)에 따르면, 여성의 월평균 소득이 한 단위(100만원) 증가하면, 총

출산은 약 0.02명 줄어드는 것으로 추정되었다. 흡연경험이 있는 여성은 그렇지 않은

여성에 비하여 총 출산이 약 0.14명 적은 것으로 추정되었으나 통계적인 유의성은 없

는 것으로 나타났다.

5) 여성과 배우자의 월평균 소득이 그들의 평생 소득을 반영한다는 측면에서 잠재적으로 측정 오차의 문제가 있는 것으로 여겨진다.

6) 추정식 (1)과 추정식 (2)에서 공통으로 사용된 설명변수는 <표2.1>에 나와 있듯이 종교, 흡연, 혼인시점 연령, 교육년수, 그리고 상수이다.

Page 5: 한국 여성의 총 출산 결정요인 분석 - kostat.go.krkostat.go.kr/file_total/20-2-01.pdf · 의 관점에서 내생성의 문제를 제기하고, gmm을 이용하여 내생성

한국 여성의 총 출산 결정요인 분석 35

  추정 (1) Δy/Δx j 추정 (2) Δy/Δx j

소득 -0.0112* -0.023 -

(0.006)

배우자 소득 0.0046 0.009 -

(0.004)

종교 0.0449** 0.092 0.0456*** 0.093

(0.017) (0.017)

흡연 -0.0697 -0.142 -0.0703 -0.143

(0.086) (0.087)

혼인시점 연령 -0.0275*** -0.056 -0.0275*** -0.056

(0.003) (0.003)

교육년수 -0.003 -0.006 -0.0031 -0.006

(0.005) (0.005)

부부합산소득 - 0.0003 0.001

(0.004)

상수 1.4406*** 1.4444***

(0.091) (0.091)LR 검정 통계량 22.92*** 22.16***

관측치수 1241 1241

<표 2.1> 포아송 모형 추정결과

1) ( )안의 수치는 QML(quasi-maximum likelihood) 표준오차로 샌드위치 형태의 분산에 기초한다 2) * p<0.1, ** p<0.05, *** p<0.01

3) Δy/Δx j는 j번째 설명변수의 평균 한계 효과 추정값으로서 그 식은 다음과 같다.

1n ∑

n

i=1

ddx j, i

( exp (y ix i' β̂))=1n ∑

n

i=1exp(y ix i' β̂)y ix j, i.

4) LR 검정의 귀무가설은 상수를 제외한 설명변수의 계수들이 모두 0이라는 것이다.

2.2 순서형 프로빗(Ordered Probit) 모형

앞 절에서 제안한 포아송 모형의 추정 결과, 등산포성(equidispersion)이 성립한다

는 귀무가설이 기각됨을 발견하였다. 특히, 포아송 모형 분석에서 일반적으로 발견되

는 분산이 평균보다 큰 현상인 과대산포(overdispersion)가 아니라 그 반대인 과소산

포(underdispersion) 현상이 발견되었다.7) 일반적으로 과대산포의 문제가 발견되면,

Cameron과 Trivedi (1998)가 제안한 바와 같이 개인의 관측되지 않는 이질성

(unobserved heterogeneity)을 도입하여 해결한다. 특히 관측되지 않는 이질성이 감마

(gamma) 분포를 따르거나 로그 정규분포를 따른다는 가정을 함으로써, 포아송-감마

혼합모형 또는 포아송-로그정규분포 혼합 모형을 이용하는 방법이 과대산포 현상을

7) 등산포성의 검정 및 과소산포의 발견에 관한 상세 내용은 부록 2의 등산포성(equidispersion) 검정을 참조하라.

Page 6: 한국 여성의 총 출산 결정요인 분석 - kostat.go.krkostat.go.kr/file_total/20-2-01.pdf · 의 관점에서 내생성의 문제를 제기하고, gmm을 이용하여 내생성

36 장은진 ‧ 송호신

해결하는 것으로 잘 알려진 방법들이다. 그러나 이러한 방법들은 과소산포의 경우에

는 적용할 수 없다. 따라서 본 연구에서는 과소산포의 문제를 걱정할 필요가 없으면

서 총 출산 결정을 분석하는 보완적인 방법으로 순서형 프로빗(ordered probit) 모형

을 고려하고자 한다. 표본에서 알 수 있듯이 총 출산의 최대값이 4이므로 총 출산이

0인 선택부터 4인 선택까지 모두 5개의 선택이 있는 순서형 프로빗 모형을 고려할 수

있다. 모형을 기술하면 식 (2.4)와 같다. 먼저 i번째 여성이 총 출산 결정으로부터 얻

는 효용 y *i는 은닉변수(latent variable)로서 인텍스( x i'β)와 교란항(-u i)의 합으로

가정한다.

y *i=x i 'β-u i 여기에서 u i∼N(0,1). (2.4)

4개의 알려져 있지 않은 효용수준 경계점(threshold) ξ1, ξ

2, ξ

3, ξ

4이 있으며,

교란항과 설명변수는 상호 독립적인 것으로 가정한다. 식별을 위하여 설명변수벡터

()에 상수는 포함시키지 않는다. 따라서 에 포함된 설명변수는 모두 6개로 이는

<표 2.2>에 제시되어 있다. 총 출산에 대한 선택 j는 모두 5가지로 j=0,1,2,3,4이

다. 따라서 i번째 여성이 총 출산 j∈{0,1,2,3,4}를 선택하는 확률은 다음과 같다.

′ ,

≤ ≤ ′ ′ , j= 1,2,3 ,

≥ ′ , (2.5)

여기에서 ∙는 표준 정규 분포함수(standard normal distribution function)이다.

순서형 프로빗 추정량 은 다음 식 (2.6)과 같이 구할 수 있다.

argmax i

nj Iyi j P yi j xi (2.6)

여기에서 는 식 (2.5)에서 이미 정의하였으며 ′이다.

<표 2.2>에는 순서형 프로빗 모형의 모수에 대한 추정 결과와 평균 한계 효과

(average marginal effect)가 제시되어 있다. 순서형 프로빗 모형의 모수에 대한 추정

결과, 부호와 유의성 측면에서 포아송 모형과 유사한 추정결과를 얻었다. 여성의 소득

이 높을수록 효용은 줄어들어 적은 수의 총 출산을 선택하는 것으로 유의하게 추정되

었다. 또한 종교가 있는 여성이 상대적으로 더 높은 효용을 얻게 되어 더 많은 출산

을 할 가능성이 높은 것으로 추정되었다. 그리고 혼인 연령이 낮을수록 더 많은 출산

Page 7: 한국 여성의 총 출산 결정요인 분석 - kostat.go.krkostat.go.kr/file_total/20-2-01.pdf · 의 관점에서 내생성의 문제를 제기하고, gmm을 이용하여 내생성

한국 여성의 총 출산 결정요인 분석 37

을 할 가능성이 높은 것으로 유의하게 추정되었다. 배우자 소득의 계수는 양수로 추

정되었으나 유의성은 없는 것으로 나타났다. 한편, 평균 한계 효과를 보면 부호 측면

에서 총 출산이 0, 1 또는 2명인 경우와 총 출산이 3 또는 4인 경우가 대비됨을 알

수 있다. 여성의 월평균 소득이 한 단위(백만원) 증가함에 따라 총 출산이 3명이 될

확률과 4명이 될 확률은 각각 약 0.009 그리고 약 0.001만큼 줄어든다. 반면, 총 출산

이 0, 1 그리고 2명이 될 확률은 각각 약 0.002, 0.007 그리고 0.002 만큼 증가한다. 이

는 여성 소득의 증가가 3명 이상의 다자녀 선택에는 음의 효과를 미치지만 2명 이하

의 자녀 선택에는 양의 효과를 미치는 것을 시사한다. 이러한 비대칭적인 한계효과는

종교와 혼인 시점 연령에도 유사하게 작용하는 것으로 나타났으며, 유의하지 않은 여

타 설명변수들도 비슷한 현상을 보이는 것으로 나타났다.

  추정결과

소득 -0.0419* 0.0016 0.0072 0.0019 -0.0094 -0.0012

(0.023)

배우자소득 0.0172 -0.0007 -0.0030 -0.0008 0.0039 0.0005

(0.017)

종교 0.1758*** -0.0068 -0.0302 -0.0078 0.0396 0.0052

(0.065)

흡연 -0.2428 0.0094 0.0417 0.0108 -0.0547 -0.0072

(0.291)

혼인연령 -0.0981*** 0.0038 0.0169 0.0044 -0.0221 -0.0029

(0.011)

교육년수 -0.0153 0.0006 0.0026 0.0007 -0.0034 -0.0005

(0.017)

LR 검정 통계량 111.74***

관측치수 1241

<표 2.2> 순서형 프로빗 모형의 모수에 대한 추정 결과

1) ( )안의 수치는 QML 표준오차이다.

2) 는 평균한계효과로서

이며, x i, k는 x i에서 k번째 설명변수이다.

3) * p<0.1, ** p<0.05, *** p<0.01 4) 경계점의 추정결과는 부록 3에 제시하였다. 5) LR 검정의 귀무가설은 상수를 제외한 설명변수의 계수들이 모두 0이라는 것이다.

Page 8: 한국 여성의 총 출산 결정요인 분석 - kostat.go.krkostat.go.kr/file_total/20-2-01.pdf · 의 관점에서 내생성의 문제를 제기하고, gmm을 이용하여 내생성

38 장은진 ‧ 송호신

2.3 내생성 문제

조건부 평균에 대한 함수식 (2.2)는 다음과 같이 표현될 수 있다.

exp′ (2.7)

식 (2.7)은 비선형 회귀모형의 관점에서 총 출산의 조건부 평균(conditional

expectation)으로 해석할 수 있으며, 이는 다음을 의미한다.

, (2.8)

여기에서 exp′ 이다. 만약 에 내생적인 설명변수가 있다면 식(2.8)

는 성립하지 않기 때문에 통상적인 비선형최소자승추정(nonlinear least squares

estimation)을 적용하여 일치 추정량을 얻을 수 없다. 본 연구에서 이용한 설명변수

가운데, 여성의 소득과 배우자의 소득은 내생적인 설명변수로 판단되는데 이는 총 출

산수의 결정이 여성의 노동공급과 배우자의 노동공급에 영향을 미칠 수 있기 때문이

다.8) 이러한 내생성의 문제를 해결하기 위하여 본고에서는 일반화된 적률 방법

(Generalized Method of Moments, GMM)을 이용한 추정을 제안한다. 를

만족시키는 적절한 도구변수들 가 존재한다면 무조건부 적률 조건(unconditional

moment condition) 을 만족시킬 것이다. 따라서 이를 이용한 최적 GMM

을 고려할 수 있다. 내생성이 있는 설명변수인 여성의 소득에 대한 도구변수로는 해당

여성의 교육년수, 해당 여성의 최종학력의 중퇴 혹은 수료여부의 더미변수, 해당 여성

어머니의 교육년수 그리고 아버지의 교육년수를 고려하며, 배우자의 소득에 대한 도

구변수로는 배우자의 교육년수를 고려한다. 최적 GMM 추정량은 (2.9)에서와 같이 정

의한다.

argmin n i n hi

′n i

n hi hi′

n i n hi (2.9)

여기에서 exp′이며, 는 앞서 언급한 내생변수에 대한 도구변

수와 내생성이 없는 설명변수들로 구성된다.

내생성을 고려하지 않은 비선형 모형과 내생성을 고려한 GMM 모형을 각각 추정

한 결과는 <표 2.3>에 제시되어 있다. 비선형 모형과 최적 GMM 모형의 추정 결과는

부호 측면에서 대체로 유사하였다. 여성의 소득과 혼인 시점 연령은 총 출산에 대하

8) 출산결정과 관련된 여성의 경제능력을 반영하는 변수로서 소득이 측정오차(measurement error)를 가지고 있는 것으로 생각해도 된다.

Page 9: 한국 여성의 총 출산 결정요인 분석 - kostat.go.krkostat.go.kr/file_total/20-2-01.pdf · 의 관점에서 내생성의 문제를 제기하고, gmm을 이용하여 내생성

한국 여성의 총 출산 결정요인 분석 39

여 유의하게 음의 영향을 주는 것으로 나타났으며, 종교는 총 출산에 대하여 유의하

게 양의 효과를 미치는 것으로 추정되었다. 내생성을 고려한 최적 GMM 추정 결과,

비선형 모형에서 유의하게 영향을 주는 요인들의 효과가 GMM 추정결과 더욱 확대되

었다는 것을 발견할 수 있었다.

한편, 무조건 적률 조건 E[u iz i]=0을 귀무가설로 하는 초과식별제약 검정

(overidentifying restriction test)을 수행한 결과, 귀무가설은 유의수준 10%에서 기각

할 수 없는 것으로 나타나 도구변수들이 무조건 적률 조건을 만족시키는 것으로 나타

났다. 그러나 유의수준 5%에서는 적률조건이 만족한다는 귀무가설이 기각되는 것으로

나타났다.

  비선형 모형 GMM 모형

소득 -0.0115* -0.0132**

(0.006) (0.006)

배우자의 소득 0.0040 0.0016

(0.004) (0.004)

종교 0.0411** 0.0483***

(0.017) (0.018)

흡연 -0.0687 -0.0253

(0.086) (0.082)

혼인 시점 연령 -0.0264*** -0.0295***

(0.003) (0.003)

상수 1.3750*** 1.4583***

(0.081) (0.0885)

OIR 검정 통계량 - 13.72**

검정 통계량 79.70*** 83.12***

관측치수 1241 1127

<표 2.3> 비선형 모형 및 GMM 모형 추정결과

1) ( )안의 수치는 표준오차로서 비선형 모형의 경우는 이분산성을 고려한 표준오차이며, GMM은 이단계 GMM에 기초한 표준오차이다.

2) * p<0.1, ** p<0.05, *** p<0.01 3) 관측치 수가 달라진 이유는 관측치에 따라 도구변수의 이용가능 여부에 차이가 있기 때문이다.

4) OIR(overidentifying restriction) 검정 통계량은 χ 25를 유의수준 5% 및 10%에서의 경계값(critical value)

은 각각 11.1 및 15.1이다. 5) 검 정 의 귀 무 가 설 은 상 수 를 제 외 한 계 수 의 값 이 0인 것 으 로 귀 무 가 설 하 에 서 검 정 통 계

량 은 χ 25를 따 르 고 , 유 의 수 준 5% 에 서 의 경 계 값 (critical value)은 11.1이 다 .

Page 10: 한국 여성의 총 출산 결정요인 분석 - kostat.go.krkostat.go.kr/file_total/20-2-01.pdf · 의 관점에서 내생성의 문제를 제기하고, gmm을 이용하여 내생성

40 장은진 ‧ 송호신

3. 결론

본고에서는 한국 여성의 총 출산 결정요인을 분석하였다. 만 40세에서 45세 사이의

기혼 여성들의 현재의 자녀수를 총 출산수로 가정하여 여성의 경제·사회적인 요인이

총 출산에 미치는 영향을 분석하였다. 총 출산수가 비음정수(nonnegative integer)라는

점에서 포아송 모형을 이용하였다. 포아송 모형의 추정결과를 이용하여 검정한 결과,

포아송 모형이 함의하는 등산포성(equidispersion)이 기각되고, 과소산포(underdispersion)

현상이 발견되었다. 따라서 포아송 모형 추정에 대한 보완적인 추정으로서 순서형 프

로빗 모형을 고려하였다. 관측되는 총 출산수가 0에서 4까지의 정수에 국한되므로 각

출산수를 개인의 선택으로 보고 순서형 프로빗 모형을 적용하였다. 순서형 프로빗 모

형의 추정결과는 부호 측면에서 포아송 모형의 추정 결과와 같았다. 순서형 프로빗

모형의 추정 결과, 각 설명변수가 총 출산 선택에 미치는 효과가 3인 이상의 다자녀

선택이냐 2인 이하의 자녀 선택이냐에 따라 비대칭적으로 나타나는 것을 확인할 수

있었다. 마지막으로 내생적인 설명변수가 있는 경우 최적 GMM을 이용하여 분석하는

방법을 제안하였다. GMM 추정결과 유의성 있는 설명변수들이 총 출산에 미치는 효

과가 비선형회귀분석의 추정결과에 비하여 확대되는 것을 발견하였다. 포아송 모형,

순서형 프로빗 모형, 비선형 모형 그리고 GMM 모형의 추정 결과로부터 일관성 있게

나타난 흥미로운 발견은 여성의 소득, 종교 더미 변수 그리고 혼인연령이 총 출산에

유의한 영향을 미친다는 것이다. 여성의 경제적인 능력이 클수록 총 출산이 줄어드는

것으로 나타났으며, 종교를 가진 여성이 그리고 이른 나이에 혼인을 한 여성의 총 출

산이 상대적으로 더 많은 것으로 나타났다. 이러한 발견들을 감안하면 단순히 여성의

경제활동을 증대시켜 소득을 높이려는 정책 또는 가계 소득 증대에 초점을 두는 정책

은 출산에 부정적인 영향을 줄 수도 있음을 정책당국은 인지할 필요가 있을 것으로

보인다. 더구나 혼인을 늦게 하는 사회·경제적인 추세를 감안한다면, 정부의 정책을

통하여 출산 증대에 의미 있는 효과를 주는 것은 매우 어려운 과제로 여겨진다.

본 연구를 통하여 느낀 한계점 및 추후 필요한 연구에 대하여 몇 가지 언급하자면

다음과 같다. 첫째, 포아송 모형의 추정 결과가 과소산포를 보이는 경우 관측되지 않

는 개인의 이질성을 포함한 혼합 모형(mixture model)을 통하여 해결하는 방안에 대

한 새로운 방법론이 필요할 것으로 보인다. 종래의 혼합 모형이 과대산포만 해결할

수 있기 때문에 과소산포의 경우에 혼합 모형을 이용하여 해결할 수 있는 방법이 없

는 상태이다. 모수적인 분포를 가정하지 않는 Bierens(2008)의 아이디어를 이용하여

이질성의 분포에 최소한의 제약만 주는 혼합 모형을 고안한다면 흥미로운 연구가 될

것으로 생각한다. 둘째, 본고에서의 실증분석은 암묵적으로 연구자가 선택한 모형이

참이라는 가정에 기초하고 있다. 그러나 실제로 연구자가 선택할 모형이 아닐 가능성

이 존재한다. 이러한 측면에서 모형 설정의 검정 또는 적합도(goodness-of-fit)의 아

이디어에 기초한 추정을 고려하는 것도 흥미로운 연구 주제가 될 것으로 생각한다.9)

이러한 아이디어에 기초한 추정방법은 일반적으로 비모수적인 방법론을 요구한다는

9) 이는 익명의 심사자가 지적한 것으로 대부분의 실증분석에서 간과하고 있는 중요한 사항이다.

Page 11: 한국 여성의 총 출산 결정요인 분석 - kostat.go.krkostat.go.kr/file_total/20-2-01.pdf · 의 관점에서 내생성의 문제를 제기하고, gmm을 이용하여 내생성

한국 여성의 총 출산 결정요인 분석 41

측면에서 본고의 연구 범위를 넘는 것으로 생각한다.10) 마지막으로, Lewbel (1997,

1998)을 이용하여 포아송 모형과 순서형 프로빗 모형에서 내생성 문제를 해결하는 것

도 추후 고려할 만한 연구라 생각한다.

(2015년 7월 8일 접수, 2015년 8월 11일 수정, 2015년 9월 6일 채택)

10) 그러한 접근법에 기초한 연구로는 Bierens·Song(2012), Bierens·Song(2014), Song(2014a) 그리고 Song(2014b)를 참조하라.

Page 12: 한국 여성의 총 출산 결정요인 분석 - kostat.go.krkostat.go.kr/file_total/20-2-01.pdf · 의 관점에서 내생성의 문제를 제기하고, gmm을 이용하여 내생성

42 장은진 ‧ 송호신

부록

1. 이용 변수에 관한 기초 통계량

  관측치수 평균 표준편차 최소값 최대값

총 출산 1241 2.039 0.644 0 4

여성의 소득 (월평균, 백만원) 1241 0.853 1.273 0 15

배우자의 소득(월평균, 백만원) 1241 3.019 1.996 0 20

종교 1241 0.555 0.497 0 1

흡연 1241 0.018 0.132 0 1

혼인 시점 연령 1241 26.190 0.337 15 40

교육년수 (년) 1241 13.435 2.160 0 22

배우자의 교육기간 (년) 1127 14.160 2.340 0 22

여성의 최종학력 이수여부 1127 0.021 0.144 0 1

여성의 어머니 교육기간 (년) 1127 7.070 3.464 0 18

여성의 아버지 교육기간 (년) 1127 8.798 3.860 0 18

<부록 표 1> 기초통계량

1) 종교, 흡연과 여성의 최종학력 이수여부는 더미 변수로서 평균은 빈도를 반영한다.

2. 등산포성(equidispersion) 검정

2장 1절에서 보인 포아송 모형 추정결과에 기초한 등산포성(equidispersion) 검정

은 Cameron과 Trivedi(1998)이 언급한 방법으로 수행할 수 있다. 아래의 식(1)은 조건부

분산을 정의한 것이고 일반적으로 두 가지 형태가 많이 이용된다. 를 이용하

는 것을 흔히 NB1(negative binomial 1)이라 부르고, 를 이용하는 것을 흔

히 NB2(negative binomial 2)라고 부른다. 어느 경우이든 등산포성(equidispersion)은

인 것을 의미한다.11)

여기에서 (1)

식(1)을 포아송 모형 추정결과를 이용하여 γ의 추정치와 그 유의성을 살펴보고자

하는데 그 아이디어는 다음의 식(2)이다.

(2)

포아송 모형 추정결과를 이용하여, 식(2)를 이용하여 에 대한 OLS(ordinary least

squares) 추정량을 얻고 귀무가설 를 검정하면 된다. OLS를 위한 구체적인

11) 등산포성(equidispersion)은 포아송분포에서 나타나는 특징으로 E(y|x)=Var(y|x)을 일컫는다.

Page 13: 한국 여성의 총 출산 결정요인 분석 - kostat.go.krkostat.go.kr/file_total/20-2-01.pdf · 의 관점에서 내생성의 문제를 제기하고, gmm을 이용하여 내생성

한국 여성의 총 출산 결정요인 분석 43

식은 각각 다음의 식(3) 및 식(4)와 같다.

(3)

(4)

<부록 표 2> 등산포성 검정

  관측치수 평균

1241-0.8097

(-58.826)

1241-0.3957

(-62.120)

주: ( )안의 수치는 t 값으로 이분산성이 고려된 표준오차를 이용하여 구하였다.

위의 추정 결과는 조건부 평균이 조건부 분산보다 큰 과소산포(underdispersion)

현상을 시사한다.

3. 순서형 프로빗 모형: 경계점 추정결과

ξ1̂

-4.928

(0.359)

ξ2̂

-3.798

(0.344)

ξ3̂

-1.722

(0.330)

ξ4̂

-0.285

(0.331)

<부록 표 3> 경계점 추정

1) ( )안의 수치는 QML 표준오차

Page 14: 한국 여성의 총 출산 결정요인 분석 - kostat.go.krkostat.go.kr/file_total/20-2-01.pdf · 의 관점에서 내생성의 문제를 제기하고, gmm을 이용하여 내생성

44 장은진 ‧ 송호신

참고문헌

김현숙 (2007). 우리나라 가구의 자녀수 결정요인에 관한 Count 모형 분석 및 경제적

함의, <한국인구학>, 30(3), 107-135.

Al-Qudsi, S. (1998). Labour participation of Arab women: estimates of the fertility to

labour supply link, Applied Economics, 30, 931-941.

Bierens, H.J. (2008). Semi-Nonparametric Interval-Censored Mixed Proportional Hazard

Models: Identification and Consistency Results, Econometric Theory, 24,

749-794.

Bierens, H.J. and Song, H. (2012). Semi-Nonparametric Estimation of Independently

and Identically Repeated First-Price Auctions via an Integrated Simulated

Moments Method, Journal of Econometrics, 168, 108-119.

Bierens, H.J. and Song, H. (2014). Semi-Nonparametric Modeling and Estimation of

First-Price Auctions with Auction-Specific Heterogeneity, mimeo

Cameron, A. and Trivedi, P. (1998). Regression Analysis of Count data, Cambridge:

University Press.

Lewbel, A. (1997). Constructing Instruments for Regressions With Measurement Error

When no Additional Data are Available, with An Application to Patents and

R&D, Econometrica, 65 (5), 1201-1213.

Lewbel, A. (1998). Semiparametric Latent Variable Model Estimation with Endogenous

or Mismeasured Regressors, Econometrica, 66 (1), 105-121.

Rindfuss, R. and John, C.St. (1983). Social Determinants of Age at First Birth,

Journal of Marriage and Family, 45, 553-565.

Song, H. (2014a). Revisiting Aschauer via ICM estimation, Applied Economics Letters, 21, 16, 1111-1115.

Song, H. (2014b). A univariate density sieve estimation based on simulated Kolmogorov-

Smirnov test, mimeo.

Winkelmann, R. (1995). Duration Dependence and Dispersion in Count-Data models,

Journal of Business & Economic Statistics, 13, 467-474.

Page 15: 한국 여성의 총 출산 결정요인 분석 - kostat.go.krkostat.go.kr/file_total/20-2-01.pdf · 의 관점에서 내생성의 문제를 제기하고, gmm을 이용하여 내생성

한국 여성의 총 출산 결정요인 분석 45

A Study on the Determination of Females' Births in

Korea

Eunjin Jang1) ․ Hosin Song2)

Abstract

In this article, we empirically examine how the total number of births is determined in Korea.

Our empirical study is based on the Poisson ML method since the total number of births is

non-negative integer. The estimation results of the Poisson ML imply the underdispersion. To

detour the underdispersion problem, we conduct the ordered probit estimation as a

supplementary analysis since the total number of births is distributed as one of integers

ranging from 0 to 4. In the ordered probit model, each integer can be interpreted to be the

alternative of the total number of births chosen by each married woman. Finally, we suspect

the endogeneity problem among the regressors. In particular, the woman's income and

husband's income are very likely to be endogenous because of the simultaneity bias. To solve

the endogeneity problem, we propose to use the optimal GMM approach in terms of

conditional mean of nonlinear regression model. One robust finding throughout all proposed

estimations is that the woman's income, the religion and the age at marriage have significant

effects on the total number of births in Korea.

Key Words : number of births, Poisson, ordered probit, generalized method

of moments (GMM)

1) Graduate Student, Dept. of Economics, Ewha Womans University, 660 Ewha-Posco Bldg., Ewha Womans University, Seoul, Korea. E-mail: [email protected]

2) (Corresponding author) Assistant Professor, Dept. of Economics, Ewha Womans University, 312 Ewha-Posco Bldg., Ewha Womans University, Seoul, Korea. E-mail: hsong@ewha. ac.kr