·무선 RDD 혼합조사설계kostat.go.kr/file_total/poster_session_1.pdf · 2012. 11. 5. · -...

2
·무선 RDD결합한 혼합조사설계: 2011 서울시장 보궐선거 예측조사 사례 연구 이계오·장덕현·홍영택 (한국갤럽조사연구소) 한국갤럽조사연구소 http://www.gallup.co.kr 2012 국가통계 심포지엄 통계개발원 유무선 RDD결합한 혼합조사설계 서론 • 전화조사의 문제점으로 거론되는 핵심 주제는 크게 3가지로 모집단 포함률과 가구 응답자 랜덤 추출문제, 투표자 추출문제이다. 1) 모집단 포함률 : 일반 집전화 가입률 감소, 확인 가능한 등재 번호 축소, 집전화에서 휴대전화로 통신생활의 중심 이동 2) 가구 응답자 랜덤 추출 문제 : 높은 부재율, 거절율(랜덤 추출의 의미 퇴색) 3) 투표자 추출의 문제 : 선거결과는 어느 후보의 지지자가 적극적으로 투표하는가에 따라서 결정된다. 따라서 수집한 데이터로 부터 이를 예측하여 반영해야 [그림 1] 시간대별 재택율(단위:%) * 2009통계청의 생활시간조사 마이크로데이터 분석(전국기준) • 전화조사 문제 해소를 위해 무선 전화조사의 필요성이 매우 크지만 관련 연구가 부족한 실정임 따라서 연구에서는 2011서울시장 보궐선거 자료를 이용하여 ·무선 RDD 조사의 결합을 시도하고, 효과적인 결합 방식을 탐색하고자 했음 연구 배경 목적 연구 내용 ·무선 RDD 결합방법 유·무선 RDD결합한 혼합조사설계 조사방법과 프레임의 결합설계 • 이계오,장덕현(2009), 인터넷 선거조사에서 성향가중모형 적용사례 <조사연구> • 이계오,장덕현(2011). 사전 태도 투표 의향과 실제 투표 행동간 상관성 연구 <조사연구> Fuller,W.A. and Burmeister, L.F.(1972) Estimators for samples selected from two over lapping frame, In Proceedings of the Social Section, American Statistical Association • Hartley, H.O.(1962). Multiple frame surveys, In Proceedings of the Social Section, American Statistical Association Lavraks, P.J. & Traugott,M.W.(2000). Ellestion polls, the News Media, and Democracy, Chatham House Publishers, New York 참고자료 조사 설계 유·무선 RDD결합한 혼합조사설계 ·무선 RDD 결합 혼합설계 • 본 연구는 20111026선거일을 앞두고 3차례 유무선 결합 RDD 전화조사를 진행한 결과 이며, 구체적 설계 내용은 다음과 같다. [1] 유·무선 결합 RDD 설계 - 유선전화 : 가구번호(9,452,413), 지역번호+국번(4,344) 국번 서울 (1,128 국번) - 무선전화 : 유효국번(12,358), 생성가능한 123,580,000번호 유효번호 55,600,000 유선 전화조사 무선 전화조사 조사대상 서울지역 거주 19이상 유권자 표집추출 유선전화 RDD 무선전화 RDD 표본크기 1,2,3각각 965, 702, 600447, 483, 403재통화 최초 통화 포함 31응답자 선정 우선 순위 적용 없음 할당 구별, ·연령대별 유권자수 기준 할당 할당 적용 없음 유·무선 RDD결합한 혼합조사설계 ·무선 RDD 결합 추정 결과와 오차 • 유·무선 전화조사간 차이 검정 - 유·무선 전화조사 각각 지역, 성·연령대별로 가중 방식으로 가중처리 - 전체 지지도에서 조사방법간의 차이는 유의하지 않음 - 성·연령대별에서 여자 19~29세의 경우만 유의한 차이 발생 [2] ·무선 RDD 전화조사 결과 비교 설계가중(단위:%) • 결합 방법별 정확성 비교 - ·무선 추정 결과 차이가 매우 작았기 때문에 결합 옵션에 따른 효과는 미미 - 상대표준오차 기준에선 미세한 차이 발생하지만 유선 보다는 무선 전화조사, 결합 옵션 중에는 재택율 기준 결합 추정치가 실제 결과와 가장 유사 [3] ·무선 결합 결과 비교(단위:%) • 결과요약 - 프레임을 동시에 고려함으로써 모집단 대표성 향상 - 성·연령대별 후보 지지도 차이 미미 → 표본 결합 효과 미미 - 결합 결과 분산은 줄어드나 상대표준오차는 변화 없음 - 재택율 기준 결합 옵션의 상대표준오차가 가장 작음, 그러나 옵션간 오차의 차이는 미미 • 제한점 - 무선전화는 응답자 특성 정보(지역,,연령 )사전에 파악할 없기 때문에 모집단 특성이 제한적이며, 구분 불가 → 선거구 단위 조사 불가능 연구 내용 구분 유선 무선 df P-value A후보 B후보 모름/무응답 A후보 B후보 모름/무응답 전체 42.3 42.7 14.2 41.3 42.3 16.1 2.047 3 0.563 남자 19-2924.6 50.8 21.3 35 45 20 2.412 3 0.491 3031.3 56.7 11.9 23.9 60.9 15.2 0.833 2 0.659 4025.8 61.3 12.9 27.9 60.5 11.6 0.078 2 0.962 5058.2 27.3 12.7 61.1 33.3 5.6 2.087 3 0.555 60대이상 63.3 26.5 10.2 63.6 18.2 15.2 2.474 3 0.48 여자 19-2937.7 55.7 3.3 24.4 53.7 22 10.634 3 0.014 3024.6 66.2 9.2 37.2 53.5 9.3 2.065 2 0.356 4045.2 38.7 16.1 40.5 45.2 14.3 0.44 2 0.802 5063.8 22.4 13.8 50 37.5 12.5 2.382 2 0.304 60대이상 59.0 14.8 26.2 59.6 10.6 29.8 0.469 2 0.791 권역 북서 48.1 39.4 12.5 38.6 38.6 21.4 4.42 3 0.219 북동 39.6 43.8 15.1 39.1 41.4 19.5 2.996 3 0.392 남서 38.3 48.3 13.3 36.4 50.4 13.2 0.139 2 0.933 남동 48.0 36.0 14.4 54.1 35.3 10.6 2.314 3 0.51 구분 지지도(%) 분산 상대표준오차(%) 로그 오즈비 A후보 B후보 A후보 B후보 A후보 B후보 선거결과 46.8 47.4 - - - - - 유선 49.4 49.8 0.042 0.042 1.59 1.8 0.136 무선 49.4 50.4 0.062 0.062 1.57 1.5 0.12 결합 추정 단순합 49.4 50 0.025 0.025 1.58 1.68 0.13 분산역수 49.4 50.1 0.025 0.025 1.57 1.65 0.128 무선 only 49.5 49.9 0.025 0.025 1.61 1.75 0.134 재택율 49.3 50.4 0.025 0.025 1.52 1.54 0.12 27.2 29.9 36.0 46.8 55.9 62.2 0 20 40 60 80 PM 3~4 PM 4~5 PM 5~6 PM 6~7 PM 7~8 PM 8~9 결합방법 설명 1) 단순합 방식 가중합 방식 (가중합 수식) 2) 분산역수 3) 무선 only 가구원 비율 서울지역 무선 only가구 가구원 비율(25.7%) 적용 4) 재택율 기준 저녁 7시대 평균 재택율(52.7%) 적용

Transcript of ·무선 RDD 혼합조사설계kostat.go.kr/file_total/poster_session_1.pdf · 2012. 11. 5. · -...

Page 1: ·무선 RDD 혼합조사설계kostat.go.kr/file_total/poster_session_1.pdf · 2012. 11. 5. · - Chatham House Publishers, New York 참고자료 조사 설계 유·무선 RDD를

유·무선 RDD를 결합한 혼합조사설계: 2011 서울시장 보궐선거 예측조사 사례 연구 이계오·장덕현·홍영택 (한국갤럽조사연구소)

한국갤럽조사연구소 http://www.gallup.co.kr

2012 국가통계 심포지엄 통계개발원

유무선 RDD를 결합한 혼합조사설계

서론

• 전화조사의 문제점으로 거론되는 핵심 주제는 크게 3가지로 모집단 포함률과 가구 및 응답자

랜덤 추출문제, 투표자 추출문제이다.

1) 모집단 포함률 : 일반 집전화 가입률 감소, 확인 가능한 등재 번호 축소, 집전화에서

휴대전화로 통신생활의 중심 이동

2) 가구 및 응답자 랜덤 추출 문제 : 높은 부재율, 거절율(랜덤 추출의 의미 퇴색)

3) 투표자 추출의 문제 : 선거결과는 어느 후보의 지지자가 더 적극적으로 투표하는가에

따라서 결정된다. 따라서 수집한 데이터로 부터 이를 예측하여 반영해야 함

[그림 1] 시간대별 재택율(단위:%)

* 2009년 통계청의 생활시간조사 마이크로데이터 분석(전국기준)

• 전화조사 문제 해소를 위해 무선 전화조사의 필요성이 매우 크지만 관련 연구가 부족한

실정임 따라서 본 연구에서는 2011년 서울시장 보궐선거 자료를 이용하여 유·무선 RDD

조사의 결합을 시도하고, 효과적인 결합 방식을 탐색하고자 했음

연구 배경 및 목적

연구 내용

유·무선 RDD 결합방법

유·무선 RDD를 결합한 혼합조사설계

조사방법과 프레임의 결합설계

• 이계오,장덕현(2009), 인터넷 선거조사에서 성향가중모형 적용사례 <조사연구>

• 이계오,장덕현(2011). 사전 태도 및 투표 의향과 실제 투표 행동간 상관성 연구 <조사연구>

• Fuller,W.A. and Burmeister, L.F.(1972) Estimators for samples selected from two over

lapping frame, In Proceedings of the Social Section, American Statistical Association

• Hartley, H.O.(1962). Multiple frame surveys, In Proceedings of the Social Section,

American Statistical Association

• Lavraks, P.J. & Traugott,M.W.(2000). Ellestion polls, the News Media, and Democracy,

Chatham House Publishers, New York

참고자료

조사 설계

유·무선 RDD를 결합한 혼합조사설계

유·무선 RDD 결합 혼합설계

• 본 연구는 2011년 10월 26일 선거일을 앞두고 3차례 유무선 결합 RDD 전화조사를 진행한 결과

이며, 구체적 설계 내용은 다음과 같다.

[표 1] 유·무선 결합 RDD 설계

- 유선전화 : 가구번호(9,452,413개), 지역번호+국번(4,344개) 국번 중 서울 (1,128 국번)

- 무선전화 : 유효국번(12,358개), 생성가능한 123,580,000개 번호 중 유효번호 약 55,600,000

구 분 유선 전화조사 무선 전화조사

조사대상 서울지역 거주 만 19세 이상 유권자

표집추출 유선전화 RDD 무선전화 RDD

표본크기 1,2,3차 각각 965, 702, 600명 447, 483, 403명

재통화 최초 통화 포함 총 3회 1회

응답자 선정 우선 순위 적용 없음

할당 구별, 성·연령대별 유권자수 기준 할당 할당 적용 없음

유·무선 RDD를 결합한 혼합조사설계

유·무선 RDD 결합 추정 결과와 오차

• 유·무선 전화조사간 차이 검정

- 유·무선 전화조사 각각 지역, 성·연령대별로 셀 가중 방식으로 가중처리

- 전체 지지도에서 두 조사방법간의 차이는 유의하지 않음

- 성·연령대별에서 여자 19~29세의 경우만 유의한 차이 발생

[표 2] 유·무선 RDD 전화조사 결과 비교 – 설계가중(단위:%)

• 결합 방법별 정확성 비교

- 유·무선 추정 결과 차이가 매우 작았기 때문에 결합 옵션에 따른 효과는 미미

- 상대표준오차 기준에선 미세한 차이 발생하지만 유선 보다는 무선 전화조사,

결합 옵션 중에는 재택율 기준 결합 추정치가 실제 결과와 가장 유사

[표 3] 유·무선 결합 결과 비교(단위:%)

• 결과요약

- 두 프레임을 동시에 고려함으로써 모집단 대표성 향상

- 성·연령대별 후보 지지도 차이 미미 → 표본 간 결합 효과 미미

- 결합 결과 분산은 줄어드나 상대표준오차는 변화 없음

- 재택율 기준 결합 옵션의 상대표준오차가 가장 작음, 그러나 옵션간 오차의 차이는 미미

• 제한점

- 무선전화는 응답자 특성 정보(지역,성,연령 등)을 사전에 파악할 수 없기 때문에 모집단

특성이 제한적이며, 층 구분 불가 → 선거구 단위 조사 불가능

연구 내용

구분 유선 무선

df P-value A후보 B후보 모름/무응답 A후보 B후보 모름/무응답

전체 42.3 42.7 14.2 41.3 42.3 16.1 2.047 3 0.563

남자

19-29세 24.6 50.8 21.3 35 45 20 2.412 3 0.491

30대 31.3 56.7 11.9 23.9 60.9 15.2 0.833 2 0.659

40대 25.8 61.3 12.9 27.9 60.5 11.6 0.078 2 0.962

50대 58.2 27.3 12.7 61.1 33.3 5.6 2.087 3 0.555

60대이상 63.3 26.5 10.2 63.6 18.2 15.2 2.474 3 0.48

여자

19-29세 37.7 55.7 3.3 24.4 53.7 22 10.634 3 0.014

30대 24.6 66.2 9.2 37.2 53.5 9.3 2.065 2 0.356

40대 45.2 38.7 16.1 40.5 45.2 14.3 0.44 2 0.802

50대 63.8 22.4 13.8 50 37.5 12.5 2.382 2 0.304

60대이상 59.0 14.8 26.2 59.6 10.6 29.8 0.469 2 0.791

권역

북서 48.1 39.4 12.5 38.6 38.6 21.4 4.42 3 0.219

북동 39.6 43.8 15.1 39.1 41.4 19.5 2.996 3 0.392

남서 38.3 48.3 13.3 36.4 50.4 13.2 0.139 2 0.933

남동 48.0 36.0 14.4 54.1 35.3 10.6 2.314 3 0.51

구분 지지도(%) 분산 상대표준오차(%)

로그 오즈비 A후보 B후보 A후보 B후보 A후보 B후보

선거결과 46.8 47.4 - - - - -

유선 49.4 49.8 0.042 0.042 1.59 1.8 0.136

무선 49.4 50.4 0.062 0.062 1.57 1.5 0.12

결합 추정

단순합 49.4 50 0.025 0.025 1.58 1.68 0.13

분산역수 49.4 50.1 0.025 0.025 1.57 1.65 0.128

무선 only 49.5 49.9 0.025 0.025 1.61 1.75 0.134

재택율 49.3 50.4 0.025 0.025 1.52 1.54 0.12

27.2 29.9 36.0

46.8 55.9

62.2

0

20

40

60

80

PM 3~4 PM 4~5 PM 5~6 PM 6~7 PM 7~8 PM 8~9

결합방법 설명

1) 단순합 방식

가중합 방식

(가중합 수식)

2) 분산역수

3) 무선 only 가구원 비율 서울지역 무선 only가구 가구원 비율(25.7%) 적용

4) 재택율 기준 저녁 7시대 평균 재택율(52.7%) 적용

Page 2: ·무선 RDD 혼합조사설계kostat.go.kr/file_total/poster_session_1.pdf · 2012. 11. 5. · - Chatham House Publishers, New York 참고자료 조사 설계 유·무선 RDD를