Survey Data Analysis | Spring 2013 8장. 교차분석wolfpack.hnu.ac.kr/Spring_2013/SDA13/SDA_Ch8...

8
(38) Survey Data Analysis | Spring 2013 8장. 교차분석 개념 page 154 교차표 두 범주형 변수 빈도표 교차 행은 설명변인, 열은 결과변인 표 검정방법 동질성 homogeneity 검정 : 각 행의 분포 동일 독립성 independency 검정 : 두 변수의 독립 P(X=1,Y=1)=P(X=1)*P(Y=1) 독립성 검정 귀무가설 두 범주형 변수는 독립이다 연관 없음 대립가설 두 범주형 변수는 연관 관계가 있다. 검정통계량 Oij=셀 (i,j) 관측빈도=n_ij Eij=귀무가설 하에 (i,j) 기대빈도 =n*(n_i./n)*(n_.j/n)

Transcript of Survey Data Analysis | Spring 2013 8장. 교차분석wolfpack.hnu.ac.kr/Spring_2013/SDA13/SDA_Ch8...

Page 1: Survey Data Analysis | Spring 2013 8장. 교차분석wolfpack.hnu.ac.kr/Spring_2013/SDA13/SDA_Ch8 교차분석...(42) Survey Data Analysis | Spring 2013 8장. 교차분석SPSS활용(표준화잔차활용)

(38)

Survey Data Analysis | Spring 2013

8장. 교차분석 개념 page 154

교차표두 범주형 변수 빈도표 교차행은 설명변인, 열은 결과변인 표검정방법•동질성 homogeneity 검정 : 각 행의 분포동일

•독립성 independency 검정 : 두 변수의독립 P(X=1,Y=1)=P(X=1)*P(Y=1)

독립성 검정귀무가설•두 범주형 변수는 독립이다연관 없음

대립가설•두 범주형 변수는 연관 관계가 있다.

검정통계량

Oij=셀 (i,j) 관측빈도=n_ijEij=귀무가설 하에 셀 (i,j) 기대빈도

=n*(n_i./n)*(n_.j/n)

Page 2: Survey Data Analysis | Spring 2013 8장. 교차분석wolfpack.hnu.ac.kr/Spring_2013/SDA13/SDA_Ch8 교차분석...(42) Survey Data Analysis | Spring 2013 8장. 교차분석SPSS활용(표준화잔차활용)

(39)

Survey Data Analysis | Spring 2013

8장. 교차분석 활용 page 179

객관식 문항 연관분석행 범주•사회경제인구학적 페이스문항•본 문항 객관식 설명문항

열 범주•본 문항 객관식 결과문항

카이제곱 검정 문제기대빈도 5미만•총 셀의 개수 대비 5미만인 셀이 20%를넘지 않으면 검정통계량 ~ 카이제곱(Cochran)

문제 해결•범주를 결합하여 셀의 개수를 줄여기대빈도를 높인다.

순서형 변수의 상관정도 분석(측정형은 Pearson 상관계수)• M-H 카이제곱• 크래머 V-통계량• 파이계수, 분할계수

설문조사에서는 리커트 척도문항이순서형 변수와 동일하나,리커트 척도 문항은 측정형으로 간주하여활용하므로 문항평균차이 검정 가능

Page 3: Survey Data Analysis | Spring 2013 8장. 교차분석wolfpack.hnu.ac.kr/Spring_2013/SDA13/SDA_Ch8 교차분석...(42) Survey Data Analysis | Spring 2013 8장. 교차분석SPSS활용(표준화잔차활용)

(40)

Survey Data Analysis | Spring 2013

8장. 교차분석 SPSS활용 page 180

(예제)•출신지역에 따른 1순위 선택 전공 차이

셀의 40%가 기대빈도 5미만, 문제해결방법•유사한 범주합치기•(경영, 경제, 통계) 합치기보다는 지역을합치는 것이 적절

•(대전, 충남, 그 외 지역)으로

Page 4: Survey Data Analysis | Spring 2013 8장. 교차분석wolfpack.hnu.ac.kr/Spring_2013/SDA13/SDA_Ch8 교차분석...(42) Survey Data Analysis | Spring 2013 8장. 교차분석SPSS활용(표준화잔차활용)

(41)

Survey Data Analysis | Spring 2013

8장. 교차분석 SPSS활용(기대빈도 문제해결) page 180

지역 3그룹•기대빈도 문제 해결

•유의확률이 0.159이므로 유의수준15%에서는 차이가 있음

•(행 % 활용하여) 다른 지역과 달리 대전출신의 경영, 통계, 경제 순이다.

•열 %는 행 범주의 빈도가 동일할 때가능하다. 아닌 경우 표준화 잔차 이용

카이제곱=6.593, p=0.159

출신지역 경영 경제 통계기타 17 15 8

42.5% 37.5% 20.0%

대전 45 17 23

52.9% 20.0% 27.1%

충남 13 9 3

52.0% 36.0% 12.0%

Page 5: Survey Data Analysis | Spring 2013 8장. 교차분석wolfpack.hnu.ac.kr/Spring_2013/SDA13/SDA_Ch8 교차분석...(42) Survey Data Analysis | Spring 2013 8장. 교차분석SPSS활용(표준화잔차활용)

(42)

Survey Data Analysis | Spring 2013

8장. 교차분석 SPSS활용(표준화잔차 활용) page 180

표준화 잔차 활용 해석기타 지역은 경제 선택, 대전은 통계, 충남은 경제 선택 빈도 상대적으로높음경영은 대전 지역 출신의 선택 비율이높고, 경영은 기타, 충남 지역 출신자비율 높다. 통계는 대전 지역출신자의 선택이 상대적으로 높았다.

Page 6: Survey Data Analysis | Spring 2013 8장. 교차분석wolfpack.hnu.ac.kr/Spring_2013/SDA13/SDA_Ch8 교차분석...(42) Survey Data Analysis | Spring 2013 8장. 교차분석SPSS활용(표준화잔차활용)

(43)

Survey Data Analysis | Spring 2013

8장. 교차분석 SPSS활용(다중선택) page 180

(예제)•성별에 따른 불만시설 차이 검정

•다중문항은 일단 다중문항 변수군을정의하여 교차표를 구한다.

•예상과는 달리 카이제곱 통계량이주어지지 않는다.

•하여 다음 슬라이드에 있는 분할표가주어진 경우 카이제곱 통계량을 구하는방법을 이용한다.

Page 7: Survey Data Analysis | Spring 2013 8장. 교차분석wolfpack.hnu.ac.kr/Spring_2013/SDA13/SDA_Ch8 교차분석...(42) Survey Data Analysis | Spring 2013 8장. 교차분석SPSS활용(표준화잔차활용)

(44)

Survey Data Analysis | Spring 2013

8장. 교차분석 SPSS활용(분할표 주어진 경우)

분할표를 데이터에 입력•빈도를 가중케이스로 지정하고•교차분석을 실시하면 된다.

Page 8: Survey Data Analysis | Spring 2013 8장. 교차분석wolfpack.hnu.ac.kr/Spring_2013/SDA13/SDA_Ch8 교차분석...(42) Survey Data Analysis | Spring 2013 8장. 교차분석SPSS활용(표준화잔차활용)

(45)

Survey Data Analysis | Spring 2013

8장. 교차분석 SAS활용

실습문제•출신지역에 따른 전공선택 1순위 항목차이?

•출신지역에 따른 다중선택 문항 차이?

•(빈도표 주어진 경우)

proc freq data=ds;table f2*e2_1 /nocol nopercent

chisq CROSSLIST(STDRES);run;

data ds1; set ds;if (e1_1=1) then pr="취업";if (e1_2=1) then pr="학문";if (e1_3=1) then pr="적성";if (e1_4=1) then pr="교수";if (e1_5=1) then pr="선배";run;data ds2; set ds;

if (f2>=3) then f2=3;run;data ds2; set ds;

e3=e3_1;output;e3=e3_2;output;e3=e3_3;output;run;