강의 7 추리통계 가설검정(t분포...

18
- 1 - 강의 7 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정 (계속) 3) t 분포에 의한 검정 표본 평균차이 검정 방법

Transcript of 강의 7 추리통계 가설검정(t분포...

Page 1: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 1 -

강의 7 – 추리통계 가설검정(t분포 검정)

7. 추리통계 가설검정 (계속)

3) t 분포에 의한 검정

표본 평균차이 검정 방법

Page 2: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 2 -

∙ t 검정 (t-test 또는 student t-test) - 모집단의 분산이나 표준편차를 알지 못할 때 모집단을 대표하는 표본으로부터 추정된 분산이나 표준편차를 가지고 t 분포에 의존하여 검정하는 방법

∙ t 분포 - 자유도에 따라 형태가 달라지는 가족분포 (family distribution)이며 평균이 0이고 좌우대칭의 분포인 정규분포이고 표준편차가 1보다 큰 분포이다.

자유도에 따른 t 분포의 형태는 자유도가 ∞이면 t 분포가 표

준정규분포 즉 Z 분포가 됨 (교재 그림 16-1 참조).

Page 3: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 3 -

t 분포에 의한 확률분포는 교재 p. 521 [수표 4] 참조.

Page 4: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 4 -

∙ t (F) 검정을 위한 가정 ① 종속변수가 양적변수이어야 함 ② 모집단의 분산과 표준편차를 알지 못할 때 사용 ③ 모집단 분포가 정규분포 ④ 등분산 가정(equal variance assumption)이 충족되어야 함

error term or residual =

이들 가정은 약자로 NID (0, σ2)로 표현: Normally, Independently, Distributed with mean of zero and common variance(σ2)

* 만약 위의 가정 중 ③번의 가정을 만족시키지 못할 때는 비모수 통계 (non-parametric statistics)를 사용 그리고 ④번을 가정을 충족시키지 못할 경우에는 두 독립표번 t 검정 대신에 Welch-Aspin 검정을 사용.* 등분산 가정의 검정:1) Fmax test - max S2/min S2 (Critical value of Fmax와 비교 검정) 2) Spearman's rank correlation - rank correlation between absolute

residuals and predicted values3) Levene's test - 절대오차값의 ANOVA4) Bartlett's test (만약 각 treatment마다 sample size가 다를 경우 사

용)

- 등분산 가정의 기각 이유: 1) 집단 간에 본질적으로 이미 큰 차이가 있을 경우. 2) 특정집단이 다른 집단에 비해 적용된 실험에 더 큰 분산을 가질 경우3) 관측 척도의 부적절한 선택: 이경우 자료의 변환으로 정정가능

Page 5: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 5 -

■ t 검정 종류: 단일표본 t 검정, 두 독립표본 t 검정, 두 종속표본 t 검정

∙ 단일표본 t 검정 (one-sample t test)

- 모집단의 분산을 알지 못할 때 모집단에서 추출된 표본의 평균과 연구자가 이론적, 경험적 배경으로 설정한 수를 비교 검정하는 방법

예제) 25명의 중 3학생에게 새로운 교수법에 의하여 수업을 한 후 영어시험을 치룬 결과 평균은 72점이었고 표준편차는 5점이었다. 새로운 교수법을 실시한 연구대상의 모집단 평균 68점과 같은지 여부를 유의수준 0.01에서 검정

통계적 가설; H0 : μ = 68 HA : μ ≠ 68 (양방적 검정)

표준오차는

t 통계값은

t 분포 값 = ±

양방적검정이므로 수표에서의값을취함t 통계값 (4) > t 분포값 (2.797) 이므로 영가설은 기각!

결론은 ‘유의수준 0.01에서 새로운 교수법에 의한 중 3학생들의 영어점수 평균은 68점이 아니다’

만약 위 예제에서 일방적 검정을 실시한다면,

통계적 가설; H0 : μ ≤ 68 HA : μ > 68 (일방적 검정)

t 분포값은

일방적검정에오른쪽이므로 수표에서의 값을취함

Page 6: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 6 -

SPSS 실행예제) 서해 꽃게 체내의 염분도가 서해의 평균 염분도 33.1‰와 같은지를

검정하기 위해 어획된 꽃게 중 15마리의 체내 염분도를 측정하였다. 1. Data view에서 자료 입력 후 → 메뉴에서 Analysis에서 Compare Means →

One-Sample T Test.. 선택

Page 7: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 7 -

output

t=-18.461, df=14, p<0.001

tα,df = t0.05, 14 = ± 2.977 > -18.461

결론: 영가설은 기각! (서해 꽃게의 체내 염분은 서해 염분농도와 다르다 또는 서해 염분보다 낮다!)

∙ 두 종속표본 t 검정 (two dependant samples t-test: matched pair t -test)

- 알지 못하는 각기 다른 두 모집단의 속성인 평균을 비교하기 위하여 두 모집단으로부터 표본들을 추출하여 표본의 평균들을 비교함으로써 모집단의 평균을 비교하는 통계적 방법. 이때 두 모집단에서 추출된 표본들은 서로 종속적인 것이어야 한다.

예) 남녀의 몸무게 비교 시 부부를 무선적으로 추출시 부부관계가 있으므로 이 표본은 서로 비독립적임. 이경우 두 종속표본 t 검정 사용

사전, 사후 검정 시에도 사용 (McNemar 검정(질적변수)과 유사).

그러므로 두 독립된 모집단의 평균의 비교가 아니라 표본에서 짝지어진 두 자료의 차이에 대한 검정이므로 두 종속표본 t 검정을 짝지어진 t 검정(matched-pair t test)이라고 한다.

Page 8: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 8 -

통계적 가설; H0 :

HA : ≠ ( 두변수간의 차이(사후-사전)에 대한 평균)

차이값에 대한 분산을 가지고 검정을 하므로 두 종속표본 t 검정은 단일표본 t 검정과 다를 것이 없다.

예제) 컴퓨터 보조학습효과의 유무 검정

보조학습 효과 유무를 유의수준 0.01에서 검정

통계적 가설; H0 :

HA : ≠

통계값

수표 4의 t 분포표에서 통계값

영가설을 채택!

‘컴퓨터에 의한 보조학습의 효과가 없음’

대상컴퓨터 학습전

사전 점수

컴퓨터 학습후

사후점수점수차(d)

A 4 6 2

B 3 5 2

C 5 5 0

D 4 6 2

E 4 6 2

Page 9: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 9 -

SPSS 실행1. Data view에서 자료 입력 후 → 메뉴에서 Analysis에서 Compare Means → Paired

-Samples T Test.. 선택 → Pair 1의 variable 1에 사전검사 선택, variable 2dp 사후검사

선택

Page 10: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 10 -

실행 output

t= 4.000, df=4, p = 0.016

tα,df = t0.01, 4 = 4.604 > t=4.000

결론: 영가설 채택! (컴퓨터 학습에서 보조교육의 효과가 나타나지 않았다.)

∙ 두 독립표본 t 검정 (two independant samples t-test)

- 각기 다른 두 모집단의 속성인 평균을 비교하기 위하여 두 모집단으로부터 표본들을 독립적으로 추출하여 표본의 평균들을 비교함으로써 모집단의 유사성을 검정하는 방법. 두 독립표본 Z 검정과 유사하지만 두 모집단의 분산을 알지 못하고 표본의 평균을 가지고 두 모집단을 비교하기에 표준오차의 계산이 상이하다.

* 등분산가정을 충족 (두 모집단의 분산이 동일함) - 표준오차 계산 시 통합분산을 사용하므로 자유도는 (n-2).

예제) 전통적 교수법과 새 교수법에 의한 학업성취도 차이를 유의수준 0.05에서 검정

전통적 교수법 실시 후 학업성취점수(n=5) 새 교수법 실시 후 학업성취점수(n=6)

3 7

4 6

6 8

5 7

5 5

8

Page 11: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 11 -

통계적 가설; H0 : HA : ≠

두 교수법에 의한 학업점수의 평균과 분산은

통합분산

표준오차

t 통계값

<

그러므로 영가설 기각!

결론‘유의수준 0.05에서 전통적 교수법과 새 교수법에 의한 학업성취도에 차이가 있다.’

Page 12: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 12 -

SPSS 실행1. Open Variable View → Type in variable name, type(자료유형: 숫자, 문자 등),

value, measures(자료유형에 따라 선정) → 첫 번째 컬럼을 교수법으로 정하고 string을 선

택하여 1=‘전통’으로 2=‘새교수법’으로 지정하고 measure 는 nominal로 선택

2. Data view로 이동 → 교수법에 따라 1(전통), 2(새교수법)와 각 점수 입력 → 메뉴에서

Analysis에서 Compare Means → Independent-Samples T-test 선택

Page 13: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 13 -

3. Independent-Samples T-test 선택 후 → Grouping variable로 교수법 선택 → click

‘Define Groups’ → Group1과 2에 각각 전통, 새교수법인 ‘1’ 과 ‘2’입력 → Test

Variable로 점수 선택 → click OK

실행 output

Levene 등분산 검정 F=0.001, p=0.982 (등분산 가정 만족)

t= -3.190, df={(n1+n2)-2}=9, p = 0.011

Page 14: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 14 -

tα,df = t0.05, 9 = -2.262 > t=-3.190

결론: 영가설 기각! (새로운 교수법과 전통적 교수법에 의한 학업점수(학업성취도)에 차이가 있다.)

∙ Welch-Aspin 검정

- t 통계값을 이용한 두 독립표본 비교시 등분산 가정을 충족시키지 못할 경우 (두 모집단의 분산이 다를 경우)에 실시.

위의 교수법에 따른 학업점수 결과 예제 값을 이용하여 등분산 가정을 검정한다면,

가설: H0 : HA : ≠

F 분포 이용하여 가설 검정

* 분자 (numerator)와 분모 (denominator)의 자유도와 유의수준으로 F 분포(교재 1 수표 5)의 기각값과 비교 검정.

영가설 채택! 그러므로 두 모집단의 분산은 같다고 볼 수 있다 (등분산 가정 충족).

Welch-Aspin 검정 예제) 음주집단과 비음주집단의 반응속도 차이

통계적 가설; H0 : HA : ≠

음주집단의 반응시간(min.) (n=5) 비음주집단의 반응시간(min.) (n=4)

32 4

10 3

5 4

10 5

30

Page 15: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 15 -

두 집단의 반응속도의 평균과 분산은

등분산 가정 검정

등분산 가정을 불충족,

Welch-Aspin 검정 실시

표준오차

t 통계값은

자유도 계산

그러므로

df = 4.042 로서 자유도는 4이고 유의수준 0.01에서 t 검정 기각값과 비교 검정 (양방적 검정).

통계값 ; 영가설 채택!

Page 16: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 16 -

SPSS 실행

- 두 독립변수 t 검정과 같음. 그러나 결과(output)의 해석에 차이가 있음.

실행 output

Levene 등분산 검정 F=37.810, p< 0.001 (등분산 가정 불만족)

Welch-Aspin 검정 t= 2.372, df=4.042 ≃ 4, p = 0.076

tα,df = t0.01, 4 = 4.604 > t=2.372

결론: 영가설 채택! (음주여부에 따라 반응속도에 차이가 있다.)

Page 17: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 17 -

∙ t 검정과 상관계수 (상관계수 강의: 양류 상관계수와 동일)

양류상관계수: rpb

- t 통계값 또는 양류상관계수로 양류상관계수 또는 t e통계값을 구할 수 있음.

- 두 독립표본 t 검정의 예제(교수법에 따른 학업성취도 차이)를 활용

SPSS 실행 (상관계수)

Page 18: 강의 7 추리통계 가설검정(t분포 검정)elearning.kocw.net/KOCW/document/2016/ust/jusejong/7.pdf강의 7 – 추리통계 가설검정(t분포 검정) 7. 추리통계 가설검정

- 18 -

실행 output

위 양류 상관계수로 t 통계값의 계산

±

SPSS 실행 (두 독립표본 t 검정) 실행과정은 p. 13 참조

Output

또는 t 통계값으로 상관계수 계산 가능