스테이크하우스 세트 메뉴 13 8,000 · 암소우유, 치즈 향이 풍부하며 바스러지는 질감, 검정 여름 송로버섯이 겹겹이 싸여있음 파르마지아노
강의 7 추리통계 가설검정(t분포...
Transcript of 강의 7 추리통계 가설검정(t분포...
- 1 -
강의 7 – 추리통계 가설검정(t분포 검정)
7. 추리통계 가설검정 (계속)
3) t 분포에 의한 검정
표본 평균차이 검정 방법
- 2 -
∙ t 검정 (t-test 또는 student t-test) - 모집단의 분산이나 표준편차를 알지 못할 때 모집단을 대표하는 표본으로부터 추정된 분산이나 표준편차를 가지고 t 분포에 의존하여 검정하는 방법
∙ t 분포 - 자유도에 따라 형태가 달라지는 가족분포 (family distribution)이며 평균이 0이고 좌우대칭의 분포인 정규분포이고 표준편차가 1보다 큰 분포이다.
자유도에 따른 t 분포의 형태는 자유도가 ∞이면 t 분포가 표
준정규분포 즉 Z 분포가 됨 (교재 그림 16-1 참조).
- 3 -
t 분포에 의한 확률분포는 교재 p. 521 [수표 4] 참조.
- 4 -
∙ t (F) 검정을 위한 가정 ① 종속변수가 양적변수이어야 함 ② 모집단의 분산과 표준편차를 알지 못할 때 사용 ③ 모집단 분포가 정규분포 ④ 등분산 가정(equal variance assumption)이 충족되어야 함
error term or residual =
이들 가정은 약자로 NID (0, σ2)로 표현: Normally, Independently, Distributed with mean of zero and common variance(σ2)
* 만약 위의 가정 중 ③번의 가정을 만족시키지 못할 때는 비모수 통계 (non-parametric statistics)를 사용 그리고 ④번을 가정을 충족시키지 못할 경우에는 두 독립표번 t 검정 대신에 Welch-Aspin 검정을 사용.* 등분산 가정의 검정:1) Fmax test - max S2/min S2 (Critical value of Fmax와 비교 검정) 2) Spearman's rank correlation - rank correlation between absolute
residuals and predicted values3) Levene's test - 절대오차값의 ANOVA4) Bartlett's test (만약 각 treatment마다 sample size가 다를 경우 사
용)
- 등분산 가정의 기각 이유: 1) 집단 간에 본질적으로 이미 큰 차이가 있을 경우. 2) 특정집단이 다른 집단에 비해 적용된 실험에 더 큰 분산을 가질 경우3) 관측 척도의 부적절한 선택: 이경우 자료의 변환으로 정정가능
- 5 -
■ t 검정 종류: 단일표본 t 검정, 두 독립표본 t 검정, 두 종속표본 t 검정
∙ 단일표본 t 검정 (one-sample t test)
- 모집단의 분산을 알지 못할 때 모집단에서 추출된 표본의 평균과 연구자가 이론적, 경험적 배경으로 설정한 수를 비교 검정하는 방법
예제) 25명의 중 3학생에게 새로운 교수법에 의하여 수업을 한 후 영어시험을 치룬 결과 평균은 72점이었고 표준편차는 5점이었다. 새로운 교수법을 실시한 연구대상의 모집단 평균 68점과 같은지 여부를 유의수준 0.01에서 검정
통계적 가설; H0 : μ = 68 HA : μ ≠ 68 (양방적 검정)
표준오차는
t 통계값은
t 분포 값 = ±
양방적검정이므로 수표에서의값을취함t 통계값 (4) > t 분포값 (2.797) 이므로 영가설은 기각!
결론은 ‘유의수준 0.01에서 새로운 교수법에 의한 중 3학생들의 영어점수 평균은 68점이 아니다’
만약 위 예제에서 일방적 검정을 실시한다면,
통계적 가설; H0 : μ ≤ 68 HA : μ > 68 (일방적 검정)
t 분포값은
일방적검정에오른쪽이므로 수표에서의 값을취함
- 6 -
SPSS 실행예제) 서해 꽃게 체내의 염분도가 서해의 평균 염분도 33.1‰와 같은지를
검정하기 위해 어획된 꽃게 중 15마리의 체내 염분도를 측정하였다. 1. Data view에서 자료 입력 후 → 메뉴에서 Analysis에서 Compare Means →
One-Sample T Test.. 선택
- 7 -
output
t=-18.461, df=14, p<0.001
tα,df = t0.05, 14 = ± 2.977 > -18.461
결론: 영가설은 기각! (서해 꽃게의 체내 염분은 서해 염분농도와 다르다 또는 서해 염분보다 낮다!)
∙ 두 종속표본 t 검정 (two dependant samples t-test: matched pair t -test)
- 알지 못하는 각기 다른 두 모집단의 속성인 평균을 비교하기 위하여 두 모집단으로부터 표본들을 추출하여 표본의 평균들을 비교함으로써 모집단의 평균을 비교하는 통계적 방법. 이때 두 모집단에서 추출된 표본들은 서로 종속적인 것이어야 한다.
예) 남녀의 몸무게 비교 시 부부를 무선적으로 추출시 부부관계가 있으므로 이 표본은 서로 비독립적임. 이경우 두 종속표본 t 검정 사용
사전, 사후 검정 시에도 사용 (McNemar 검정(질적변수)과 유사).
그러므로 두 독립된 모집단의 평균의 비교가 아니라 표본에서 짝지어진 두 자료의 차이에 대한 검정이므로 두 종속표본 t 검정을 짝지어진 t 검정(matched-pair t test)이라고 한다.
- 8 -
통계적 가설; H0 :
HA : ≠ ( 두변수간의 차이(사후-사전)에 대한 평균)
차이값에 대한 분산을 가지고 검정을 하므로 두 종속표본 t 검정은 단일표본 t 검정과 다를 것이 없다.
예제) 컴퓨터 보조학습효과의 유무 검정
보조학습 효과 유무를 유의수준 0.01에서 검정
통계적 가설; H0 :
HA : ≠
통계값
수표 4의 t 분포표에서 통계값
영가설을 채택!
‘컴퓨터에 의한 보조학습의 효과가 없음’
대상컴퓨터 학습전
사전 점수
컴퓨터 학습후
사후점수점수차(d)
A 4 6 2
B 3 5 2
C 5 5 0
D 4 6 2
E 4 6 2
- 9 -
SPSS 실행1. Data view에서 자료 입력 후 → 메뉴에서 Analysis에서 Compare Means → Paired
-Samples T Test.. 선택 → Pair 1의 variable 1에 사전검사 선택, variable 2dp 사후검사
선택
- 10 -
실행 output
t= 4.000, df=4, p = 0.016
tα,df = t0.01, 4 = 4.604 > t=4.000
결론: 영가설 채택! (컴퓨터 학습에서 보조교육의 효과가 나타나지 않았다.)
∙ 두 독립표본 t 검정 (two independant samples t-test)
- 각기 다른 두 모집단의 속성인 평균을 비교하기 위하여 두 모집단으로부터 표본들을 독립적으로 추출하여 표본의 평균들을 비교함으로써 모집단의 유사성을 검정하는 방법. 두 독립표본 Z 검정과 유사하지만 두 모집단의 분산을 알지 못하고 표본의 평균을 가지고 두 모집단을 비교하기에 표준오차의 계산이 상이하다.
* 등분산가정을 충족 (두 모집단의 분산이 동일함) - 표준오차 계산 시 통합분산을 사용하므로 자유도는 (n-2).
예제) 전통적 교수법과 새 교수법에 의한 학업성취도 차이를 유의수준 0.05에서 검정
전통적 교수법 실시 후 학업성취점수(n=5) 새 교수법 실시 후 학업성취점수(n=6)
3 7
4 6
6 8
5 7
5 5
8
- 11 -
통계적 가설; H0 : HA : ≠
두 교수법에 의한 학업점수의 평균과 분산은
통합분산
표준오차
t 통계값
<
그러므로 영가설 기각!
결론‘유의수준 0.05에서 전통적 교수법과 새 교수법에 의한 학업성취도에 차이가 있다.’
- 12 -
SPSS 실행1. Open Variable View → Type in variable name, type(자료유형: 숫자, 문자 등),
value, measures(자료유형에 따라 선정) → 첫 번째 컬럼을 교수법으로 정하고 string을 선
택하여 1=‘전통’으로 2=‘새교수법’으로 지정하고 measure 는 nominal로 선택
2. Data view로 이동 → 교수법에 따라 1(전통), 2(새교수법)와 각 점수 입력 → 메뉴에서
Analysis에서 Compare Means → Independent-Samples T-test 선택
- 13 -
3. Independent-Samples T-test 선택 후 → Grouping variable로 교수법 선택 → click
‘Define Groups’ → Group1과 2에 각각 전통, 새교수법인 ‘1’ 과 ‘2’입력 → Test
Variable로 점수 선택 → click OK
실행 output
Levene 등분산 검정 F=0.001, p=0.982 (등분산 가정 만족)
t= -3.190, df={(n1+n2)-2}=9, p = 0.011
- 14 -
tα,df = t0.05, 9 = -2.262 > t=-3.190
결론: 영가설 기각! (새로운 교수법과 전통적 교수법에 의한 학업점수(학업성취도)에 차이가 있다.)
∙ Welch-Aspin 검정
- t 통계값을 이용한 두 독립표본 비교시 등분산 가정을 충족시키지 못할 경우 (두 모집단의 분산이 다를 경우)에 실시.
위의 교수법에 따른 학업점수 결과 예제 값을 이용하여 등분산 가정을 검정한다면,
가설: H0 : HA : ≠
F 분포 이용하여 가설 검정
* 분자 (numerator)와 분모 (denominator)의 자유도와 유의수준으로 F 분포(교재 1 수표 5)의 기각값과 비교 검정.
영가설 채택! 그러므로 두 모집단의 분산은 같다고 볼 수 있다 (등분산 가정 충족).
Welch-Aspin 검정 예제) 음주집단과 비음주집단의 반응속도 차이
통계적 가설; H0 : HA : ≠
음주집단의 반응시간(min.) (n=5) 비음주집단의 반응시간(min.) (n=4)
32 4
10 3
5 4
10 5
30
- 15 -
두 집단의 반응속도의 평균과 분산은
등분산 가정 검정
등분산 가정을 불충족,
Welch-Aspin 검정 실시
표준오차
t 통계값은
자유도 계산
그러므로
df = 4.042 로서 자유도는 4이고 유의수준 0.01에서 t 검정 기각값과 비교 검정 (양방적 검정).
통계값 ; 영가설 채택!
- 16 -
SPSS 실행
- 두 독립변수 t 검정과 같음. 그러나 결과(output)의 해석에 차이가 있음.
실행 output
Levene 등분산 검정 F=37.810, p< 0.001 (등분산 가정 불만족)
Welch-Aspin 검정 t= 2.372, df=4.042 ≃ 4, p = 0.076
tα,df = t0.01, 4 = 4.604 > t=2.372
결론: 영가설 채택! (음주여부에 따라 반응속도에 차이가 있다.)
- 17 -
∙ t 검정과 상관계수 (상관계수 강의: 양류 상관계수와 동일)
양류상관계수: rpb
- t 통계값 또는 양류상관계수로 양류상관계수 또는 t e통계값을 구할 수 있음.
- 두 독립표본 t 검정의 예제(교수법에 따른 학업성취도 차이)를 활용
SPSS 실행 (상관계수)
- 18 -
실행 output
위 양류 상관계수로 t 통계값의 계산
±
SPSS 실행 (두 독립표본 t 검정) 실행과정은 p. 13 참조
Output
또는 t 통계값으로 상관계수 계산 가능