개념 정규성, 등분산성 독립표본T 검정 대응표본T 검정 …독립표본T 검정-...
Transcript of 개념 정규성, 등분산성 독립표본T 검정 대응표본T 검정 …독립표본T 검정-...
T-test - 1/26Copyright ⓒ 2001 StatEdu Consulting
T-test개념
정규성, 등분산성
독립표본 T 검정
대응표본 T 검정
Mann-Whinety Test
Wilcoxon Test
T-test - 2/26Copyright ⓒ 2001 StatEdu Consulting
2 Group 간의 평균의 차이를 비교하는 분석
- 안전띠 착용 유무에 따른 사망자수는 차이가 있는가?
- 성별에 따라서 스트레스의 정도는 차이가 있는가?
0=−BAµ0≠−BAµ
BA µµ =
BA µµ ≠
비모수 : Wilcoxon 순위합 검정비모수 : Mann-Whinety Test
짝을 이룬 자료의 평균 변화의 분석
기본 가정 : 정규성
가설 : H0 :
H1 :
독립된 2 표본의 평균의 차이 분석
기본 가정 : 정규성, 등분산성
가설 : H0 :
H1 :
종속변수(특성값) : 등비
독립변수(인 자) : 명목 or 서열(수준 2)
대응표본 T 검정(Paired T)독립표본 T 검정(Independent T)
T-test - 3/26Copyright ⓒ 2001 StatEdu Consulting
모집단 A 모집단 B
표본 X
정규성 :
표본 Y
등분산 이분산
기본 가정 : 2 모집단의 분포는 정규분포이고 분산은 으로 동일해야 한다.
즉, 위의 등분산 Graph의 형태이다
T-test - 4/26Copyright ⓒ 2001 StatEdu Consulting
n ≥30
No
Yes
Data 수n < 30
Yes
등분산성
짝
정규성No
Yes
Yes NoNo짝
독립표본 T 검정(등분산)
독립표본 T 검정(이분산)
대응표본 T 검정 Wilcoxon Mann-Whitney
T-test - 5/26Copyright ⓒ 2001 StatEdu Consulting
성별에 따라서 스트레스의 정도를 측정한 자료이다. 남자, 여자의 스트레스 정
도는 차이가 있다고 할 수 있는가?
스트레스 성별
11.1 11.4 11.5 11.5 11.0 11.7 11.8여 자
11.2 10.8 10.0 11.2 11.3 11.5 11.7남 자
종속변수 : 스트레스 : 등비
독립변수 : 성별 : 명목(수준 2)
짝을 이루었는가? No
Data의 수 n < 30
분석 방법 : 독립표본 T 검정 or Mann-Whitney 검정
분석 순서 : 정규성 → 등분산성 → 최종 분석 방법 결정
T-test - 6/26Copyright ⓒ 2001 StatEdu Consulting
T-test의 기본 가정 – 정규성 검정
분석 → 기술통계량 → 데이터 탐색
다음의 가정을 만족하지 못하면
비모수의 Mann-Whinety Test스트레스
성별종속변수 : 스트레스
독립변수 : 성별
Shapiro-Wilk : 보편적으로 사용
Komogorov-Smirnov : 개방적(Data 수 ≥ 2000)
T-test - 7/26Copyright ⓒ 2001 StatEdu Consulting
T-test의 기본 가정 - 정규성 → 결과
정규성 검정
.285 7 .089 .881 7 .289
.175 7 .200 * .935 7 .567
공법
남자
여자
스트레스통계량 자유도 유의확률 통계량 자유도 유의확률
Kolmogorov-Smirnova Shapiro-Wilk
이것은 참인 유의확률의 하한값입니다.*.
Lilliefors 유의확률 수정a.
확률
표준편차 P > 0.05 → H0
정규성 만족
정규성
H0 : 정규분포를 따른다
H1 : 정규분포가 아니다.중심은 평균
종속(등비) 독립(명목, 수준2)이고 정규성 만족 ⇒ 독립표본 T-test
T-test - 8/26Copyright ⓒ 2001 StatEdu Consulting
독립표본 T 검정
H0 : (성별에 따라 스트레스는 같다)
H1 : (성별에 따라 스트레스는 다르다)
BA µµ =
BA µµ ≠분석 → 평균비교 → 독립표본 T 검정
스트레스
성별
종속변수 : 스트레스
독립변수 : 성별
검정변수 : 종속변수 입력
집단변수 : 독립변수 입력
독립변수는 수준이 2인 명목척도이고 1,2 로
입력하였으므로 그 수준을 정의해준다.
T-test - 9/26Copyright ⓒ 2001 StatEdu Consulting
집단통계량
7 11.100 .560 .2127 11.429 .293 .111
공법
남자여자
스트레스
N 평균 표준편차평균의 표준오차
독립표본 T 검정 - 결 과
독립표본 검정
1.404 .259 -1.376 12 .194 -.329 .239
-1.376 9.054 .202 -.329 .239
등분산이 가정됨
등분산이 가정되지 않음
도로수명
F유의확률
Levene의 등분산 검정
t 자유도유의확률(양쪽) 평균차
차이의표준오차
평균의 동일성에 대한 t-검정
독립변수의 영향력은?
ANOVA에서 설명
P = 0.194 > 0.05 → H0
성별에 따른 스트레스는 통계적으로차이가 없다.
등분산성
H0 : 등분산이다.
H1 : 등분산이 아니다.
P > 0.05 → H0
등분산 만족 → 윗 줄을 보고 해석
결론 p > 0.05
남 자 : 11.100 0.560 → H0여 자 : 11.429 0.293
통계적으로 차이가 없다.
±±
T-test - 10/26Copyright ⓒ 2001 StatEdu Consulting
결 과 정 리
성별에 따라서 스트레스의 정도는 유의한 차이가 없다.
남자 : 11.100 0.560 P = 0.194 > 0.05 → H0여자 : 11.429 0.293
통계적으로 차이가 없다.
종속(등비) 독립(명목, 수준2)이고 정규성, 등분산성 만족
⇒ 독립표본 T 검정
Data의 수 n < 30
정규성, 등분산성 만족
종속변수: 스트레스 : 등비
독립변수: 성별 : 명목(수준 2)
짝을 이루었는가? No
성별에 따라서 스트레스의 정도를 측정한 자료이다. 남자, 여자에 따라서 스트
레스는 차이가 있다고 할 수 있는가?
±±
T-test - 11/26Copyright ⓒ 2001 StatEdu Consulting
한 회사에서는 매년 사원들을 대상으로 실시하는 정규 컴퓨터 교육이 업무 효
율성을 증진시키는 효과가 있는지를 판단하고자, 16명의 사원을 대상으로 정
규 컴퓨터 교육을 실시한 후 각 사원에 대해 교육전, 교육후의 업무효율성을 측
정하였다. 정규 컴퓨터 교육이 업무 효율성을 증진시키는 효과가 있는가?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16사 원
80 90 92 75 86 90 81 70 89 88 82 79 91 90 78 89교육후
75 83 96 77 81 90 82 67 94 85 78 82 96 80 87 81교육전
짝을 이룬 자료의 경우아래와 같은 형태로 입력한다.
종속변수 : 업무 효율성 : 등비
독립변수 : 교육 : 명목(수준 2)
짝을 이루었는가? Yes
Data의 수 n < 30
분석 방법 : 대응표본 T-검정 or Wilcoxon 검정
분석 순서 : 정규성 → 최종 분석 방법 결정
짝을 이룬 자료의 경우정규성 검정만 필요하고등분산 검정은 필요가 없다.
T-test - 12/26Copyright ⓒ 2001 StatEdu Consulting
기본 가정 - 정규성
분석 → 기술통계량 → 데이터 탐색
정규성 검정
.144 16 .200* .954 16 .533
.208 16 .062 .898 16 .079
교육전
교육후
통계량 자유도 유의확률 통계량 자유도 유의확률
Kolmogorov-Smirnova
Shapiro-Wilk
이것은 참인 유의확률의 하한값입니다.*.
Lilliefors 유의확률 수정a.
P > 0.05 → H0
정규성 만족
정규성 가정을 만족하지 못하면
비모수의 Wilcoxon Test
두 변수 모두 입력
종속(등비) 독립(명목, 수준2), 정규성을 만족하고 짝을 이루었으므로 ⇒ 대응표본 T 검정
T-test - 13/26Copyright ⓒ 2001 StatEdu Consulting
대응표본 T 검정
H0 :
(교육에 따라 업무효율은 같다)
H1 :
(교육에 따라 업무효율은 다르다)
0=− BA µµ
0≠− BA µµ
분석 → 평균비교 → 대응표본 T 검정
3. 전부 선택되었으면
위 버튼을 클릭한다.
1. 두 변수를 차례로
마우스로 클릭해 준다.
2. 1번에서 선택한 결과
T-test - 14/26Copyright ⓒ 2001 StatEdu Consulting
대응표본 T 검정 - 결 과
대응표본 통계량
83.38 16 7.86 1.96
84.38 16 6.61 1.65
교육전
교육후
대응1
평균 N 표준편차평균의 표
준오차
대응표본 검정
-1.00 5.43 1.36 -3.89 1.89 -.737 15 .473교육전 - 교육후대응 1평균 표준편차
평균의표준오차 하한 상한
차이의 95% 신뢰구간
대응차
t 자유도유의확률(양쪽)
P = 0.473 > 0.05 → H0
교육에 따라 업무효율은
통계적으로 차이가 없다.
결론 p > 0.05
교육전 : 83.38 7.86 → H0교육후 : 84.38 6.61
통계적으로 차이가 없으므로, 정규 컴퓨터 교육은 업무 효율 향상에 기
여를 하지 못한다. 그러므로, 교육에 대한 재 검정이 필요할 것으로 생각
된다.
±±
짝을 이룬 자료의 경우
교육전-교육후
의 값을 가지고 사용하므로 실제로는 한 집단이므로 등분산 검정이 필요 없다.
T-test - 15/26Copyright ⓒ 2001 StatEdu Consulting
결 과 정 리
통계적으로 차이가 없으므로, 정규 컴퓨터 교육은 업무 효율 향상에 기여를 하
지 못한다. 그러므로, 교육에 대한 재 검정이 필요할 것으로 생각된다.
교육전 : 83.38 7.86 P = 0.473 > 0.05 → H0
교육후 : 84.38 6.61
통계적으로 차이가 없다.
짝을 이루었으며, 종속(등비) 독립(명목, 수준2)이고, 정규성 만족
⇒ 대응표본 T 검정
Data의 수 n < 30
정규성 만족
종속변수: 업무 효율 : 등비
독립변수: 교 육 : 명목(수준 2)
짝을 이루었는가? Yes
한 회사에서는 매년 사원들을 대상으로 실시하는 정규 컴퓨터 교육이 업무 효율
성을 증진시키는 효과가 있는지를 판단하고자, 16명의 사원을 대상으로 정규
컴퓨터 교육을 실시한 후 각 사원에 대해 교육전, 교육후의 업무효율성을 측정
하였다. 정규 컴퓨터 교육이 업무 효율성을 증진시키는 효과가 있는가?
±±
T-test - 16/26Copyright ⓒ 2001 StatEdu Consulting
어느 철강회사에서 생산하는 강판의 결점의 개수가 많아 이 부분에 대하여 직
원을 교육하였다. 다음의 자료는 교육전의 결점수와 교육후의 결점수에 대한
자료이다. 교육이 결점수를 줄이는데 효과가 있는가?
1 2 3 4 5 6 7 8 9 10 11 12직 원
10 10 8 23 13 10 8 13 9 8 8 5교육 후
18 12 7 21 19 14 8 11 19 16 8 11교육 전
종속변수 : 결점의 수 : 등비
독립변수 : 교육 : 명목(수준 2)
짝을 이루었는가? Yes
Data의 수 n < 30
분석 방법 : 대응표본 T 검정 or Wilcoxon Test
분석 순서 : 정규성 → 최종 분석 방법 결정
T-test - 17/26Copyright ⓒ 2001 StatEdu Consulting
기본 가정 - 정규성
분석 → 평균비교 → 독립표본 T 검정
정규성 가정을 만족하지 못하면비모수의 Wilcoxon Test
정규성 검정
.147 12 .200 * .931 12 .418
.287 12 .007 .766 12 .010 **
교육전교육후
통계량 자유도 유의확률 통계량 자유도 유의확률Kolmogorov-Smirnov
aShapiro-Wilk
이것은 참인 유의확률의 하한값입니다.*.
이것은 참인 유의확률의 상한값입니다.**.
Lilliefors 유의확률 수정a.
P < 0.05 → H1
정규성 만족 X
종속(등비) 독립(명목, 수준2), 정규성을 만족하지 않고 짝을 이루었으므로 ⇒ Wilcoxon Test
T-test - 18/26Copyright ⓒ 2001 StatEdu Consulting
비모수 검정 - Wilcoxon 검정
H0 : △ = 0 (교육의 효과가 없다)
H1 : △ ≠ 0 (교육의 효과가 있다)분석 → 비모수 검정 → 대응 2-표본(L)
분석 방법을 선택
일반적으로 Wilcoxon을
많이 사용
대응표본 T 검정과 같은
방법으로 변수를 선택한다.
T-test - 19/26Copyright ⓒ 2001 StatEdu Consulting
비모수 검정 - Wilcoxon 검정 – 결 과
순위
7 a 6.86 48.00
3 b 2.33 7.00
2 c
12
음의 순위
양의 순위
동률
합계
교육후 - 교육전N 평균순위 순위합
교육후 < 교육전a.
교육후 > 교육전b.
교육전 = 교육후c.
검정 통계량 b
-2.098 a
.036
Z
근사 유의확률 (양쪽)
교육후 -교육전
양의 순위를 기준으로.a.
Wilcoxon 부호순위 검정b.
P = 0.036 < 0.05 → H1
교육에 따른 공정의 결점수는 통계적으로 차이가 있다.
결론 p < 0.05
교육전-교육후 = -2.098 → H1
통계적으로 차이가 있으므로, 직원에 대한 교육은 공정에서 결
점수를 줄이는데 효과가 있다.
T-test - 20/26Copyright ⓒ 2001 StatEdu Consulting
결 과 정 리
직원들을 교육시킴으로써 결점의 수는 3개 정도 줄어든다고 할 수 있다. 그러므
로 직원들에 대한 교육이 필요하다.
결점수의 차이 : 3 P = 0.036 < 0.05 → H1
통계적으로 차이가 있다.
교육을 함으로써 결점수는 줄어든다.
짝을 이루었으며, 종속(등비) 독립(명목, 수준2)이고, 정규성 불만족
⇒ Wilcoxon 검정
Data의 수 n < 30
정규성 만족 X
종속변수 : 결점의 수 : 등비
독립변수 : 교육 : 명목(수준 2)
짝을 이루었는가? Yes
어느 철강회사에서 생산하는 강판의 결점의 개수가 많아 이 부분에 대하여 직원
을 교육하였다. 다음의 자료는 교육전의 결점수와 교육후의 결점수에 대한 자료
이다. 교육이 결점수를 줄이는데 효과가 있는가?
T-test - 21/26Copyright ⓒ 2001 StatEdu Consulting
예제 1의 자료에서 정규성을 만족하지 못했다면 어떻게 분석해야 하는가?
이 경우 새로운 공법이 기존의 공법보다 더 좋다라고 할 수 있는가?
스트레스 성별
11.1 11.4 11.5 11.5 11.0 11.7 11.8여 자
11.2 10.8 10.0 11.2 11.3 11.5 11.7남 자
종속변수 : 스트레스 : 등비
독립변수 : 성별 : 명목(수준 2)
짝을 이루었는가? No
Data의 수 n < 30
분석 방법 : 독립표본 T 검정 or Mann-Whitney 검정
분석 순서 : 정규성 → 등분산성 → 최종 분석 방법 결정
T-test - 22/26Copyright ⓒ 2001 StatEdu Consulting
비모수 검정 - Mann-Whitney 검정
분석 → 비모수 검정 → 독립 2-표본(2) H0 : △ = 0 (성별에 따라 스트레스는 같다)
H1 : △ ≠ 0 (성별에 따라 스트레스는 다르다)
스트레스
성별
종속변수 : 스트레스
독립변수 : 성별
분석 방법을 선택
일반적으로 Mann-Whitney를
많이 사용
T-test - 23/26Copyright ⓒ 2001 StatEdu Consulting
비모수 검정 – Mann-Whitney 검정 – 결 과
순위
7 6.21 43.50
7 8.79 61.50
14
공법남자
여자
합계
스트레스N 평균순위 순위합
검정 통계량 b
15.500
43.500
-1.158
.247
.259a
Mann-Whitney의 U
Wilcoxon의 W
Z
근사 유의확률 (양쪽)
정확한 유의확률[2*(한쪽 유의확률)]
도로수명
동률에 대해 수정된 사항이 없습니다.a.
집단변수: 공법b.
P = 0.247 > 0.05 → H0
성별에 따라 스트레스의 정도는 유의한차이가 없다.
독립표본 T 검정 : P = 0.194
Mann-Whitney 검정 : P = 0.247
비모수 검정의 P값이 더 작게 나온다.
결론 p > 0.05
→ H0
통계적으로 차이가 없다.
T-test - 24/26Copyright ⓒ 2001 StatEdu Consulting
결 과 정 리
성별에 따라서 스트레스의 정도는 유의한 차이가 없다.
P = 0.247 > 0.05 → H0
통계적으로 차이가 없다
종속(등비) 독립(명목, 수준2)이고 정규성 만족 X
⇒ Mann-Whitney Test
Data의 수 n < 30
정규성 만족 X
종속변수: 스트레스 : 등비
독립변수: 성별 : 명목(수준 2)
짝을 이루었는가? No
성별에 따라서 스트레스의 정도를 측정한 자료이다. 남자, 여자에 따라서 스트
레스는 차이가 있다고 할 수 있는가?
T-test - 25/26Copyright ⓒ 2001 StatEdu Consulting
과 정 정 리 1
T-test : 2 Group(집단)간의 평균의 차이를 비교하는 분석
- 기본 가정 : 정규성, 등분산성
정규성을 만족하면 T-test
만족하지 않으면 비모수 통계 검정
Data의 수가 30개 이상이면 대표본 근사에 의해 정규성을 만족한다
등분산을 만족하면 “등분산이 가정됨” 줄의 통계량을 확인
만족하지 않으면 “등분산이 가정되지 않음” 줄의 통계량을 확인
- 가 설 : H0 : 독립변수에 따라 종속변수는 같다
H1 : 독립변수에 따라 종속변수는 다르다
- 짝을 이루었는가?
짝을 이루었으면 대응표본 T 검정 (비모수 : Wilcoxon 검정)
짝을 이루지 않았으면 독립표본 T 검정 (비모수 : Mann-Whitney 검정)
T-test - 26/26Copyright ⓒ 2001 StatEdu Consulting
과 정 정 리 2
분석 순서 :
1. Data의 특성을 파악한다.
종속, 독립 변수 : 명목, 서열, 등비 중 어느 것인가?
2. 짝을 이루었는가 확인한다.
독립표본 T 검정 or 대응표본 T 검정
3. 정규성 검정을 한다.
T-test or 비모수 검정
4. 등분산 검정을 한다.
짝을 이룬 자료이거나 비모수 검정일 경우 필요 없는 단계이다.
5. 분석을 한다.
1, 2, 3 단계에서 얻어진 결론으로 최종 분석 방법을 선택하고 분석한다.
6. 결과를 해석한다.
평균과 표준편차를 정리하고
결과로 얻어진 P 값을 보고 2개의 가설 중 하나를 선택한다.
7. 결론을 내린다.