516201 correlation 2561...® ¤´¡ ´ r &RUUHODWLRQ 3HDUVRQ &RUUHODWLRQ &RHIILFLHQW 6SHDUPDQ 5DQN...
Transcript of 516201 correlation 2561...® ¤´¡ ´ r &RUUHODWLRQ 3HDUVRQ &RUUHODWLRQ &RHIILFLHQW 6SHDUPDQ 5DQN...
1
สหสมพนธ (Correlation)Pearson Correlation Coefficient
Spearman Rank Correlation Coefficient
ผชวยศาสตราจารยนคม ถนอมเสยงสาขาวชาวทยาการระบาดและชวสถต
คณะสาธารณสขศาสตร มหาวทยาลยขอนแกนEmail: [email protected]
Web: http://home.kku.ac.th/nikom
2
สมประสทธสหสมพนธของเพยรสน
(Pearson correlation Coefficient)
ใชทดสอบความสมพนธเชงเสนระหวางตวแปร 2 ตวแปร
พจารณาขนาดของความสมพนธ
เรยกชอ Pearson product moment correlation coefficient
YYS
XXS
XYS
r
nY)(
)Y(nX)(
)X(
n
)Y)(X(XY
r2
22
2
3
ความสมพนธพจารณาจากกราฟ Scatter Plot
4
r = +1 r = -1
r = 0
5
การคานวณขนาดความสมพนธ
คา r ทคานวณไดมคาระหวาง -1 ถง 1
การแปรความหมายของ r
r มคา + มความสมพนธแบบ direct linear relationship
ถามความสมพนธกนมาก r จะใกล +1.
r มคา - มความสมพนธแบบ inverse linear relationship
ถามความสมพนธกนมาก r จะใกล -
r มคาเปนศนยหมายถงมไมมความสมพนธ
หรอไมมความสมพนธเชงเสนตรง
6
ขอกาหนด (assumption)• ทแตละคาของตวแปร X ตวแปร Y มการแจกแจงแบบปกต
• ทแตละคาของตวแปร Y ตวแปร X มการแจกแจงแบบปกต
• ความแปรปรวนของตวแปร Y ทแตละคาของตวแปร X
• มความแปรปรวนเทากน 2
• ความแปรปรวนของตวแปร X ทแตละคาของตวแปร Y
• มความแปรปรวนเทากน 2
• ตวแปร X และ Y มการแจกแจงรวม (Joint Distribution)
มลกษณะ Bivariate Normal Distribution
7
วธตรวจสอบขอกาหนด (Assunption): Pearson Correlation Coefficient
- ตวแปรมสเกล interval, ratio
- ทงสองตวแปรมการแจกแจงแบบปกต ???
เชน การทดสอบโดยใช Shapiro-Wilk ???
- การทดสอบลกษณะ bivariate normality
สถตทดสอบ Doornik and Hansen (1994)
Stata: omninorm var1 var2
Stata12+: mvtest normality var1 var2, bivariate
กรณละเมด Assumption: วเคราะหโดยใชสถต nonparametric
Spearman rank correlation coefficient
8
. input idno sysbp diasbpidno sysbp diasbp
1. 1 141.6 89.72. 2 140.2 74.43. 3 131.8 83.54. 4 132.5 77.85. 5 135.7 85.86. 6 141.2 86.57. 7 143.9 89.48. 8 140.2 89.39. 9 140.8 8810. 10 131.7 82.211. 11 130.8 84.612. 12 135.6 84.413. 13 143.6 86.314. 14 133.2 85.915. end
. swilk sysbp diasbpShapiro-Wilk W test for normal data
Variable | Obs W V z Prob>z-------------+--------------------------------------------------
sysbp | 14 0.88912 2.052 1.415 0.07851diasbp | 14 0.88352 2.156 1.512 0.06524
. mvtest normality sysbp diasbp, bivariateDoornik-Hansen test for bivariate normality
--------------------------------------------------------Pair of variables | chi2 df Prob>chi2---------------------------+----------------------------sysbp diasbp | 12.79 4 0.0123--------------------------------------------------------
Test for multivariate normalityDoornik-Hansen chi2(4) = 12.791 Prob>chi2 = 0.0123
การทดสอบตวแปรแตละตวแปร
มการแจกแจงแบบปกต (Questionable ??)
แตพบวา ไม Bivariate normality
9
ตวอยาง ความสมพนธระหวางความสงและอาย
ของเดก 1-5 ปid age height
1. 1 3 94 2. 2 2 82 3. 3 4 102 4. 4 2 83 5. 5 1 70 6. 6 4 95 7. 7 5 105 8. 8 3 93
10
กอนวเคราะหตรวจสอบ ขอกาหนด (Assumption)
ตวแปร อาย สวนสง
ทดสอบดวยสถต
Doornik and Hansen
ขอมลมลกษณะ bivariate normality
Ratioตวแปรมสเกล interval, ratio
วธตรวจสอบขอกาหนด (assumption)
. omninorm age height
----------------------------------------------------------------(n = 8) | D-H P-value asy. P-value
----------------+-----------------------------------------------(all variables) | 6.9413 0.1390 2.4113 0.6606----------------------------------------------------------------
11
ความสงและอายของเดก 1-5 ป มความสมพนธ
เชงเสน อยางมนยสาคญทางสถต
5. ตดสนใจและสรปผล
. di min((1-ttail(8-2,7.49)), (ttail(8-2,7.49)))
.00014635 (เทยบกบ 0.025)
4. หาคา P-value
3. เลอกวธการทางสถต
และคานวณคาสถต
2. กาหนดระดบนยสาคญ
1. ตงสมมตฐาน0:;0:0 AHH
ขนตอนในการทดสอบสมมตฐาน: ความสงและอายของเดก 1-5 ป
มความสมพนธเชงเสนตรงหรอไมหรอไม
0.05
49.7)95.1(
)295(.95.
)1(
222
r
nrt
12
1.ตงสมมตฐาน
2. กาหนดระดบนยสาคญ 0.05
3. เลอกวธการทางสถตและคานวณคา
0:;0:0 AHH
nY)(
)Y(nX)(
)X(
n
)Y)(X(XY
r2
22
2
13
ตวอยาง ความสมพนธระหวางความสงและอายของเดก 1-5 ป
Id age (x) height(y)x2 y2 xy1 3 94 9 8836 282 2 2 82 4 6724 164 3 4 99 16 9801 396 4 2 83 4 6889 166 5 1 70 1 4900 70 6 4 95 16 9025 380 7 5 101 25 10201 505 8 3 93 9 8649 279Total 24 717 84 65025 2242
nY)(
)Y(nX)(
)X(
n)Y)(X(
XYr
22
22
950
8
271765025
8
22484
8
717242242
.)(
)()(
)(
)(
r
14
การทดสอบสมประสทธสหสมพนธของประชากร
( ) มคาเทากบ 0 หรอไม
H0: = 0 ; H1: = 0
ประชากร
ตวอยาง
)2r(1
2)(nrt
df = n - 2
49.7)95.1(
)295(.95.
)1(
222
r
nrt
15
4. หาคา P-value เปดตาราง t=7.49 ; df = 8-2=6; p-value<0.0005
หรอคานวณโดย Stata. di min((1-ttail(8-2,7.49)), (ttail(8-2,7.49))).00014635
. di min((1-ttail(8-2,7.49)), (ttail(8-2,7.49)))*2
.0002927
5. ตดสนใจและสรปผล: ความสงและอายของเดก 1-5 ป มความสมพนธ
เชงเสน อยางมนยสาคญทางสถต
7.49
16
การคานวณโดย Statapwcorr valist1 valist2 , sig
. pwcorr age height, sig
| age height-------------+------------------
age | 1.0000 || r
height | 0.9505 1.0000 | 0.0003| p value
17
การคานวณขนาดความสมพนธ
คา r ทคานวณไดมคาระหวาง -1 ถง 1
การแปรความหมายของ r
r มคา + มความสมพนธแบบ direct linear relationship
ถามความสมพนธกนมาก r จะใกล +1.
r มคา - มความสมพนธแบบ inverse linear relationship
ถามความสมพนธกนมาก r จะใกล -
r มคาเปนศนยหมายถงมไมมความสมพนธ
หรอไมมความสมพนธเชงเสนตรง
18
ชวงเชอมนของ Pearson Correlation
1
1
1
12
2
1
1
2
2
2
2
Z
Z
Z
Z
e
e,
e
e
3;
32/1
22/1
1
n
ZZZ
n
ZZZ FF
r
rZ F 1
1ln5.0
. ci2 age height,corr
Confidence interval for Pearson's product-moment correlation of age and height, based on Fisher's transformation.Correlation = 0.964 on 6 observations (95% CI: 0.700 to 0.996)
19
สถต Spearman Rank correlation coefficient
- ใชวดความสมพนธ
- ขอมลมลกษณะสมพนธ จานวน n ค
ขอกาหนด (Assunption):
- ตวแปรมสเกล Ordinal Scale
- กรณตวแปรมสเกล interval, Ratio Scale
ลกษณะการแจกแจงไมใช bivariate normality
20
วธตรวจสอบขอกาหนด (Assunption):
- ตวแปรมสเกล ordinal scale
- ตวแปรมสเกล interval, ratio แตลกษณะไมใช bivariate
normality ใชสถตทดสอบ Doornik and Hansen (1994)
- การทดสอบ ตวแปรแตละตวแปร มการแจกแจงแบบปกต
(Questionable ?) เชน การทดสอบโดยใช Shapiro-Wilk
STATA: omninorm var1 var2
STATA12+:mvtest normality var1 var2, bivariate
กรณละเมด Assumption: วเคราะหโดยใชสถต nonparametric
Spearman rank correlation coefficient
21
ขนตอนการวเคราะห
1. ใหลาดบทขอมล X จากนอยไปมาก กรณคาซาใชลาดบทเฉลย R(X)
2. ใหลาดบทขอมล Y จากนอยไปมาก กรณคาซาใชลาดบทเฉลย R(Y)
3. นาคาลาดบทมาลบกน di=R(Xi)-R(Yi)
4. แทนคาสตร
)n(n
id
sr
12
261
22
22
2 yx
dy i2x
sr(2) ขอมล/ลาดบท มคาซา
(1) ขอมล/ลาดบท ไมมคาซา
22
สถต Spearman Rank correlation coefficient
)()(12
261 yRxR
id;
)n(n
id
sr
R(x) R(y)
y5x55
y4x44
y3x33
y2x22
y1x11
di=R(x)-R(y)yxidno
23
สถต Spearman Rank correlation coefficient
กรณมคาซากน
22
22
2 yx
dy i2x
sr
xT
nnx
12
32
yTnn
y12
32
12
3 ttT i
i
เมอ i = x, y ใดๆ
24
1.5
4
5
1.5
3
R(x)
5
2.5
1
4
2.5
R(y)
-3.5515
1.5334
4153
-2.5412
0.5321
d=R(x)-R(y)Satisfaction (y)stress (x)idno
ตวอยางท 1 วเคราะหความสมพนธระหวางระดบความเครยดใน
การทางานกบระดบความพงพอใจในการทางาน
)n(n
id
sr
12
261
22
22
2 yx
dy i2x
sr
25
ระดบความเครยดในการทางานมความสมพนธกบระดบ
ความพงพอใจในการทางาน อยางมนยสาคญทางสถต
5. ตดสนใจและสรปผล
. di min((1-ttail(5-2,-5.12)), (ttail(5-2 ,-
5.12)))
.00718977 (เทยบกบ 0.025) เปดตาราง t หรอ Spearman
4. หาคา P-value
3. เลอกวธการทางสถต
และคานวณคาสถต
= 0.05 --> 0.05/2 = 0.0252. กาหนดระดบนยสาคญ
H0: S = 0 ; HA: S 01. ตงสมมตฐาน
97.0)5.9)(5.9(2
375.95.9
2 22
222
yx
dyxr
i
S
12.5))94.(1(
)25(94.
)1(
222
r
nrt
ขนตอนการทดสอบสมมตฐาน
26
-3.5
1.5
4
-2.5
0.5
d=R(x)-R(y)
1.5
4
5
1.5
3
R(x)
5
2.5
1
4
2.5
R(y)
12.25515
2.25334
16153
6.25412
0.25321
d2Satisfaction (y)stress (x) idno
ขนตอนการทดสอบสมมตฐาน
1. สมมตฐาน H0: S = 0 ; HA: S 02. กาหนดระดบนยสาคญท 0.05
3. เลอกและคานวณคาสถต
22
222
2 yx
dyxr
i
S
27
3.เลอกและคานวณคาสถต
5.912
)22(
12
55
12
3332
xT
nnx
5.912
)22(
12
55
12
3332
yT
nny
97.0)5.9)(5.9(2
375.95.9
2 22
222
yx
dyxr
i
S
yxitt
T iii ,;
12
3
12.5)97.0(1(
)25(97.0
1(
)2(22
S
S r
nrt
28
. spearman stress satisfactionNumber of obs = 5Spearman's rho = -0.9474
Test of Ho: stress and satisfaction are independentProb > |t| = 0.0144
4. หาคา p-value < 0.05
นาคา t=5.12; df=3 เปดตาราง t; 0.005<p-value<0.01
5. ตดสนใจและสรปผล ความเครยดมความสมพนธ
กบความพงพอใจในการทางานแตมทศทางลบ
อยางมนยสาคญทางสถต
5.12
29
ชวงความเชอมนของ Spearman rank Correlation
1
1
1
12
2
1
1
2
2
2
2
Z
Z
Z
Z
e
e,
e
e
3;
32/1
22/1
1
n
ZZZ
n
ZZZ FF
s
sF r
rZ
1
1ln5.0
. ci2 stress satisfaction,spearmanConfidence interval for Spearman's rank correlation of stress and satisfaction, based on Fisher's transformation.Correlation = -0.947 on 5 observations (95% CI: -0.997 to -0.397)
Warning: This method may not give valid resultswith small samples (n<= 10) for rank correlations.
30
86.3143.61384.4135.61284.6130.81182.2131.71088140.89
85.9133.214
85.8135.75
89.3140.28
86.5141.2689.4143.97
77.8132.5483.5131.8374.4140.2289.7141.61
diasbpsysbpidno
ตวอยางท 2 การวเคราะหความสมพนธระหวาง Systolic blood pressure และ Diastolic blood pressure ในผปวย 14 ราย (Pincherle & Robinson, 1974)
-Pearson correlation coefficient
or
-Spearman rank correlation
coefficient
31
กอนวเคราะหตรวจสอบ ขอกาหนด (Assumption)การวเคราะห Pearson correlation coefficient
สถต Doornik and Hansenขอมลมลกษณะ bivariate normality
Ratioตวแปรมสเกล interval, ratio
วธตรวจสอบขอกาหนด (assumption)
. omninorm sysbp diasbp----------------------------------------------------------------
(n = 14) | D-H P-value asy. P-value----------------+-----------------------------------------------(all variables) | 12.8947 0.0118 9.7447 0.0450----------------------------------------------------------------
STATA12+. mvtest normality sysbp diasbpTest for multivariate normality
Doornik-Hansen chi2(4) = 12.895 Prob>chi2 = 0.0118
32
Scatter Plot
33
การอานผล systolic BP และ diastolic BP
มความสมพนธอยางมนยสาคญทางสถต
5. ตดสนใจและสรปผล
. di min((1-ttail(14-2,3.2309493)), (ttail(14-2,3.2309493)))
.0036033 (เทยบกบ 0.05) หรอเปดตาราง t
. di min((1-ttail(14-2,3.2309493)), (ttail(14-
2,3.2309493)))*2
.0002927 (เทยบกบ 0.05)
4. หาคา P-value
3. เลอกวธการทางสถต
และคานวณคาสถต
2. กาหนดระดบนยสาคญ
1. ตงสมมตฐาน 0:;0:0 sAs HH
ขนตอนในการทดสอบสมมตฐาน: systolic BP และ diastolic BPมความสมพนธหรอไม
0.05
2309493.3)6821.1(
)214(6821..
)1(
222
s
s r
nrt
34
1.ตงสมมตฐาน
2. กาหนดระดบนยสาคญ 0.05
3. เลอกวธการทางสถตและคานวณคา
0:;0:0 sAs HH ขนตอนในการทดสอบสมมตฐาน:
)n(n
id
sr
12
261
22
222
2 yx
dyxsr i
หรอ
35
-441-5-1-1
-3.51103-17.5-2
di =R(x)-R(y)
1691386.3143.61315684.4135.612
256184.6130.81113282.2131.7101111088140.89
168485.9133.214
07785.8135.75
12.25128.589.3140.28
1101186.5141.261131489.4143.97
53
8.512
R(x)
241
14
R(y)
977.8132.54183.5131.83
56.2574.4140.22489.7141.61
d2diasbpsysbpidno
5.144)]()([(1
22
n
iiii yRxRd
36
สถต Spearman Rank correlation
กรณมคาซากน
22
222
2 yx
dyxsr i
yx Tnn
yTnn
x12
;12
32
32
yxitt
T ii
,;12
3
29.3)6821.1(
)146821(.6821.0
)1(
222
s
s r
nrt
37
. spearman sysbp diasbpNumber of obs = 14
Spearman's rho = 0.6821Test of Ho: sysbp and diasbp are independent
Prob > |t| = 0.0072
. ci2 sysbp diasbp,spearmanConfidence interval for Spearman's rank correlation of sysbp and diasbp, based on Fisher's transformation.Correlation = 0.682 on 14 observations (95% CI: 0.237 to 0.890)
4. หาคา p-value: เปดตาราง t/หรอใช Stata. di min((1-ttail(14-2,3.2309493)), (ttail(14-2,3.2309493))).0036033
. di min((1-ttail(14-2,3.2309493)), (ttail(14-2,3.2309493)))*2
.00720661
5. ตดสนใจและสรปผล: systolic BP และ diastolic BP
มความสมพนธอยางมนยสาคญทางสถต