บทที่ 8 สหสัมพันธ์และการ...
Transcript of บทที่ 8 สหสัมพันธ์และการ...
บทท 8
สหสมพนธและการวเคราะหการถดถอย
การหาความสมพนธระหวางขอมลเชงปรมาณ 2 ชด หรอมากกวานนถาใชเทคนคการทดสอบไคสแควรจะตองแบงขอมลเชงปรมาณนนออกเปนกลม ๆ เสยกอนแลวจงนบความถ ซงการท าเชนนจะสญเสยรายละเอยดของขอมลไป เทคนคการวเคราะหสหสมพนธเปนเทคนคการหาความสมพนธระหวางขอมลเชงปรมาณต งแต 2 ชดขนไป และสามารถบอกไดวาขอมลทมความสมพนธกนนนมความสมพนธกนในทศทางใด
สหสมพนธ (Correlation)
สหสมพนธเปนการศกษาความสมพนธระหวางขอมลหรอตวแปรตงแต2 ตวขนไป วามความสมพนธกนในระดบใด และมความสมพนธในทศทางใด เชนความสงกบน าหนกของคนมความสมพนธกนมากหรอนอย และมความสมพนธในทศทางเดยวกนหรอตรงกนขาม
ถาให X เปนตวแปรแทน ความสง (cm) Y เปนตวแปรแทนน าหนก (kg) ลกษณะของขอมลทเกบรวมรวมมาจะตองเปนขอมลทมาจากหนวยตวอยางเดยวกน
เชนคนเดยวกน ดงน
คนท น าหนก (Y) ความสง (X) 1 2
n
y1
y2
yn
x1
x2
xn
จากตารางจะเหนวาคาของตวแปรYและ Xไดมาจากคน ๆ เดยวกน ซงอาจจะมหนวยเดยวกนหรอหนวยตางกนกได
242
การหาความสมพนธระหวางขอมลหรอตวแปร 2 ตว เรยกวาสหสมพนธอยางงาย(simple correlation) การหาความสมพนธระหวางขอมลหรอตวแปรมากกวา 2 ตว เรยกวาสหสมพนธเชงพห (multiple correlation) ในเอกสารฉบบนจะกลาวถงสหสมพนธอยางงายเทานน
วธการดลกษณะความสมพนธ
การดลกษณะความสมพนธของขอมล หรอตวแปรสามารถท าไดหลายวธ ดงน 1. แผนภาพการกระจาย (scatter diagram) 2. คาสมประสทธสหสมพนธ (correlation coefficient)
1. แผนภาพการกระจาย
แผนภาพการกระจายเปนวธการดลกษณะความสมพนธของขอมลอยางคราว ๆโดยดจากลกษณะการกระจาย หรอแนวโนมของจดเมอเทยบกบเสนตรง ดงน
ในรป (a) แนวโนมของจดชขนดานขวาตามแนวเสนตรง เมอ x มคามาก y มคามาก เมอ x มคานอย y มคานอย เรยกวามความสมพนธเชงเสนเชงบวก (positive and linear correlation) หรอความสมพนธแบบแปรตามกน
ในรป (b) แนวโนมของจดชลงดานขวาตามแนวเสนตรง เมอ x มคามาก y มคา
นอย เมอ x มคานอย y มคามาก เรยกวามความสมพนธเชงเสนเชงลบ (negative and linear correlation) หรอความสมพนธแบบแปรผกผน
243
ในรป (c) แนวโนมของจดชลงดานขวาตามแนวเสนโคง เรยกวามความสมพนธไมเชงเสนเชงลบ(negative and nonlinear correlation)
ในรป (d) แนวโนมของจดกระจายออกไม มแนวเสนตรง เ รยกวาไม มความสมพนธ (no correlation)
2. คาสมประสทธสหสมพนธ
ส าหรบตวสถตทใชวดคาสหสมพนธอยางงายวามความสมพนธมากหรอนอยเพยงใดคอสมประสทธสหสมพนธ (Correlation coefficient) ซงในกรณของสหสมพนธอยางงายตวสถตนเรยกวาสมประสทธสหสมพนธอยางงาย (Simple Correlation Coefficient) เขยนแทนดวยสญลกษณ หรอ xy ในกรณทเปนคาพารามเตอร และ r หรอ rxyในกรณทเปนคาสถตโดยท และ r จะไมมหนวยและมคาตงแต -1 ถง 1
2.1 ความหมายของคาสมประสทธสหสมพนธ คาสมประสทธสหสมพนธทค านวณไดมความหมายดงน
1. ถา และ r มคาเปนบวก แสดงวาตวแปรXและ Yมความสมพนธเชงบวกหมายความวาถาตวแปร X มคาเพมขนตวแปร Y จะมคาเพมขนหรอถาตวแปร X มคาลดลง ตวแปร Y จะมคาลดลง
244
2. ถา และ r มคาเปนลบ แสดงวาตวแปร Xและ Yมความสมพนธเชงลบ หมายความวาถาตวแปร X มคาเพมขนตวแปร Y จะมคาลดลง หรอถาตวแปร X มคาลดลง ตวแปร Y จะมคาเพมขน
3. ถา และ r มคาเทากบ1 แสดงวาตวแปรXและ Yมความสมพนธเชงบวกอยางสมบรณ (perfect positive correlation)
4. ถา และ r มคาเทากบ-1 แสดงวาตวแปรXและ Yมความสมพนธเชงลบอยางสมบรณ (perfect negative correlation)
5. ถา และ rมคาเขาใกล 1 แสดงวาตวแปรXและ Yมความสมพนธเชงบวกและมความสมพนธมาก
6. ถา และ rมคาเขาใกล -1 แสดงวาตวแปร Xและ Yมความสมพนธเชงลบและมความสมพนธมาก
7. ถา และ r มคาเขาใกล 0 แสดงวาตวแปรXและ Yม ความสมพนธกนนอย 8. ถา และ rมคาเทากบ 0 แสดงวาตวแปรXและ Yไมมความสมพนธเชงเสน ตวอยางเชนถาคาสมประสทธสหสมพนธระหวางความสงกบน าหนกเทากบ
0.85 หมายความวาความสงมความสมพนธเชงบวกอยางมากกบน าหนก ถาความสงมากน าหนกจะมากดวย และถาความสงนอยน าหนกจะนอยดวย เปนตน
ความหมายของ และ r สามารถแสดงดวยแผนภาพการกระจาย ดงน
245
2.2 วธการค านวณหาคาสมประสทธสหสมพนธวธการค านวณคาสมประสทธสหสมพนธมหลายวธขนอยกบประเภทของขอมลหรอตวแปร เชนสมประสทธสหสมพนธสเปยรแมน สมประสทธสหสมพนธฟ สมประสทธสหสมพนธเพยรสน เปนตน
ในเอกสารฉบบนจะกลาวเฉพาะการค านวณหาคาสมประสทธสหสมพนธของเพยรสน ซงใชหาความสมพนธระหวางขอมลเชงปรมาณ หรอตวแปรแบบตอเนอง สมประสทธสหสมพนธเพยรสนเขยนแทนดวยสญลกษณ ซงคดคนโดย คารล เพยรสน (Karl Pearson) บางครงอาจเรยกวา Pearson Product moment correlation Coefficient ซงสามารถค านวณไดจากสตร ดงน
yx
yx
),cov( หรอ
yx
xy
2
yi
N
1i
2xi
N
1i
yixi
N
1i
yx
yx
)()(
)()(
โดยท แทนสมประสทธสหสมพนธเพยรสน cov(x,y) หรอ xy แทนความแปรปรวนรวมของตวแปร X และ Y yx , แทนสวนเบยงเบนมาตรฐานของตวแปรX และ Y yx , แทนคาเฉลยของตวแปร X และ Y
ในทางปฏบตเราเกบรวบรวมขอมลจากตวอยาง ดงนนจะประมาณ ดวย r โดยท
yxss
yxr
),cov(
2
1
2
1
1
)()(
))((
yyxx
yyxx
i
n
ii
n
i
ii
n
i
2
1
2
1
2
1
2
1
111
)()()()( i
n
ii
n
i
n
i
ii
n
i
i
n
ii
n
iii
n
i
yynxxn
yxyxn
246
โดยท r แทนสมประสทธสหสมพนธเพยรสน cov(x,y) แทนความแปรปรวนรวมของตวแปร X และ Y yx ss , แทนสวนเบยงเบนมาตรฐานของตวแปร X และ Y yx , แทนคาเฉลยของตวแปร X และ Y n แทนจ านวนตวอยาง
2.3 ขอตกลงเบองตน ของสมประสทธสหสมพนธของเพยรสน เปนดงน 1. ตวแปร 2 ตว เปนตวแปรแบบตอเนอง หรอเปนขอมลเชงปรมาณ 2. ความสมพนธระหวาง 2 ตวแปรเปนเสนตรง (Linear Relationship)
ตวอยาง 8.1 จากคะแนนสอบของนกศกษาวชาเอกบรหารธรกจทสอบวชาเศรษฐศาสตร และมานษยวทยา 12 คน เปนดงตารางดานลางอยากทราบวาคะแนนสอบทง 2 วชามความสมพนธกนเพยงใด
คนท. คะแนนสอบวชาเศรษฐศาสตร (Y)
คะแนนสอบวชามานษยวทยา (X)
1 2 3 4 5 6 7 8 9
10 11 12
51 68 72 97 55 73 95 74 20 91 74 80
74 70 88 93 67 73 99 73 33 91 80 86
y = 850 x = 927
247
วธท า จากขอมล จะได 2y 2x xy
2601 4624 5184 9409 3025 5329 9025 5476 400
8281 5476 6400
5476 4900 7744 8649 7789 5329 9801 5329 1089 8281 6400 7396
3774 4760 6336 9021 3685 5329 9045 5402 660
8281 5920 6880
65230y2 74883x2 69453xy
2i
n
1i
2i
n
1i
2n
1i
i2
i
n
1i
i
n
1ii
n
1iii
n
1i
yynxxn
yxyxn
r
)()()()(
))()(())()((
))(()(
22 85065230129277488312
8509276945312
))(( 6026039267
787950833436
2366229420
45486
9350.
935.0r หมายความวาคะแนนสอบวชาเศรษฐศาสตรและวชามานษยวทยาของนกศกษา 12 คนมความสมพนธอยางมากในเชงบวก นนคอถาคะแนนสอบวชาเศรษฐศาสตรเพมขนคะแนนสอบวชามานษยวทยาจะเพมขน หรอถาคะแนนสอบวชาเศรษฐศาสตรลดลงคะแนนสอบวชามานษยวทยาจะลดลงดวย
248
หมายเหตจาก yx
xy
ss
sr
))((
n
1i
i
n
1i
i
n
1i
iixy yxn
1yxs
2n
1i
n
i
2ix x
n
1xs )()(
2n
1i
n
1i
2iy y
n
1ys )(
การประมาณคาสมประสทธสหสมพนธเพยรสน ( xy )
1. การประมาณคาแบบจดของสมประสทธสหสมพนธ
ตวประมาณแบบจดของ xy คอ
2i
n
1i
2i
n
1i
2n
1i
i2
i
n
1i
i
n
1ii
n
1iii
n
1i
yynxxn
yxyxn
r
)()()()(
2. การประมาณคาแบบชวงของสมประสทธสหสมพนธ
เนองจากคาสมประสทธสหสมพนธมคาไมเทากบ 0 ดงนนการแจกแจงของสมประสทธสหสมพนธจงไมเปนสมมาตร เพอใหการแจกแจงของสมประสทธสหสมพนธเปนสมมาตร จงตองเปลยนคา xyr เปน rZ ตามวธการของ Fisher ดงน
r1
r1n1
2
1Zr
จะได rZ มการแจกแจงแบบปกตดวยคาเฉลย
1
1ln
2
1Zr
ความ
แปรปรวน 3
12
nZr
นนคอ ),ln(~3n
1
1
1
2
1NZr
249
ดงนนจะได 3nZ
ZZ
Zrr
Zr
Zrr
)(
ในการประมาณคาแบบชวงของ ตองเปลยนขอบเขตบนและขอบเขตลางของการประมาณคาแบบชวงเปนขอบเขตบนของ ( U ) และขอบเขตลางของ ( L ) เสยกอนโดยท
1e
1e
Zu2
Zu2
U
และ
1e
1e
L
L
Z2
Z2
L
ดงนนชวงความเชอมน %)( 1001 ของ คอ UL
ตวอยาง 8.2 จากตวอยาง 8.1 คะแนนสอบวชาเศรษฐศาสตรและมานษยวทยาจะประมาณคาแบบชวงของ ทความเชอมน 95 %
จาก rZ =
r1
r1
2
1ln
=
93501
93501
2
1
.
.ln
= 77292
1.ln
= ).( 3932
1
= 671. จะได %)( 1001 ของ rZ คอ
3nzZr
2
= 312
961671
.).(
ดงนน 021Z322Zu L .. และ
จาก 1e
1e
Zu2
Zu2
U
และ
1e
1e
L
L
Z2
Z2
L
980
54104
54102
1e
1e
3222
3222
U
.
.
.
).(
).(
770
698
696
1e
1e
0212
0212
L
.
.
.
).(
).(
หมายความวาทระดบความเชอมน 95 % สมประสทธสหสมพนธของคะแนนสอบวชาเศรษฐศาสตร กบวชามานษยวทยามคาในชวง 0.77 ถง 0.98
250
การทดสอบสมมตฐานเกยวกบสมประสทธสหสมพนธ ( )
เปนการทดสอบวาตวแปรXและตวแปรYมความสมพนธกนหรอไม
สมมตฐานเชงสถต 0H0 : หรอ :0H X และ Y ไมมความสมพนธเชงเสนตรง 0H1 : หรอ :1H X และ Y มความสมพนธเชงเสนตรง
เนองจาก 0 จะไดวา r มการแจกแจงแบบปกต และมสวนเบยงเบนมาตรฐาน
คอ )/()( 2nr1 2
ตวสถตทดสอบจงแบงออกเปน 2 กรณ ดงน กรณ n 30
ตวสถตทดสอบ 2nr1
0rT
2
)(
คาวกฤต 2n
22n
2
tt
,,
,
กรณ n > 30
ตวสถตทดสอบ 2nr1
0rZ
2
)(
คาวกฤต 22
zz ,
ในบางกรณความตองการทดสอบสมมตฐานวา ส.ป.ส สหสมพนธมคาเทากบคาใดคาหนงหรอไม (หมายความวา 00 ) จะตองเปลยนคา r ใหเปน Zr rเสยกอนโดยท
r1
r1
2
1Zr ln และ
3n
1
1
1
2
1NZr ,ln~
ดงนน ตวสถตทดสอบ )( 3n
1
ZZrZ 0
โดยท
0
00
1
1
2
1Z
ln
คาวกฤต 22
zz ,
251
ตวอยาง 8.3 จากตวอยาง 8.1 คะแนนสอบวชาเศรษฐศาสตรกบมานษยวทยา ตองการทดสอบวาคะแนนทงสองวชามความสมพนธในรปเชงเสนตรงหรอไม ทระดบนยส าคญ 0.05
H0: คะแนนวชาเศรษฐศาสตรกบมานษยวทยาไมมความสมพนธเชงเสนตรง H1: คะแนนวชาเศรษฐศาสตรกบมานษยวทยามความสมพนธเชงเสนตรง หรอ 0H0 :
0H1 :
ตวสถตทดสอบ 2nr1
0rT
2
/)(
= 21293501
9350
2 /).(
.
= 101260
9350
/.
.
= 8.33
คาวกฤต 2282tt 1002502n
2
.,.,
2282tt 1002502n
2
.,.,
เนองจาก T = 8.33 มากกวา t 0.025,10 = 2.228 มคาอยในบรเวณปฏเสธ H0หมายความวา คะแนนวชาเศรษฐศาสตรและวชามานษยวทยามความสมพนธเชงเสนตรง อยางมนยส าคญทระดบ 0.05
การวเคราะหการถดถอย (Regression Analysis)
เปนการศกษาถงความสมพนธของตวแปรตงแต 2 ตวขนไป โดยมวตถประสงคทจะประมาณหรอพยากรณคาของตวแปรหนง จากตวแปรอน ๆ ทมความสมพนธกบตวแปรทตองการพยากรณ โดยจะตองมการก าหนดหรอทราบคาของตวแปรอน ๆ ลวงหนา ในทนเรยกวาตวแปรอสระ (Independence Variable) จงจะท าใหทราบคาของตวแปรอกตวหนง ซงในทนเรยกวาตวแปรตาม (Dependence Variable) เชน เมอทราบวาราคาทดนกบขนาดของทดนมความสมพนธกนแลว และคดวาราคาทดนขนอยกบขนาดของทดนหรอขนาดของทดนมผลตอราคาทดน นนคอขนาดทดนเปนตวแปรอสระ และราคาทดนเปนตวแปรตาม หมายความวาเมอก าหนดขนาดของทดนจะ
252
ท าใหประมาณหรอพยากรณราคาทดนนนได และสามารถศกษาการเปลยนแปลงของราคาทดนเมอขนาดของทดนเปลยนแปลงไป โดยอาศยหลกการของการวเคราะหการถดถอย ดงนนวตถประสงคของ การวเคราะหการถดถอย คอพยากรณคาตวแปรตามในอนาคต เมอก าหนดคาตวแปรอสระ
หมายเหต โดยทวไปมกใหตวแปรอสระแทนดวย X และตวแปรตามแทนดวย Y
การทจะน าตวแปร X มาพยากรณ Y ไดนน ตวแปร X และ Y จะตองมความสมพนธกน (จากแผนภาพการกระจาย) ถาตวแปรX และ Y มความสมพนธเชงเสนตรงและ คาของ Y ขนอยกบคาของ X จะเรยกการถดถอยนนวาการวเคราะหการถดถอยเชงเสน (Linear Regression Analysis)
ถาตวแปร X และ Y มความสมพนธเชงเสนตรง และตวแปร Y ถกพยากรณดวยตวแปร X เพยง 1 ตวจะเรยกวา การถดถอยเชงเสนอยางงาย (Simple Linear Regression)
ถาตวแปร X และ Y มความสมพนธเชงเสนตรง และตวแปร Y ถกพยากรณดวยตวแปร X มากกวา 1 ตวจะเรยกวาการถดถอยเชงเสนพหคณ (Multiple Linear Regression)
ซงในเอกสารฉบบนจะศกษาเฉพาะ Simple Linear Regression เทานน
การวเคราะหการถดถอยเชงเสนอยางงาย (Simple Linear Regression Analysis)
หลกการของการวเคราะหการถดถอยคอใชขอมลเมอก าหนดคาตวแปรอสระ (X) แลวท าใหเกดคาตวแปรตาม (Y) ในอดตน ามาสรางสมการเชงเสนทเหมาะสมทสด เพอพยากรณคา Y ในอนาคต
แตในบางครงคาของ x และ y ทเกดขนนนอาจสรางสมการเชงเสนตรงไดหลายเสน คอนดบ (x,y) อาจไมอยในแนวเสนตรงเดยวกนทงหมด ดงรป
253
ตวอยาง 8.4 รายจายมกขนอยกบรายไดเสมอ หากตองการพยากรณคาของรายจายในอนาคตเมอก าหนดรายไดจงท าการบนทกขอมลรายได และรายจายของครอบครว โดยท X เปนตวแปรอสระแทนเงนเดอน (พนบาท)
Y เปนตวแปรตามแทนรายจาย (พนบาท) ไดขอมลดงน
เมอน าขอมลนมาเขยน scatter diagram จะไดดงรป
จะเหนวาจากขอมลขางตนอาจสามารถสรางสมการเชงเสนตรงได 2 เสนคอ L1และ
L2ถาก าหนดใหสมการทวไปของL1และ L2คอ L1 : Y = A1 + B1 x L2 : Y = A2 + B2 x
ครอบครวท รายได X (พนบาท) รายจาย Y (พนบาท) 1 2 3 4 5 6 7 8 9
10
8 8 9 9
10 10 12 12 14 15
7 8 8
10 8 9 9
11 12 14
L1
L2
254
การพจารณาดวยสายตาวาควรใช L1 หรอ L2 ในการพยากรณคา Y นนท าใหตดสนใจล าบาก จงมแนวคดทางคณตศาสตรมาชวยในการตดสนใจเลอกสมการเชงเสนตรงทเหมาะสมทสด วธนนคอวธก าลงสองนอยทสด (Least Square Method)
1. วธก าลงสองนอยทสด (Least Square Method)
หลกการของวธก าลงสองนอยทสด คอเลอกสมการถดถอยเชงเสนทใหคาความคลาดเคลอนระหวางคาสงเกตของ y (คาจรง) กบคาประมาณของ y หรอคาจากสมการ )ˆ( y นอยทสด พจารณาขอมลตอไปน
ล าดบท x y 1 1 10 2 2 30 3 3 50
สามารถสรางสมการเชงเสนได 3 สมการ x1010yL 11 ˆ: x15yL 22 ˆ: x2010yL 33 ˆ:
ค านวณหาความคลาดเคลอนระหวาง y กบ y
ความคลาดเคลอน x y 1y 2y 3y 1yy ˆ 2yy ˆ 3yy ˆ 1 10 20 15 10 -10 5 0 2 30 30 30 30 0 0 0 3 50 40 45 50 10 5 0
ผลรวมความคลาดเคลอน 0 0 0 เมอน ามาค านวณก าลง 2 ของความคลาดเคลอนจะได ดงน 2
1yy )ˆ( 22yy )ˆ( 2
3yy )ˆ( 100 25 0 0 0 0 100 25 0 ผลรวม 200 50 0
255
จะเหนวาสมการเชงเสน L3ยงใหคาผลรวมก าลงสองต าสด และเมอพจารณาจากกราฟ
จะเหนวา L3เปนเสนกราฟดทสด โดยปกตเรานยามวาเสนตรงทดควรมคาความ
คลาดเคลอนระหวางเสนตรงกบจดขอมลนอยทสด และเรยกเสนตรงนนวา สมการถดถอยเชงเสนอยางงายวธการก าลงสองนอยทสดจะเลอกสมการทใหความคลาดเคลอนระหวาง y กบ yนอยทสดเชนกน
สรปสมการถดถอยเชงเสนอยางงายทจะเปนตวแทนแสดงความสมพนธเชงเสนระหวางตวแปรอสระ (X) และตวแปรตาม (Y) จงหมายถงสมการเสนตรงทท าใหผลรวมก าลงสองของความคลาดเคลอน ))ˆ(( 2yy มคาต าสด โดยอาศยวธการก าลงสองนอยทสด
2. ประโยชนของสมการถดถอยเชงเสน
สมการถดถอยเชงเสนสามารถใชประโยชนในการแสดงความสมพนธของตวแปร Xกบ Yใน2 ประการ ดงน
1. ใชในการประมาณคา (estimation) เชนในการศกษาคาสมพนธระหวางปรมาณหมกทใชกบความเรวทพมพ
ถาให Y แทนปรมาณหมกทใช X แทนความเรวในการพมพ เราอาจท าการทดลองหาปรมาณหมกทใชในแตละระดบของความเรวในการ
พมพแลวน ามาใชในการหาสมการประมาณคาปรมาณหมกทใชในระดบความเรวตาง ๆ 2. ใชในการพยากรณ (forecasting) เชน ถา X คอป พ.ศ. Y คอปรมาณการสงออก
ของผลไมไทย การบนทกปรมาณการสงออกของผลไมไทยในปตาง ๆ ทผานมา ท าใหเราสามารถใชสมการถดถอยพยากรณปรมาณการสงออกของผลไมไทยใน 5 หรอ 10 ปขางหนาได
L1
L2
L3
256
3. ตวแบบ (Model) ขอสมมต (Assumptions) และวธการหาสมการถดถอยเชงเสนอยางงาย
3.1 ตวแบบ โดยทวไปสมการถดถอยเชงเสนอยางงายจะมตวแบบดงน
XY 10
โดยท 0 เปนจดตดแกน Y หรอคาของ y เมอ x=0 1 คออตราการเปลยนแปลงของ Y เมอ X เปลยนไป 1 หนวย หรอเรยกวา สมประสทธถดถอย (regression coefficient) คอ คาคลาดเคลอนเชงสม (error) 3.2 ขอสมมตของสมการถดถอยเชงเสน
จากหลกการของการถดถอยเชงเสน คอก าหนดคาของตวแปรอสระ X ท าใหเกดตวแปรตาม Y จะเหนวาตวแปร X เปนตวแปรทใชควบคม (Fixed Variable) ถกก าหนดคา หรอถกสงเกต หรอมผลตอตวแปร Y ดงนน Y จงเปนตวแปรสม เชน
ปรมาณปยมผลตอปรมาณผลผลตขาว X Y (ควบคม) (ตวแปรตาม)
คะแนนสอบเขามผลตอเกรดเฉลยชนปท 1 X Y (สงเกต) (ตวแปรตาม) จะเหนวาตวแปรอสระ 1 คา สามารถมคา Y ทเปนไปไดมากมายหลายคา ดงรป
257
ซงการใชสมการถดถอยท าการประมาณ คา Y นน จงท าใหเกดความคลาดเคลอนขน ( i ) ซงความคลาดเคลอนนประกอบดวยความคลาดเคลอน 2 สวนใหญ ๆ คอ
สวนท 1 ความคลาดเคลอนสมซงเกดจากการทมปจจยอน ๆ ทมผลตอตวแปรตามแตไมไดน ามารวมกน และความผดพลาดในการวดคา (พจารณาเฉพาะความคลาดเคลอนในตวแปรตาม)
สวนท 2 ความคลาดเคลอนเนองจากใชตวแบบไมเหมาะสม (Lack of fit) เชนความสมพนธระหวาง x กบ y จรง ๆ เปนเสนโคง แตตวแบบทใชในการวเคราะหเปนเสนตรง เปนตน (ความคลาดเคลอนประเภทนจะไมกลาวถงรายละเอยด ดงนนส าหรบการวเคราะหการถดถอยตอไปนจะสมมตวาตวแบบทใชเหมาะสม)
ดวยเหตผลนในการหาสมการถดถอยเชงเสนโดยวธก าลงสองนอยทสดวาตองมขอสมมตเกยวกบความคลาดเคลอน ( i ) ดงตอไปน
1. i ของตวแปรอสระแตละคาไมสมพนธกน 2. i ของตวแปรแตละคาเปนตวแปรสมและ i ~N(0,2) เนองจาก Y~N(0,2)
ภายใตเงอนไขขอน จะตองน าไปใชในการทดสอบสมมตฐานและการหาชวงเชอมนตอไป ขอสมมตในขอ 2 เปนสวนส าคญมาก นนคอถา ),0(N~ 2
i ไมเปนจรงวธการทใชในการประมาณคา 10 , จะไมเปนไปตามทควรเปน ดงน นควรตรวจสอบเสมอวา
),(~ 2i 0N หรอไม
3.3 การสรางสมการถดถอยเชงเสนอยางงาย จากตวแบบสมการถดถอยเชงเสน XY 10 เปาหมายคอตองการ
หาคา 10 , ทท าใหผลรวมของความคลาดเคลอนเปนศนย ( 0i ) และผลรวมก าลงสอง
ของความคลาดเคลอน ( 2i ) นอยทสด แตในความเปนจรงเราไมสามารถหาคาพารามเตอร
10 , จงตองอาศยคาจากตวอยางเพอหาคาประมาณของ 10 , ในตวแบบสมการถดถอยเชงเสนจากตวอยาง ดงน
i10 ebby ˆ
เมอ y แทนคาประมาณของ y b0 แทนคาประมาณของ 0
b1 แทนคาประมาณของ 1 ei แทนคาประมาณของ i หรอเรยกวาสวนเหลอ (residual)
258
3.4 การประมาณคาพารามเตอร 10 , การหาคา b0 และ b1 มดวยกนหลายวธ แตคาประมาณทไดจากวธก าลงสอง
นอยทสดจะท าใหผลรวมของก าลงสองของผลตางระหวาง y กบ y มคานอยทสด โดยท
n
xb
n
yb i1i
0
หรอ xbyb 10
1b2
i2
i
iiii
xxn
xyyxn
)(
ตวอยาง 8.5 จากตวอยาง 8.4 ขอมลรายจายกบรายได จงหาสมการถดถอยเชงเสนอยางงาย ตวแบบสมการถดถอยเชงเสนอยางงาย i10 ebby ˆ
1b = 2
i2
i
iiii
xxn
xyyxn
)(
= 2107119910
10796107010
)()(
))(()(
= 0.791 0b = xby 1 = (9.6)-(0.791)(10.7) = 1.1363
ดงนนสมการถดถอยเชงเสน คอ y = 1.1363 + 0.791X หมายความวาถารายไดเพมขน 1 พนบาท รายจายจะเพมขน 0.791 พนบาท หรอถารายไดลดลง 1 พนบาท รายจายจะลดลง 0.791 พนบาท
การประมาณคาและการทดสอบสมมตฐาน
1. การประมาณคา 0
เนองจาก b0 เปนตวประมาณทไมเอนเอยงของ 0 ทม v(b0) =
2
i
2
i2
xxn
x
)(
259
ดงนนจะได )1,0(N~
)xx(n
x
b
)b(v
bz
2i
2i
00
0
00
แตเนองจากไมทราบ 2 จะตองประมาณ 2 ดวย s2 = 2n
yy 2i
)ˆ( ซงเปนตว
ประมาณทไมเอนเอยงของ 2 จะไดวา
t = 2ndf
2i
2i
10 t~
)xx(n
xs
b
ดงนนชวงความเชอมน 100(1- )% ของ 0 คอ
2
i
2i
2n2
0xxn
xstb
)(,
2. การทดสอบสมมตฐานของ 0
เปนการทดสอบสมมตฐานวาเสนถดถอยนผานจดก าเนดหรอไม ดงนน
สมมตฐานเชงสถต H0 : 0 = 00 (คาคงท) H1 : 000 H1 : 0>00 H1 : 0<00
ตวสถตทดสอบ
2i
2i
000
xxn
xs
bt
)(
คาวกฤต 2n
2
t
,
หรอ 2nt , หรอ 2nt ,
260
3. การประมาณคา 1
เนองจาก b1 เปนตวประมาณทไมเอนเอยงของ 1 ทม v(b1) = 2
i
2
xx )(
ดงนนจะได ),(~
)(/
10N
xx
bz
2i
11
แตเนองจากไมทราบ 2 จงประมาณ 2ดวย s2 = 2n
yy 2i
)ˆ(
ซงเปนตว
ประมาณทไมเอนเอยงของ 2จะไดวา
2ndf2
i
11 t~
)xx(/s
bt
ดงนนชวงความเชอมน 100(1- )% ของ 1 คอ
2i
2n2
1 xxstb )(/,
4. การทดสอบสมมตฐานของ 1
เปนการทดสอบสมมตฐานวาตวแปร X มผลตอตวแปร Y หรอไม
สมมตฐาน H0 : 1 = 10 (คาคงท) H1 : 1 > 10 (มความสมพนธในทางบวก) H1 : 1 < 10 (มความสมพนธในทางลบ) H1 : 1 10 (มความสมพนธกน)
ตวสถตทดสอบ
2i
101
xxs
bt
)(/
คาวกฤต 2nt , หรอ 2nt , หรอ
2n2
t
,
261
สรปขนตอนการวเคราะหการถดถอยและสหสมพนธอยางงาย 1. พจารณา X ทมผลตอ Y มากทสด 2. ดความสมพนธของ X และ Y จาก Scatter diagram 3. หาสมประสทธสหสมพนธ ประมาณคา และทดสอบสมมตฐาน 4. ประมาณคา 0 และ 1 และทดสอบสมมตฐาน 0และ 1
ตวอยาง 8.6 จากตารางแสดงจ านวนชวโมงเฉลยในการท าการบานตอสปดาหของนกศกษา 6 คน กบเกรดเฉลยทนกศกษาไดในภาคเรยนนน เปนดงน
จ านวนชม.เฉลยในการท าการบาน (x)
เกรดเฉลย (y)
15 28 13 20 4
10
2.0 2.7 1.3 1.9 0.9 1.7
วธท า จาก 623yxn
1xysxy .))((
344xn
1xs 22
xx )(
9151yn
1ys 22
yy .)(
หรอ
9194530
yynxxn
yxxynr
ss
sr
2222
yyxx
xyxy
.
)()(
ประมาณคา โดย แปลง r เปน 591r1
r1
2
1Zr .
)(
)(ln
262
ทระดบความเชอมน 95% ชวงความเชอมนของ rz คอ
131591
36
961591
3n
z
Zr 2
..
).(.
จะได 95% CI of rz คอ 722460
rz ..
ทระดบความเชอมน 95% ชวงความเชอมนของ คอ UL โดยท
990
44231
44229
1e
1e
u
u
U z2
z2
.
.
.
และ
430
513
511
1e
1e
L
L
L z2
z2
.
.
.
ทระดบความเชอมน 95% ชวงความเชอมนของ คอ 990430 ..
หาคา b0 และ b1
จาก 068600
xxn
yxyxnb
2i
2i
iiii1
.
)(
720930
xbyb 10
.
สมการถดถอยเชงเสนคอ x06860720930y ..ˆ
ทดสอบสมมตฐาน 0H
0H
11
10
:
: เมอ 050.
ตวสถตทดสอบ
2i
11
xxs
bt
)(/
โดยท 27202n
SSEs .
3442720
006860
/.
.
= 4.678
คาวกฤต t0.025,24 = 2.776
เนองจาก t = 4.678 อยในบรเวณปฏเสธ H0 แสดงวา 1 0 นนคอ x และ y มความสมพนธเชงเสน ทระดบนยส าคญ 0.05
263
ประมาณคา 1 ทระดบความเชอมน 95% ชวงความเชอมนของ 1คอ
xx2n2
1s
stb
,
= ).(. 01466507762b1
= 0.06860 0.0471
ดงนนทระดบความเชอมน 95% ชวงความเชอมนของ 1คอ 0.0215 ≤1≤ 0.1157
การใชโปรแกรมส าเรจรป
ใชขอมลจากตวอยางท 8.1 ดงนนการใสขอมลใน Microsoft Excel เปนดงน
1. การตรวจสอบความสมพนธดวยแผนภาพการกระจาย
ขนตอนท 1 เลอก cell ขอมล เลอกเมน Insert เลอก Chart เลอก XY(Scatter) ดงรป
264
ขนตอนท 2 ใสขอมลใน Chart Wizard ขนตอนท 3 จะไดผลลพธ ดงรป
265
2. การหาคาสมประสทธสหสมพนธ
ขนตอนท 1 เมน Tools เลอก Data Analysis เลอก Correlation ดงรป
ขนตอนท 2 ในสวน Input Range ใหใส cell ทเปนขอมลทงหมด ในสวน Group By เปนการเลอกการแบงกลมของขอมล
266
ขนตอนท 3 จะไดผลลพธ ดงรป
935.0r หมายความวาคะแนนสอบวชาเศรษฐศาสตร และวชามานษยวทยา ของนกศกษา 12 คนมความสมพนธอยางมากในเชงบวก
3. การสรางสมการถดถอย
ขนตอนท 1 ใสขอมลดบ เลอกเมน Tools เลอก Data Analysis เลอก regression ดงรป
267
ขนตอนท 2 เลอกเมน Tools เลอก Data Analysis เลอก regression ดงรป
ขนตอนท 3 ในสวน Input Y Range ใหใส cell ทเปนขอมลตวแปรตาม ในสวน Input X Range ใหใส cell ทเปนขอมลตวแปรอสระ
จะไดผลลพธ ดงน
268
ดงนนสมการถดถอยเชงเสน คอ y = 1.1363 + 0.791X หมายความวาถารายไดเพมขน 1 พนบาทรายจายจะเพมขน 0.791 พนบาท หรอถารายไดลดลง 1 พนบาท รายจายจะลดลง 0.791 พนบาท
สรปทายบท
สหสมพนธและการวเคราะหการถดถอยเปนเทคนคการวเคราะหขอมลในทางสถตเพอหาความสมพนธของขอมล หรอตวแปรตงแต 2 ตว ถาขอมลทง 2 ชดเปนขอมลเชงปรมาณ หรอตวแปร 2 ตวแปรเปนตวแปรแบบตอเนองการหาความสมพนธจะเรยกวาสหสมพนธอยางงาย และวดระดบควาสมพนธโดยใชสมประสทธสหสมพนธเพยรสน และถาขอมล หรอตวแปรตวหนงเปนตวแปรทมคาตามทก าหนดหรอมผลตอตวแปรอกตวหนงจะเรยกตวแปรนวาตวแปรอสระ สวนตวแปรทมคาเปลยนไปตามคาของตวแปรอสระเรยกวาตวแปรตาม เมอตวแปรอสระและตวแปรตามมความสมพนธกน และตองการพยากรณคาของตวแปรตามเมอก าหนดคาตวแปรอสระโดยอาศยหลกการของการวเคราะหการถดถอย ดงนนวตถประสงคของ การวเคราะหการถดถอย คอพยากรณคาตวแปรตามในอนาคต เมอก าหนดคาตวแปรอสระ
แบบฝกหดทายบท
1. นายแพทยผหนงตองการศกษาเกยวกบความสมพนธระหวางน าหนก(Y) และความดนโลหต(X) ของชายอาย 25-30 ป จงท าการสมตวอยางชายอาย 25-30 ปจ านวน 26 คน แลววดน าหนกกบความดนโลหต ไดผลดงน
คนท น าหนก ความดนโลหต 1 165 130 2 167 133 3 180 150 4 155 128 5 212 151 6 175 146 7 190 150 8 210 140 9 200 148
269
คนท น าหนก ความดนโลหต 10 149 125 11 158 133 12 169 135 13 170 150 14 172 153 15 159 128 16 168 132 17 174 149 18 183 158 19 215 150 20 195 163 21 180 156 22 143 124 23 240 170 24 256 165 25 192 160 26 187 159
นายแพทยผนตองการทราบวา 1.1 น าหนกกบความดนโลหตของชายอาย 25-30 ป จะมความสมพนธกบในระดบใด ทชวง
ความชอมน 95% 1.2 น าหนกกบความดนโลหตจะมความสมพนธกนในระดบสง ดวยสมประสทธสหสมพนธ
เทากบ 0.9 หรอไม ทระดบนยส าคญ 0.05 2. ขอมลตอไปนสมมาจากการศกษาการขาดงานของลกจาง 15 คน โดยก าหนดให
X คอจ านวนการขาดงานในชวง 6 เดอนแรก(วน) Y คอจ านวนการขาดงานในชวง 6 เดอนหลง(วน)
จ านวนการขาดงาน 6 เดอนแรก (X) 7 6 8 6 1 1 1 0 1 0 0 6 0 0 6 6 เดอนหลง (Y) 2 1 1 3 5 7 6 8 5 7 5 1 4 2 3
ก าหนด 318y261x93xy60y43x 22 ,,,,
270
2.1 จงอธบายความสมพนธระหวางจ านวนการขาดงานของลกจางในชวง 6 เดอนแรก และ 6 เดอนหลง ดวยคาสมประสทธสหสมพนธ
2.2 การขาดของลกจางในชวง 6 เดอนแรก และ 6 เดอนหลง สมพนธกนอยางมนยส าคญทระดบ 0.05 หรอไม