การร่างหนังสือราชการ · คือ จะต้องการทราบว่าหนังสือที่จะร่างเป็นหนังสือประเภทใด
สถิติ ( Statistics) · • P-value คือ...
Transcript of สถิติ ( Statistics) · • P-value คือ...
24/06/56
1
Medical statistics
(QUANTITATIVE METHOD V)
หลกสตรเวชศาสตรชมชน RACM 302
1
2
สถต (Statistics) • วชาสถตเปนวชาทเกยวกบวธการรวบรวม ขอมล จดการ วเคราะห น าเสนอ แปลผลและหาขอสรปจากขอมล
24/06/56
2
3
สถตเชงพรรณนา (Descriptive statistics)
• บรรยายและสรปลกษณะของขอมล
เชน ประชากรในชมชนน มน าหนก สวนสง สดสวนเพศชายหญง ระดบความดนเลอดฯลฯ เปนเทาไร
4
สถตเชงอนมาน (Inferential statistics)
• หาขอสรปของประชากร จากขอมลทเกบไดในกลมตวอยาง
เชน สมตวอยาง นศพ.ชาย 50 คน ไดสวนสงเฉลยเทากบ 170 ซม. เพอตองการหาสวนสงเฉลยใน นศพ.ชายทงหมดวา เปนเทาไร
24/06/56
3
5
Statistics
Descriptive
Statistics
Inferential
Statistics
Includes Collecting Organizing Summarizing Presenting data
Includes Estimation Hypothesis testing Determining relationships Making predictions
6
Parameter & Statistic
• Parameter คอคาของประชากรทงหมด
• Statistic คอคาทหาไดในกลมตวอยาง
24/06/56
4
7
ตวแปร (Variable)
• หมายถงลกษณะ (characteristic) ของขอมลเชน อาย เพศ นาหนก ระดบนาตาล ความดนเลอด การหายหรอตายจากโรค ฯลฯ
8
ตวแปร (variable)
• Qualitative (Discrete) - nominal - ordinal
• Quantitative (continuous) - interval - ratio
24/06/56
5
9
Scale of measurement • Nominal variable (nominal = name) : บอกลกษณะ เชน blood group, sex, cause of death • Ordinal variable (ordinal = order) : บอกล ำดบ เชน severity of disease (mild, moderate, severe), กำรสบบหร (<= 10 มวน, 11-20 มวน, >20 มวนตอวน)
10
Scale of measurement • Ratio variable : วดตอเนองไดถงทศนยมไมรจบ มศนยทแทจรง เชน น ำหนก สวนสง ระดบไขมน องศำเคลวน
• Interval variable : วดตอเนองได แตมศนยทไมแทจรง เชน อณหภมองศำเซลเซยส
24/06/56
6
11
Descriptive Statistics • กำรวดแนวโนมเขำสสวนกลำง
(Measure of central tendency) – เปนกำรบอกคำกลำงของชดขอมลวำเปนเทำใด – ตวช วดทนยมใชไดแก Mean, Median และ Mode
12
ค ำจ ำกดควำม
Mean = คำเฉลยของชดขอมล
Median = คำทอยกงกลำงของขอมลทเรยงล ำดบ
Mode = คำทมควำมถ (พบ) มำกทสด
n
xx i
24/06/56
7
13
เปนกำรบอกถงกำรกระจำยตวของชดขอมลวำมมำกนอยเพยงไร
ตวช วดทนยมใชไดแก Range, Standard deviation, Variance และ Interquartile range
กำรวดควำมแปรปรวน (Measure of variability)
14
ค ำจ ำกดควำม Range = คำมำกสด ลบ คำนอยสด Variance = S.D. = Square root ของ variance Interquartile range = Q3 – Q1 หรอ P75 - P25
N
)x( 2i
N1i2
24/06/56
8
Coefficient of Variation (C.V.)
15
ประถมปท 6 มธยมศกษาปท 6
อาย (เฉลย) 11 17
สวนสง (เฉลย) 140 170
S.D. 10 10
ตำรำง เปรยบเทยบสวนสง ของ นกเรยนชนประถมปท 6 และมธยมศกษำปท 6
16
Coefficient of Variation (C.V.)
• สรปไมได
• นำจะเทยบควำมแปรปรวนกบคำเฉลย
24/06/56
9
17
Distribution
18
Distribution
24/06/56
10
19
Distribution
20
กำรแปลผลคำ S.D.
tsmeasuremen the of 68%ely approximat contains )sx,sx(
tsmeasuremen the of 95%ely approximat contains )s2x,s2x(
tsmeasuremen the of allvirtually contains )s3x,s3x(
24/06/56
11
21
Inferential statistics
• Estimation เปนกำรประมำณคำในประชำกรจำกขอมลในกลมตวอยำง เชน ควำมดนเลอดสงในกลมประชำชนอำยต งแต 40 ปข นไปในชมชนเปนเทำไร
22
Estimation
• การศกษาในกลมตวอยางยอมไดคาในกลม ตวอยาง (sample estimate) จงตองหาคาในประชากร (population estimate) วาเปนเทาใด
• วธการหาคา population estimate ไดแก การหาคา confidence interval
24/06/56
12
23
การแปลผล confidence interval Prevalence ของ HT ในชมชน ก. เทำกบ 30%
(95% C.I. = 27%-33%) แปลผลวำ Prevalence ของ HT ในชมชน ก. นำจะมคำอยระหวำง 27% - 33% ดวยควำมเชอมน 95%
Sample estimate = 30% Population estimate = 27% – 33%
24
Inferential statistics
• Hypothesis testing เปนกำรพสจนสมมตฐำนวำมควำมสมพนธระหวำงตวแปรหรอไม
เชน มควำมแตกตำงกนระหวำงกลมหญงและชำยหรอไมในกำรมภำวะควำมดนเลอดสง
24/06/56
13
25
Hypothesis testing • กำรศกษำหรอวจยมกจะมกำรต งสมมตฐำนเพอทดสอบ • สมมตฐำนทต งไวโดยทวไปจะม 2 สมมตฐำน ไดแก 1. Null hypothesis หรอสมมตฐำนของควำมไมแตกตำง เชน ไมมควำมแตกตำงของ ควำมชกส ำหรบภำวะ HT ระหวำงประชำกรชำยและหญง ( difference = 0)
2. Alternative hypothesis หรอสมมตฐำนทำงเลอก เชน ม ควำมแตกตำงของ ควำมชกส ำหรบภำวะ HT ระหวำง ประชำกรชำยและหญง (difference ไมเทำกบ 0)
26
ขนตอนของ hypothesis testing 1. ต งสมมตฐำน 2. ก ำหนดเกณฑตำงๆ เชน ระดบนยส ำคญ 3. เกบขอมลจำกกลมตวอยำง 4. หำคำสถต (test statistics) 5. ค ำนวณคำ p (probability value) 6. สรปรบหรอปฏเสธสมมตฐำน
24/06/56
14
27
ขนตอนของ hypothesis testing 1. ต งสมมตฐำน 2. ก ำหนดเกณฑตำงๆ เชน ระดบนยส ำคญ 3. เกบขอมลจำกกลมตวอยำง 4. หำคำสถต (test statistics) 5. ค ำนวณคำ p (probability value) 6. สรปรบหรอปฏเสธสมมตฐำน
28
ตารางเปรยบเทยบผลการตรวจคดกรองความดนเลอดใน กลมชาย-หญงอายตงแต 40 ปขนไป
(observed table)
เพศ ควำมดนเลอดสง ควำมดนเลอดปกต รวม
ชาย 9 41 50
หญง 21 29 50
รวม 30 70 100
Chi-Square P-value
24/06/56
15
29
0)( eo
E
EOSquareChi
2
Chi-Square = 3.84 p-value 0.05
degree of freedom=1
30
ตารางเปรยบเทยบผลการตรวจคดกรองความดนเลอด ในกลมชาย-หญงอายตงแต 40 ปขนไป
(expected table)
เพศ ควำมดนเลอดสง ควำมดนเลอดปกต รวม
ชาย 15 35 50
หญง 15 35 50
รวม 30 70 100
Chi-Square P-value
a b
c d
24/06/56
16
31
ตารางเปรยบเทยบผลการตรวจคดกรองความดนเลอด ในกลมชาย-หญงอายตงแต 40 ปขนไป
เพศ ควำมดนเลอดสง ควำมดนเลอดปกต รวม
ชาย 9 41 50
หญง 21 29 50
รวม 30 70 100
Chi-Square 6.86 P-value 0.0088
32
การแปลผล hypothesis testing
• ระดบนยส าคญตงไวทระดบใด
.05 หรอ .01 หรอ .1
• ค านวณคา p ไดเทาไร
นอยกวาระดบนยส าคญทตงไวหรอไม
• ถานอยกวา แสดงวามนยส าคญทางสถต
24/06/56
17
33
การแปลผล hypothesis testing
• ถำเทำกบหรอมำกกวำ กไมมนยส ำคญทำงสถต • P-value คอ โอกำสทจะไดคำสถตตำมทพบในกลม
ตวอยำงหรอมำกกวำถำ null hypothesis เปนควำมจรง
34
การแปลผล ถำควำมชกของควำมดนเลอดสงในเพศชำยและหญง ไมแตกตำงกนโอกำสจะเหนควำมแตกตำงเชนน หรอมำกกวำโดยบงเอญมคำ นอยกวำ 0.0088 หรอ .88%
เรำจงเลอกสรปวำแตกตำงกน เพรำะโอกำสสรปผดมนอยกวำ 5%
24/06/56
18
35
โอกาสสรปผด กำรศกษำหรอวจยมโอกำสสรปผดได 2 ทำง 1. สรปผลวำมควำมแตกตำงในขณะทควำมจรงใน
ประชำกรไมม เรยกวำ เกด Type I (alpha) error
2. สรปผลวำไมมควำมแตกตำงในขณะทควำมจรงในประชำกรม เรยกวำ เกด Type II (beta) error
36
Ha Ho
Ha correct conclusion
Type I error
Ho Type II error
correct conclusion
True Reality
Your Decision
24/06/56
19
37
Power & Sample size • กรณไมพบนยส ำคญทำงสถต ตองสงสยวำกำรศกษำน ม
power เพยงพอหรอไม • Power คออ ำนำจกำรตรวจสอบควำมแตกตำงทอำจมอยจรงในประชำกร
• Power มคำเทำกบ 1- beta (1 – type II error) • Power จะข นอยกบ Sample size เปนหลก
38
วธกำรทำงสถตทใชบอย ในกำรทดสอบสมมตฐำน
1. t-test ทดสอบความแตกตางของ continuous variable ระหวาง 2 กลม
2. F-test ทดสอบความแตกตางของ continuous variable ระหวาง 3 กลมขนไป
3. Chi-square ทดสอบความสมพนธของ discrete variable ตงแต 2 กลมขนไป
4. Correlation ทดสอบความสมพนธระหวางตวแปรทเปน continuous variable
5. Regression ท านาย (predict) คา dependent variable จากคา independent variables
24/06/56
20
39
ตวอยาง t-test
• คำ uric acid ในเดก mongolism แตกตำงจำกเดกปกตหรอไม • Null hypothesis : คำ uric acid ในเดก mongolism เทำกบเดกปกต • ก ำหนดระดบนยส ำคญท .05 • เกบขอมลในกลมตวอยำงเดกท งสองกลม • น ำขอมลดบเขำโปรแกรมคอมพวเตอรโดยใชวธกำรทำงสถต t-test • ผล : คำ p-value = 0.02 จงปฏเสธ null hypothesis • สรปผลวำ ระดบ uric acid ในเดกท งสองกลมแตกตำงกน
40
ตวอยาง correlation analysis • คำ FBS สมพนธกบคำ HbA1C หรอไมในผปวยเบำหวำน
• Null hypothesis : คำ FBS ไมสมพนธกบคำ HbA1C ในผปวยเบำหวำน
• ก ำหนดระดบนยส ำคญท .05 • เกบขอมลคำ FBS และคำ HbA1C ในกลมตวอยำงผปวยเบำหวำน • น ำขอมลดบเขำโปรแกรมคอมพวเตอรโดยใชวธกำรทำงสถต correlation • ผล : คำ r = 0.8 คำ p-value = 0.03 จงปฏเสธ null hypothesis • สรปผลวำ คำ FBS กบคำ HbA1C มควำมสมพนธกนในระดบด
24/06/56
21
41
r =
+1
0
-1
Strong positive linear relationship
No linear relationship
Strong negative linear relationship
or
42
ภำคผนวก
24/06/56
22
43
ท าไมตอง Confidence interval
• ถาอยากรวาความสงเฉลยของนกเรยนชายมธยมปท6ทวประเทศ ปการศกษา 2550 มคาเทาไร ? ในอดตเคยมการศกษาในป การศกษา 2530 มคา population mean=165 ซ.ม. population standard deviation 10 ซ.ม.และความสงของนกเรยนชายมธยมปท6 มการกระจายแบบโคงปกต
44
Sample estimation
• ถาความสงเฉลยของนกเรยนชายมธยมปท6 ปการศกษา 2553 จ านวน 100 คนทไดจากการสมตวอยาง มคา sample mean = 170 ซ.ม. S.D.= 8 ซ.ม. ทานคดวาคา population mean มคาเทาไร
24/06/56
23
45
distribution of sample means
X
X
XX X X X X X
%9596.1 x
46
Population estimation
95% confidence interval ของ = = = 168-172 ซ.ม.
xx 96.1
100
10*96.1170
24/06/56
24
47
95% CI ส าหรบคา Prevalence
• ถำอยำกรวำนกเรยนแพทยช นป3 ทวประเทศเลอก ส.ส.ระบบสดสวนส ำหรบ พรรค ก.รอยละเทำไร ?
• ถำท ำกำรสมนกเรยนแพทยช นป3 ทวประเทศ มำ 100 คน พบวำ เลอกพรรค ก. 40% ซงเปน sample estimate
• กำรหำ Population estimate ท ำไดโดยใชสตร
95% CI ของ Prevalence (P) = 𝒑 ± 𝟏. 𝟗𝟔𝒑(𝟏−𝒑)
𝒏
48
95% CI ส าหรบคา Prevalence
• 95% CI ส ำหรบกำรเลอกพรรค ก.มคำ
• =
• = ( 0.304 -0.496 )
100
)4.01(*4.096.14.0
24/06/56
25
49
การประยกตคา 95%CI ส าหรบ sample size
จากสตร 95% CI ของ P =
interval =
=
n
ppp
)1(96.1
n
pp )1(96.1
dn
pp )1(96.1
2
2 )1(*
)2/1( d
ppZn