สถิติ ( Statistics) · • P-value คือ...

25
24/06/56 1 Medical statistics (QUANTITATIVE METHOD V) หลักสูตรเวชศาสตร์ชุมชน RACM 302 1 2 สถิติ (Statistics) วิชาสถิติเป็นวิชาที่เกี่ยวกับวิธีการรวบรวม ข้อมูล จัดการ วิเคราะห์ นาเสนอ แปลผล และหาข้อสรุปจากข้อมูล

Transcript of สถิติ ( Statistics) · • P-value คือ...

Page 1: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

1

Medical statistics

(QUANTITATIVE METHOD V)

หลกสตรเวชศาสตรชมชน RACM 302

1

2

สถต (Statistics) • วชาสถตเปนวชาทเกยวกบวธการรวบรวม ขอมล จดการ วเคราะห น าเสนอ แปลผลและหาขอสรปจากขอมล

Page 2: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

2

3

สถตเชงพรรณนา (Descriptive statistics)

• บรรยายและสรปลกษณะของขอมล

เชน ประชากรในชมชนน มน าหนก สวนสง สดสวนเพศชายหญง ระดบความดนเลอดฯลฯ เปนเทาไร

4

สถตเชงอนมาน (Inferential statistics)

• หาขอสรปของประชากร จากขอมลทเกบไดในกลมตวอยาง

เชน สมตวอยาง นศพ.ชาย 50 คน ไดสวนสงเฉลยเทากบ 170 ซม. เพอตองการหาสวนสงเฉลยใน นศพ.ชายทงหมดวา เปนเทาไร

Page 3: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

3

5

Statistics

Descriptive

Statistics

Inferential

Statistics

Includes Collecting Organizing Summarizing Presenting data

Includes Estimation Hypothesis testing Determining relationships Making predictions

6

Parameter & Statistic

• Parameter คอคาของประชากรทงหมด

• Statistic คอคาทหาไดในกลมตวอยาง

Page 4: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

4

7

ตวแปร (Variable)

• หมายถงลกษณะ (characteristic) ของขอมลเชน อาย เพศ นาหนก ระดบนาตาล ความดนเลอด การหายหรอตายจากโรค ฯลฯ

8

ตวแปร (variable)

• Qualitative (Discrete) - nominal - ordinal

• Quantitative (continuous) - interval - ratio

Page 5: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

5

9

Scale of measurement • Nominal variable (nominal = name) : บอกลกษณะ เชน blood group, sex, cause of death • Ordinal variable (ordinal = order) : บอกล ำดบ เชน severity of disease (mild, moderate, severe), กำรสบบหร (<= 10 มวน, 11-20 มวน, >20 มวนตอวน)

10

Scale of measurement • Ratio variable : วดตอเนองไดถงทศนยมไมรจบ มศนยทแทจรง เชน น ำหนก สวนสง ระดบไขมน องศำเคลวน

• Interval variable : วดตอเนองได แตมศนยทไมแทจรง เชน อณหภมองศำเซลเซยส

Page 6: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

6

11

Descriptive Statistics • กำรวดแนวโนมเขำสสวนกลำง

(Measure of central tendency) – เปนกำรบอกคำกลำงของชดขอมลวำเปนเทำใด – ตวช วดทนยมใชไดแก Mean, Median และ Mode

12

ค ำจ ำกดควำม

Mean = คำเฉลยของชดขอมล

Median = คำทอยกงกลำงของขอมลทเรยงล ำดบ

Mode = คำทมควำมถ (พบ) มำกทสด

n

xx i

Page 7: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

7

13

เปนกำรบอกถงกำรกระจำยตวของชดขอมลวำมมำกนอยเพยงไร

ตวช วดทนยมใชไดแก Range, Standard deviation, Variance และ Interquartile range

กำรวดควำมแปรปรวน (Measure of variability)

14

ค ำจ ำกดควำม Range = คำมำกสด ลบ คำนอยสด Variance = S.D. = Square root ของ variance Interquartile range = Q3 – Q1 หรอ P75 - P25

N

)x( 2i

N1i2

Page 8: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

8

Coefficient of Variation (C.V.)

15

ประถมปท 6 มธยมศกษาปท 6

อาย (เฉลย) 11 17

สวนสง (เฉลย) 140 170

S.D. 10 10

ตำรำง เปรยบเทยบสวนสง ของ นกเรยนชนประถมปท 6 และมธยมศกษำปท 6

16

Coefficient of Variation (C.V.)

• สรปไมได

• นำจะเทยบควำมแปรปรวนกบคำเฉลย

Page 9: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

9

17

Distribution

18

Distribution

Page 10: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

10

19

Distribution

20

กำรแปลผลคำ S.D.

tsmeasuremen the of 68%ely approximat contains )sx,sx(

tsmeasuremen the of 95%ely approximat contains )s2x,s2x(

tsmeasuremen the of allvirtually contains )s3x,s3x(

Page 11: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

11

21

Inferential statistics

• Estimation เปนกำรประมำณคำในประชำกรจำกขอมลในกลมตวอยำง เชน ควำมดนเลอดสงในกลมประชำชนอำยต งแต 40 ปข นไปในชมชนเปนเทำไร

22

Estimation

• การศกษาในกลมตวอยางยอมไดคาในกลม ตวอยาง (sample estimate) จงตองหาคาในประชากร (population estimate) วาเปนเทาใด

• วธการหาคา population estimate ไดแก การหาคา confidence interval

Page 12: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

12

23

การแปลผล confidence interval Prevalence ของ HT ในชมชน ก. เทำกบ 30%

(95% C.I. = 27%-33%) แปลผลวำ Prevalence ของ HT ในชมชน ก. นำจะมคำอยระหวำง 27% - 33% ดวยควำมเชอมน 95%

Sample estimate = 30% Population estimate = 27% – 33%

24

Inferential statistics

• Hypothesis testing เปนกำรพสจนสมมตฐำนวำมควำมสมพนธระหวำงตวแปรหรอไม

เชน มควำมแตกตำงกนระหวำงกลมหญงและชำยหรอไมในกำรมภำวะควำมดนเลอดสง

Page 13: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

13

25

Hypothesis testing • กำรศกษำหรอวจยมกจะมกำรต งสมมตฐำนเพอทดสอบ • สมมตฐำนทต งไวโดยทวไปจะม 2 สมมตฐำน ไดแก 1. Null hypothesis หรอสมมตฐำนของควำมไมแตกตำง เชน ไมมควำมแตกตำงของ ควำมชกส ำหรบภำวะ HT ระหวำงประชำกรชำยและหญง ( difference = 0)

2. Alternative hypothesis หรอสมมตฐำนทำงเลอก เชน ม ควำมแตกตำงของ ควำมชกส ำหรบภำวะ HT ระหวำง ประชำกรชำยและหญง (difference ไมเทำกบ 0)

26

ขนตอนของ hypothesis testing 1. ต งสมมตฐำน 2. ก ำหนดเกณฑตำงๆ เชน ระดบนยส ำคญ 3. เกบขอมลจำกกลมตวอยำง 4. หำคำสถต (test statistics) 5. ค ำนวณคำ p (probability value) 6. สรปรบหรอปฏเสธสมมตฐำน

Page 14: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

14

27

ขนตอนของ hypothesis testing 1. ต งสมมตฐำน 2. ก ำหนดเกณฑตำงๆ เชน ระดบนยส ำคญ 3. เกบขอมลจำกกลมตวอยำง 4. หำคำสถต (test statistics) 5. ค ำนวณคำ p (probability value) 6. สรปรบหรอปฏเสธสมมตฐำน

28

ตารางเปรยบเทยบผลการตรวจคดกรองความดนเลอดใน กลมชาย-หญงอายตงแต 40 ปขนไป

(observed table)

เพศ ควำมดนเลอดสง ควำมดนเลอดปกต รวม

ชาย 9 41 50

หญง 21 29 50

รวม 30 70 100

Chi-Square P-value

Page 15: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

15

29

0)( eo

E

EOSquareChi

2

Chi-Square = 3.84 p-value 0.05

degree of freedom=1

30

ตารางเปรยบเทยบผลการตรวจคดกรองความดนเลอด ในกลมชาย-หญงอายตงแต 40 ปขนไป

(expected table)

เพศ ควำมดนเลอดสง ควำมดนเลอดปกต รวม

ชาย 15 35 50

หญง 15 35 50

รวม 30 70 100

Chi-Square P-value

a b

c d

Page 16: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

16

31

ตารางเปรยบเทยบผลการตรวจคดกรองความดนเลอด ในกลมชาย-หญงอายตงแต 40 ปขนไป

เพศ ควำมดนเลอดสง ควำมดนเลอดปกต รวม

ชาย 9 41 50

หญง 21 29 50

รวม 30 70 100

Chi-Square 6.86 P-value 0.0088

32

การแปลผล hypothesis testing

• ระดบนยส าคญตงไวทระดบใด

.05 หรอ .01 หรอ .1

• ค านวณคา p ไดเทาไร

นอยกวาระดบนยส าคญทตงไวหรอไม

• ถานอยกวา แสดงวามนยส าคญทางสถต

Page 17: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

17

33

การแปลผล hypothesis testing

• ถำเทำกบหรอมำกกวำ กไมมนยส ำคญทำงสถต • P-value คอ โอกำสทจะไดคำสถตตำมทพบในกลม

ตวอยำงหรอมำกกวำถำ null hypothesis เปนควำมจรง

34

การแปลผล ถำควำมชกของควำมดนเลอดสงในเพศชำยและหญง ไมแตกตำงกนโอกำสจะเหนควำมแตกตำงเชนน หรอมำกกวำโดยบงเอญมคำ นอยกวำ 0.0088 หรอ .88%

เรำจงเลอกสรปวำแตกตำงกน เพรำะโอกำสสรปผดมนอยกวำ 5%

Page 18: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

18

35

โอกาสสรปผด กำรศกษำหรอวจยมโอกำสสรปผดได 2 ทำง 1. สรปผลวำมควำมแตกตำงในขณะทควำมจรงใน

ประชำกรไมม เรยกวำ เกด Type I (alpha) error

2. สรปผลวำไมมควำมแตกตำงในขณะทควำมจรงในประชำกรม เรยกวำ เกด Type II (beta) error

36

Ha Ho

Ha correct conclusion

Type I error

Ho Type II error

correct conclusion

True Reality

Your Decision

Page 19: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

19

37

Power & Sample size • กรณไมพบนยส ำคญทำงสถต ตองสงสยวำกำรศกษำน ม

power เพยงพอหรอไม • Power คออ ำนำจกำรตรวจสอบควำมแตกตำงทอำจมอยจรงในประชำกร

• Power มคำเทำกบ 1- beta (1 – type II error) • Power จะข นอยกบ Sample size เปนหลก

38

วธกำรทำงสถตทใชบอย ในกำรทดสอบสมมตฐำน

1. t-test ทดสอบความแตกตางของ continuous variable ระหวาง 2 กลม

2. F-test ทดสอบความแตกตางของ continuous variable ระหวาง 3 กลมขนไป

3. Chi-square ทดสอบความสมพนธของ discrete variable ตงแต 2 กลมขนไป

4. Correlation ทดสอบความสมพนธระหวางตวแปรทเปน continuous variable

5. Regression ท านาย (predict) คา dependent variable จากคา independent variables

Page 20: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

20

39

ตวอยาง t-test

• คำ uric acid ในเดก mongolism แตกตำงจำกเดกปกตหรอไม • Null hypothesis : คำ uric acid ในเดก mongolism เทำกบเดกปกต • ก ำหนดระดบนยส ำคญท .05 • เกบขอมลในกลมตวอยำงเดกท งสองกลม • น ำขอมลดบเขำโปรแกรมคอมพวเตอรโดยใชวธกำรทำงสถต t-test • ผล : คำ p-value = 0.02 จงปฏเสธ null hypothesis • สรปผลวำ ระดบ uric acid ในเดกท งสองกลมแตกตำงกน

40

ตวอยาง correlation analysis • คำ FBS สมพนธกบคำ HbA1C หรอไมในผปวยเบำหวำน

• Null hypothesis : คำ FBS ไมสมพนธกบคำ HbA1C ในผปวยเบำหวำน

• ก ำหนดระดบนยส ำคญท .05 • เกบขอมลคำ FBS และคำ HbA1C ในกลมตวอยำงผปวยเบำหวำน • น ำขอมลดบเขำโปรแกรมคอมพวเตอรโดยใชวธกำรทำงสถต correlation • ผล : คำ r = 0.8 คำ p-value = 0.03 จงปฏเสธ null hypothesis • สรปผลวำ คำ FBS กบคำ HbA1C มควำมสมพนธกนในระดบด

Page 21: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

21

41

r =

+1

0

-1

Strong positive linear relationship

No linear relationship

Strong negative linear relationship

or

42

ภำคผนวก

Page 22: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

22

43

ท าไมตอง Confidence interval

• ถาอยากรวาความสงเฉลยของนกเรยนชายมธยมปท6ทวประเทศ ปการศกษา 2550 มคาเทาไร ? ในอดตเคยมการศกษาในป การศกษา 2530 มคา population mean=165 ซ.ม. population standard deviation 10 ซ.ม.และความสงของนกเรยนชายมธยมปท6 มการกระจายแบบโคงปกต

44

Sample estimation

• ถาความสงเฉลยของนกเรยนชายมธยมปท6 ปการศกษา 2553 จ านวน 100 คนทไดจากการสมตวอยาง มคา sample mean = 170 ซ.ม. S.D.= 8 ซ.ม. ทานคดวาคา population mean มคาเทาไร

Page 23: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

23

45

distribution of sample means

X

X

XX X X X X X

%9596.1 x

46

Population estimation

95% confidence interval ของ = = = 168-172 ซ.ม.

xx 96.1

100

10*96.1170

Page 24: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

24

47

95% CI ส าหรบคา Prevalence

• ถำอยำกรวำนกเรยนแพทยช นป3 ทวประเทศเลอก ส.ส.ระบบสดสวนส ำหรบ พรรค ก.รอยละเทำไร ?

• ถำท ำกำรสมนกเรยนแพทยช นป3 ทวประเทศ มำ 100 คน พบวำ เลอกพรรค ก. 40% ซงเปน sample estimate

• กำรหำ Population estimate ท ำไดโดยใชสตร

95% CI ของ Prevalence (P) = 𝒑 ± 𝟏. 𝟗𝟔𝒑(𝟏−𝒑)

𝒏

48

95% CI ส าหรบคา Prevalence

• 95% CI ส ำหรบกำรเลอกพรรค ก.มคำ

• =

• = ( 0.304 -0.496 )

100

)4.01(*4.096.14.0

Page 25: สถิติ ( Statistics) · • P-value คือ โอกำสที่จะได้ค่ำสถิติตำมที่พบในกลุ่ม ตัวอย่ำงหรือมำกกว่ำถ้ำ

24/06/56

25

49

การประยกตคา 95%CI ส าหรบ sample size

จากสตร 95% CI ของ P =

interval =

=

n

ppp

)1(96.1

n

pp )1(96.1

dn

pp )1(96.1

2

2 )1(*

)2/1( d

ppZn