Introduction to Statistics: Descriptive Statistics

27
สถิติพื้นฐาน 1

Transcript of Introduction to Statistics: Descriptive Statistics

Page 1: Introduction to Statistics: Descriptive Statistics

สถิติพื้นฐาน

1

Page 2: Introduction to Statistics: Descriptive Statistics

ความหมายของสถิติ

‣สถิติ (Statistics) การศึกษาวิธีการในการจัดการสารสนเทศเชิงปริมาณ (Study of methods handling quantitative information)

‣ เปนสาขาหนึ่งในคณิตศาสตรประยุกต

2

Page 3: Introduction to Statistics: Descriptive Statistics

ประเภทของสถิติ

สถิติ

สถิติบรรยาย(Descriptive Statistics )

สถิติอางอิง(Inferential Statistics)

•การแจกแจงความถี่•การวัดแนวโนมเขาสูสวนกลาง•การวัดการกระจาย

•การทดสอบสมมติฐาน•การประมาณคา

3

Page 4: Introduction to Statistics: Descriptive Statistics

สถิติบรรยายและสถิติอางอิง

จุดหมายของสถิติบรรยาย

‣ การนับ (counting)

‣ การวัด (measuring)

‣ การจัดเรียงนำเสนอในรูปตาราง(tabulating)

‣ การจัดอันดับ (Ordering)

‣ การหาความเห็นพอง (taking of censuses)

‣ การบรรยาย (Describing)

จุดหมายของสถิติอางอิง

‣ ใชทฤษฎีความนาจะเปน

(theories of probability)

4

Page 5: Introduction to Statistics: Descriptive Statistics

สถิติบรรยาย

T สถิติบรรยาย (descriptive statistics) เปนเครื่องมือในการบรรยาย (describe)

หรือสรุป (summarize) หรือลด (reduce)

ขอมูลปริมาณมาก

5

Page 6: Introduction to Statistics: Descriptive Statistics

ระดับของขอมูล

มาตรนามบัญญัติ (Nominal Scale)

มาตรจัดอันดับ (Ordinal Scale)

มาตรอันตรภาค (Interval Scale)

มาตรอัตราสวน (Ratio Scale)

6

Page 7: Introduction to Statistics: Descriptive Statistics

‣ T การแจกแจงความถี่

‣ T การวัดแนวโนมเขาสูสวนกลาง

‣ T การวัดการกระจาย

‣ T การวัดความสัมพันธ

สถิติพรรณนา (Descriptive Statistics)

7

Page 8: Introduction to Statistics: Descriptive Statistics

‣ การแจกแจงความถี่

‣ การวัดแนวโนมเขาสูสวนกลาง ‣ การวัดการกระจาย

‣ การวัดความสัมพันธ

ความถี่ รอยละ

ฐานนิยม มัธยฐาน คาเฉลี่ย พิสัย สวนเบี่ยงเบนควอไทต ความแปรปรวนสวนเบี่ยงเบนมาตรฐานสัมประสิทธิ์การกระจาย

สถิติพรรณนา (Descriptive Statistics)

8

Page 9: Introduction to Statistics: Descriptive Statistics

ความถี่ (frequency)• เปนรอยขีดแทนจำนวนครั้งที่ตัวเลขปรากฏในกลุม

คะแนนที่กำหนด

• ใชเมื่อตองการเห็นภาพคะแนนของกลุมตัวอยางทั้งหมดมากกวาการเห็นตัวเลขเพียงคาเดียว (range, cluster)

• เหมาะกับขอมูลที่อยูในรูปนามบัญญัติ

• แสดงเปนตาราง กราฟ

1. การแจกแจงความถี่

9

Page 10: Introduction to Statistics: Descriptive Statistics

รอยละ (Percentage)• เปนสัดสวนรอยขีดในกลุมคะแนนที่กำหนดเทียบกับจำนวน

กลุมตัวอยาง

• มีประโยชนมากกวาการแจกแจงความถี่เมื่อ

• การแจกแจงความถี่ไมเปนระบบ (จำนวนคนที่อยูในแตละกลุมคะแนนไมเทากัน)

• ใชในการเปรียบเทียบกลุมตัวอยางสองกลุมที่มีจำนวนไมเทากัน

• มักใชคูกับการแจกแจงความถี่

1. การแจกแจงความถี่

10

Page 11: Introduction to Statistics: Descriptive Statistics

0

2

4

6

8

10

12

14

0 1 2 3 4 5 6 7 8 9 10 11 12 13

11

Page 12: Introduction to Statistics: Descriptive Statistics

• เปนสถิติบรรยายการเฉลี่ยหรือคะแนนที่เปนตัวแทนคะแนนทั้งหมด

• เปนสถิติที่ใชกันมากทั้งในการวิจัยและการนำเสนอขอมูลเชิงปริมาณ

2. การวัดแนวโนมเขาสูสวนกลาง (Central Tendency)

12

Page 13: Introduction to Statistics: Descriptive Statistics

1. ฐานนิยม (Mode) - เหมาะกับขอมูลที่มีมาตรการวัดนามบัญญัติ

- เปนขอมูลที่มีความถี่สูงสุด

เชน คะแนนสอบของนักศึกษา 10 คนเปนดังนี้

4 5 10 6 7 8 9 7 6 5

ฐานนิยม คือ ..... เพราะมีความถี่มากที่สุด

2. การวัดแนวโนมเขาสูสวนกลาง

13

Page 14: Introduction to Statistics: Descriptive Statistics

2. มัธยฐาน (Median) - ใชกับขอมูลที่อยูในมาตราจัดอันดับขึ้นไป

Position of Median = N+1

- เปนคาที่อยูกึ่งกลางเมื่อขอมูลเรียงลำดับแลว

(เปอรเซนไทลที่ 50) เชน

ขอมูล 4 5 10 6 7 8 9 7 6 5

เรียงลำดับขอมูล 4 5 5 6 6 7 7 8 9 10

มัธยฐาน คือ (6+7)/2 = 6.5

2. การวัดแนวโนมเขาสูสวนกลาง

2

14

Page 15: Introduction to Statistics: Descriptive Statistics

3. คาเฉลี่ย (Mean) - ใชกับขอมูลที่อยูในมาตรอันตรภาค- เปนผลที่ไดจากผลรวมคะแนนทั้งหมดของกลุมตัวอยาง หารดวยจำนวนกลุมตัวอยาง

X = x1 + x2 + x3 +... + xn

ขอมูล 4 5 10 6 7 8 9 7 6 5 คะแนนเฉลี่ยเทากับ 6.7

2. การวัดแนวโนมเขาสูสวนกลาง

N

15

Page 16: Introduction to Statistics: Descriptive Statistics

ขอสังเกต- ปกตินิยมใชชนิดการวัดแนวโนมเขาสูสวนกลางใหตรงตาม

มาตรของตัวแปร

- การหาคาเฉลี่ยเปนวิธีที่นิยมที่สุด

- การแจกแจงเปนโคงปกติ mean, median, mode เปนตัวเดียวกัน

- นิยมใช median มากกวา mean เมื่อคา mean และ mode ตางกันมาก

(มีคะแนนที่เปน out liner)

2. การวัดแนวโนมเขาสูสวนกลาง

16

Page 17: Introduction to Statistics: Descriptive Statistics

- มีความจำเปนเนื่องจากการวัดแนวโนมเขาสูสวนกลาง

บอกแตคาตัวแทน มิได ชี้ใหเห็นความตางระหวางคะแนนที่ได

- เปนเรื่องของความตางระหวางคะแนน

3. การวัดการกระจาย (variability)

17

Page 18: Introduction to Statistics: Descriptive Statistics

1. พิสัย (Range)

- เปนความตางระหวางคาสูงสุด กับ คาต่ำสุด

Range = Max - Min

เชน 4 5 10 6 7 8 9 7 6 5

เรียงขอมูล 4 5 5 6 6 7 7 8 9 10

คาสูงสุดคือ ... คาต่ำสุดคือ ... พิสัยคือ ...

3. การวัดการกระจาย (variability)

18

Page 19: Introduction to Statistics: Descriptive Statistics

2. สวนเบี่ยงเบนควอไทล (Semi-interquatile)

- เปนครึ่งหนึ่งของความตางระหวางควอไทลที่ 3 และควอไทลที่ 1 หรือใชสมการ Q = (Q3-Q1)/2

เชน 4 5 10 6 7 8 9 7 6 5

4 5 5 6 6 7 7

ควอไทลที่ 1 คือ ... ควอไทลที่ 3 คือ ...

สวนเบี่ยงเบนควอไทลคือ ...

3. การวัดการกระจาย (variability)

19

Page 20: Introduction to Statistics: Descriptive Statistics

3. ความแปรปรวน (Variance)

- เปนดัชนีสะทอนใหเห็นระดับการกระจายของกลุมคะแนน (ไมมีขอบจำกัด)

- เปนคาเฉลี่ยของผลรวมกำลังสองของความเบี่ยงเบน

หรือใชสมการ

ความแปรปรวนคือ ...

3. การวัดการกระจาย (variability)

20

Page 21: Introduction to Statistics: Descriptive Statistics

4. สวนเบี่ยงเบนมาตรฐาน (Standard Deviation)

- เปนรากที่สองของความแปรปรวน

สวนเบี่ยงเบนมาตรฐานคือ ...

3. การวัดการกระจาย (variability)

21

Page 22: Introduction to Statistics: Descriptive Statistics

5. สัมประสิทธิ์การกระจาย (Coefficient of Variation)

- สามารถนำไปใชในการเปรียบเทียบลักษณะการกระจายของขอมูลสองชุด

- ใชเมื่อผลการวิเคราะหพบวา คาเฉลี่ยเลขคณิต และมัธยฐาน ของขอมูลสองชุดมีคาแตกตางกันมาก

3. การวัดการกระจาย (variability)

22

Page 23: Introduction to Statistics: Descriptive Statistics

5. สัมประสิทธิ์การกระจาย (Coefficient of Variation)

CV = S.D/Mean

3. การวัดการกระจาย (variability)

23

Page 24: Introduction to Statistics: Descriptive Statistics

- เพื่ออธิบายถึงความสัมพันธระหวางตัวแปรที่เลือกศึกษาวาสัมพันธกันในทิศทางใด

ตัวอยางเชน

สหสัมพันธอันดับ (Spearman Rank Correlation)

สหสัมพันธแบบเพียรสัน (Pearson’s Product Moment coefficient of Correlation)

4. การวัดความสัมพันธ

24

Page 25: Introduction to Statistics: Descriptive Statistics

สถิติอางอิง (Inferential Statistics)T T สถิติอางอิงเปนวิธีการในการแกปญหาที่จะพยายาม

อาง (infer) คุณสมบัติของกลุมขอมูลจากกลุมตัวอยางไปยังประชากร

T T จุดหมายของสถิติอางอิงมีจุดหมายเพื่อทำนายหรือประมาณลักษณะของประชากรจากขอมูลลักษณะของ กลุมตัวอยาง

25

Page 26: Introduction to Statistics: Descriptive Statistics

สถิติประเภทนี้ แบงไดเปน 2 ลักษณะ คือ

T T การประมาณคา (โปรแกรมคอมพิวเตอร)

T T การทดสอบสมมติฐาน (ใชเปนสวนใหญ)

เชน t-test, Z-test, ANOVA

chi-square

สถิติอางอิง (Inferential Statistics)

26

Page 27: Introduction to Statistics: Descriptive Statistics

ความสัมพันธระหวางสถิติบรรยายและสถิติอางอิง

‣ เราใชสถิติภาคบรรยาย หรือสถิติของกลุมตัวอยางในการขยาย (generalized) ไปยังประชากรทั้งหมดภายใตขอบความคลาดเคลื่อน (margin of error) ที่กำหนด

‣ ใชสถิติอางอิงในการตรวจสอบสมมติฐานที่แสดงความสัมพันธระหวางตัวแปรในการวิจัย

‣ ยอมรับหรือปฏิเสธสมมติฐานที่ไดรับการตรวจสอบ และสรุปผลเกี่ยวกับประชากร

27