Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG...

17
Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐ Ths. Nguyễn Tiến Dũng Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội Email: [email protected]

Transcript of Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG...

Page 1: Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐnguyentiendung.yolasite.com/resources/tkud ch04.pdftập trung: trung bình, trung vị, mốt, tứ phân vị, phân

Chương 4

TÓM TẮT DỮ LIỆU

BẰNG CÁC ĐẠI LƯỢNG SỐ

Ths. Nguyễn Tiến Dũng

Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội

Email: [email protected]

Page 2: Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐnguyentiendung.yolasite.com/resources/tkud ch04.pdftập trung: trung bình, trung vị, mốt, tứ phân vị, phân

MỤC TIÊU CỦA CHƯƠNG

● Sau khi kết thúc chương này, người học có thể:

● Kể tên và biết cách tính các đại lượng đặc trưng cho độ

tập trung: trung bình, trung vị, mốt, tứ phân vị, phân vị

● Nói tên và biết cách tính các đại lượng đặc trung cho độ

phân tán của tập DL: khoảng biến thiên, độ trải giữa,

phương sai và độ lệch chuẩn

● Nắm được ý nghĩa của hệ số biến thiên

● Phát biểu được quy tắc thực nghiệm và quy tắc

Chebysev về quy luật phân phối của tập DL

● Biết cách vẽ và khám phá đặc điểm của tập DL qua biểu

đồ hộp và râu

● Phân biệt được các tham số tổng thể và tham số mẫu

© 2013 Nguyễn Tiến Dũng 2

Page 3: Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐnguyentiendung.yolasite.com/resources/tkud ch04.pdftập trung: trung bình, trung vị, mốt, tứ phân vị, phân

CÁC NỘI DUNG CHÍNH

4.1 Các đại lượng đo lường độ tập trung và phương

pháp mô tả hình dáng tập DL

4.2 Các đại lượng đo lường độ phân tán

4.3 Các đại lượng TK mô tả cho bảng tần số

4.4 Các đại lượng TK mô tả cho tổng thể

4.5 Khám phá DL qua biểu đồ hộp và râu (box plot)

4.6 Sử dụng kết hợp TB và độ lệch chuẩn

4.7 Phân biệt một số cặp khái niệm

© 2013 Nguyễn Tiến Dũng 3

Page 4: Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐnguyentiendung.yolasite.com/resources/tkud ch04.pdftập trung: trung bình, trung vị, mốt, tứ phân vị, phân

4.1 CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ TẬP TRUNG VÀ PHƯƠNG PHÁP MÔ TẢ HÌNH DÁNG TẬP DỮ LIỆU

● 4.1.1 Các ĐL đo lường độ tập trung phổ biến

● 4.1.2 Sử dụng Excel để tính các ĐL TK mô tả độ

tập trung

● 4.1.3 Nhóm các ĐL khác mô tả sự phân bố của tập

DL

● 4.1.4 Hình dáng của phân phối

© 2013 Nguyễn Tiến Dũng 4

Page 5: Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐnguyentiendung.yolasite.com/resources/tkud ch04.pdftập trung: trung bình, trung vị, mốt, tứ phân vị, phân

4.1.1 Các ĐL đo lường độ tập trung phổ biến

● 4.1.1.1 Trung bình cộng (arithmetic mean)

● 4.1.1.2 Trung vị (Median)

● 4.1.1.3 Mốt (Mode)

● 4.1.1.4 Trung bình nhân (geometric mean)

© 2013 Nguyễn Tiến Dũng 5

Page 6: Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐnguyentiendung.yolasite.com/resources/tkud ch04.pdftập trung: trung bình, trung vị, mốt, tứ phân vị, phân

4.1.2 Sử dụng Excel để tính các đại lượng TK mô tả độ tập trung

Mean 26,933

Standard Error 0,927

Median 27

Mode 21

Standard Deviation 5,078

Sample Variance 25,789

Kurtosis -0,127

Skewness 0,533

Range 20

Minimum 19

Maximum 39

Sum 808

Count 30

Confidence Level(95,0%) 1,896

© 2013 Nguyễn Tiến Dũng 6

Page 7: Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐnguyentiendung.yolasite.com/resources/tkud ch04.pdftập trung: trung bình, trung vị, mốt, tứ phân vị, phân

4.1.3 Nhóm các ĐL khác mô tả sự phân bố của tập dữ liệu

● 4.1.3.1 Tứ phân vị (quartiles)

● 4.1.3.2 Phân vị (percentiles)

© 2013 Nguyễn Tiến Dũng 7

Page 8: Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐnguyentiendung.yolasite.com/resources/tkud ch04.pdftập trung: trung bình, trung vị, mốt, tứ phân vị, phân

4.2 Các đại lượng đo lường độ phân tán

● 4.2.1 Khoảng biến thiên R

● 4.2.2 Độ trải giữa IQR = Q3 – Q1

● 4.2.3 Phương sai và độ lệch chuẩn của mẫu

© 2013 Nguyễn Tiến Dũng 8

Page 9: Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐnguyentiendung.yolasite.com/resources/tkud ch04.pdftập trung: trung bình, trung vị, mốt, tứ phân vị, phân

4.3 Các đại lượng TK mô tả cho bảng tần số

● 4.3.1 Trung bình cộng

● 4.3.2 Trung vị

● 4.3.3 Mốt

● 4.3.4 Phương sai và độ lệch chuẩn

© 2013 Nguyễn Tiến Dũng 9

Page 10: Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐnguyentiendung.yolasite.com/resources/tkud ch04.pdftập trung: trung bình, trung vị, mốt, tứ phân vị, phân

4.4 Các đại lượng TK mô tả cho tổng thể

● 4.4.1 TB cộng của tổng thể

● 4.4.2 Phương sai và độ lệch chuẩn của tổng thể

© 2013 Nguyễn Tiến Dũng 10

Page 11: Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐnguyentiendung.yolasite.com/resources/tkud ch04.pdftập trung: trung bình, trung vị, mốt, tứ phân vị, phân

4.5 Khám phá DL qua biểu đồ hộp và râu

● Bước 1: Vẽ hộp

● Xác định Q1, Q2, Q3

● Vẽ hình hộp xung quanh

● Vẽ đường qua trung vị

● Bước 2: Vẽ râu trên

● Nếu xmax ≤ Q3 + 1,5.IQR, thì râu trên = xmax

● Nếu không phải, thì râu trên = Q3+1,5IQR và vẽ 1 dấu chấm ở vị trí xmax

● Bước 3: Vẽ râu dưới

● Nếu xmin ≥ Q1 – 1,5.IQR, thì râu dưới = xmin

● Nếu không phải, thì râu dưới = Q1 –1,5.IQR và vẽ thêm 1 dấu chấm ở vị trí xmin

© 2013 Nguyễn Tiến Dũng 11

Page 12: Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐnguyentiendung.yolasite.com/resources/tkud ch04.pdftập trung: trung bình, trung vị, mốt, tứ phân vị, phân

© 2013 Nguyễn Tiến Dũng 12

Page 13: Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐnguyentiendung.yolasite.com/resources/tkud ch04.pdftập trung: trung bình, trung vị, mốt, tứ phân vị, phân

4.6 Sử dụng kết hợp TB và độ lệch chuẩn

● 4.6.1 Hệ số biến thiên CV

● 4.6.2 Quy tắc thực nghiệm

● 4.6.3 Quy tắc Chebysev

● 4.6.4 Chuẩn hoá dữ liệu

© 2013 Nguyễn Tiến Dũng 13

Page 14: Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐnguyentiendung.yolasite.com/resources/tkud ch04.pdftập trung: trung bình, trung vị, mốt, tứ phân vị, phân

4.6.2 Quy tắc thực nghiệm

● Với phân phối cân

đối, có khoảng

● 68% rơi vào µ±

● 95% rơi vào µ± 2

● 99,7% rơi vào µ± 3

© 2013 Nguyễn Tiến Dũng 14

Page 15: Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐnguyentiendung.yolasite.com/resources/tkud ch04.pdftập trung: trung bình, trung vị, mốt, tứ phân vị, phân

4.6.3 Quy tắc Chebysev

● Với một phân

phối bất kỳ, luôn

có ít nhất

● (1-1/k2).100%

quan sát rơi vào

khoảng µ± k.

© 2013 Nguyễn Tiến Dũng 15

Page 16: Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐnguyentiendung.yolasite.com/resources/tkud ch04.pdftập trung: trung bình, trung vị, mốt, tứ phân vị, phân

4.6.4 Chuẩn hoá dữ liệu

● Biến X ~ N(µ; 2) Z ~ N(0; 12)

● hoặc

● Biến X ~ N( 𝑥; 𝑠2) Z ~ N(0; 12)

© 2013 Nguyễn Tiến Dũng 16

xz

x xz

s

Page 17: Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐnguyentiendung.yolasite.com/resources/tkud ch04.pdftập trung: trung bình, trung vị, mốt, tứ phân vị, phân

4.7 Phân biệt một số cặp khái niệm

● Tham số tổng thể và tham số mẫu

● Tham số tổng thể: µ, 2, , p

● Tham số mẫu: 𝑥, s2, s, ps

● Biến thiên và độ lệch chuẩn

● Biến thiên: sự sai lệch giữa giá trị quan sát với

TB

● ĐLC: thước đo tổng hợp về sự biến thiên

© 2013 Nguyễn Tiến Dũng 17