Ph n09 Nguy n Duy Long, Ti nS Bộ môn Thi Công và QLXDndlong/TK/mat/Phan09.pdf · So sánh hai...

15
9/8/2010 1 Phn 09 Nguyn Duy Long, TiếnSBmôn Thi Công QLXD Bmôn Thi Công QLXD ©2010, Nguyn Duy Long, Tiến S1 Các suy lunvcác trtrung bình So sánh các trtrung bình So sánh các trtrung bình Mu đôi ©2010, Nguyn Duy Long, Tiến S2

Transcript of Ph n09 Nguy n Duy Long, Ti nS Bộ môn Thi Công và QLXDndlong/TK/mat/Phan09.pdf · So sánh hai...

9/8/2010

1

Phần 09Nguyễn Duy Long, Tiến SỹBộ môn Thi Công và QLXDBộ môn Thi Công và QLXD

©2010, Nguyễn Duy Long, Tiến Sỹ 1

Các suy luận về các trị trung bình So sánh các trị trung bình So sánh các trị trung bình Mẫu đôi

©2010, Nguyễn Duy Long, Tiến Sỹ 2

9/8/2010

2

Inferences about means

©2010, Nguyễn Duy Long, Tiến Sỹ 3

Ta làm việc với trị trung bình (means): khoảng tin chắc và kiểm nghiệm giả thiết dựa trên mô hình

ố ẫphân phối mẫu. Định Lý Giới Hạn Trung Tâm (CLT) cho ta biết rằng

mô hình phân phối mẫu cho trị trung bình là môhình chuẩn với trị trung bình μ và độ lệch chuẩn là:

SD y

n

4©2010, Nguyễn Duy Long, Tiến Sỹ

9/8/2010

3

Với các phần, có sự liên hệ giữa giá trị của phần(proportion value) và độ lệch chuẩn của phần củaẫ ( l i )mẫu (sample proportion).

Với trị trung bình thì không! Biết trị trung bình củamẫu không cho ta biết điều gì về

Ta làm tất cả những gì có thể: ước lượng thông sốquần thể σ với trị thống kê của mẫu s.

( )SD y

Sai số chuẩn của trị trung bình của mẫu:

sSE y

n

5©2010, Nguyễn Duy Long, Tiến Sỹ

Ta có thêm sự biến đổi trong sai số chuẩn từ s, độlệch chuẩn của mẫu. ệ◦ Ta cần xét sự biến đổi thêm này để không lẫn (mess up)

với các tính toán về biên sai. Và hình dạng (shape) của mô hình mẫu thay đổi –

mô hình không còn là mô hình chuẩn nữa. ◦ Vậy mô hình mẫu ra sao?

6©2010, Nguyễn Duy Long, Tiến Sỹ

9/8/2010

4

William S. Gosset, nhân viên công ty bia Guinness ở Ireland, tìm ra mô hình mẫu.

Mô hình mẫu do Gosset tìm ra được gọi là t củaStudent (Student’s t).◦ Các mô hình t của Student hình thành một tập các phân

phối liên quan phụ thuộc vào thông số bậc tự do (degrees of freedom), gọi tắc là df.

◦ Viết tắc mô hình này dưới dạng tdf.

7©2010, Nguyễn Duy Long, Tiến Sỹ

Mô hình phân phối mẫu thực tiễn cho các trị trung bình

Khi các điều kiện thỏa, trị trung bình mẫu được chuẩn hóa:

Theo mô hình phân phối t của Student với n – 1 bậc tự do. Ta ước lượng sai số chuẩn theo:

y

tSE y

sSE y

với n là kích thước của mẫu

n

8©2010, Nguyễn Duy Long, Tiến Sỹ

9/8/2010

5

Khi Gosset sửa mô hình cho sự không chắc chắn thêm (extra uncertainty), biên sai ME lớn hơn.◦ Khoảng tin chắc sẽ rộng hơn một chút◦ Khoảng tin chắc sẽ rộng hơn một chút

Các mô hình t (t-models) là một mốt, đối xứng, và có hìnhchuông tựa như mô hình chuẩn. ◦ Các mô hình t với vài bậc tự do có đuôi dày hơn mô hình chuẩn.◦ Khi df tăng, các mô hình t càng giống mô hình chuẩn. ◦ Mô hình t với df vô tận thì chính là mô hình chuẩn.

Mô hình chuẩn Mô hình t với 2 bậc tự do

9©2010, Nguyễn Duy Long, Tiến Sỹ

Mô hình t khác nhau bởibậc tự do (n-1)

Bảng tra cho giá trị tới hạn Bảng tra cho giá trị tới hạncủa mô hình t (t-model critical values)

Với n = 16 và C = 95%, t*= +/-2.131◦ Nếu n = 8 và kiểm nghiệm

một phương đuôi trên với=5%, t*=1.895

©2010, Nguyễn Duy Long, Tiến Sỹ

Một phần của Bảng T (tr.A-58)

10

9/8/2010

6

1) Giả định tính độc lập:◦ Điều kiện ngẫu nhiên hóa: Dữ liệu từ mẫu ngẫu

nhiên hay thí nghiệm được ngẫu nhiên hóa thíchhợp. ◦ Điều kiện 10%

©2010, Nguyễn Duy Long, Tiến Sỹ 11

2) Giả định quần thể chuẩn:◦ Điều kiện gần chuẩn “Nearly Normal”: Dữ liệu từ

phân phối một mốt và đối xứng. Kiểm tra điều kiện này bằng cách vẽ biểu đồ tần suất Kiểm tra điều kiện này bằng cách vẽ biểu đồ tần suất. Kích thước mẫu càng nhỏ (n < 15), dữ liệu càng nên theo

mô hình chuẩn. Với các kích thước mẫu trung bình (n giữa15 và 40), t sẽ

hữu hiệu khi dữ liệu là một mốt và gần đối xứng. Với kích thước mẫu lớn hơn, t sẽ an toàn để dùng thậm chí

dữ liệu là bị lệch.

©2010, Nguyễn Duy Long, Tiến Sỹ 12

9/8/2010

7

Khi các điều kiện thỏa, có thể tìm khoảng tin chắccho trị trung bình của mẫu, μ.

Khoảng tin chắc:

Với sai số chuẩn củatrị trung bình của mẫu:

Giá ị ới h h h ộ à ứ i hắ C à

1nCI y t SE y

*t

sSE y

n

Giá trị tới hạn phụ thuộc vào mức tin chắc, C, vàsố bậc tự do, n – 1.

1*nt

©2010, Nguyễn Duy Long, Tiến Sỹ 13

Các điều kiện cho kiểm nghiệm một mẫu (one-sample t-test) cho trị trung bình giống với khoảng t cho một mẫu (one-sample t-interval).

Kiểm nghiệm giả thiết H0: = 0 dùng trị thống kê kiểm Kiểm nghiệm giả thiết H0: 0 dùng trị thống kê kiểmnghiệm:

với sai số chuẩn của trị trung bình của mẫu:

0

1n

yt

SE y

sSE y

n

Khi các điều kiện thỏa và giả thiết rỗng đúng, trị thống kê theomô hình t của Student với n – 1 bậc tự do.

©2010, Nguyễn Duy Long, Tiến Sỹ 14

9/8/2010

8

Nhà sản xuất rượu kiểm tra dây chuyền đóng chai750ml để đảm bảo việc rót đủ rược, nếu khống phảidùng dây chuyền và kiểm tra mọi thứ, một qui trìnhdùng dây chuyền và kiểm tra mọi thứ, một qui trìnhmất thời gian và tốn kém. Trong khi một số biến đổilà tự nhiên và chấp nhận được, mẫu 15 chai códung tích trung bình 740ml và độ lệch chuẩn 20ml◦ Tìm 95% CI cho dung tích trung bình của các chai rượu◦ Nếu ta quan tâm việc đóng chai lớn hơn hay nhỏ hơn dung

tích trên nhãn và sẽ chấp nhận mức = 5%, dùng loại kiểmnghiệm nào? Ta có dừng dây chuyền không?ế ể◦ Nếu ta chỉ quan tâm đóng chai ít rượu hơn, loại kiểm

nghiệm gì cần thực hiện? Nếu = 5%, ta vẫn dùng cùngmức tin chắc ở trên?

©2010, Nguyễn Duy Long, Tiến Sỹ 15

Comparing Means

©2010, Nguyễn Duy Long, Tiến Sỹ 16

9/8/2010

9

Các thí nghiệm để so sánh hai nhóm thườngxảy ra cả trong khoa học và công nghiệp.y g ọ g g ệp

So sánh hai trị trung bình không khác mấy so với so sánh hai phần

©2010, Nguyễn Duy Long, Tiến Sỹ 17

Khi các điều kiện thỏa, sự khác nhau đượcchuẩn hóa của mẫu giữa các trị trung bìnhg ị gcủa hai nhóm độc lập,

có thể mô hình bởi mô hình t của Student vớibậc tự do theo công thức đặc biệt. Sai số

)()()(

21

2121

yySEyyt

chuẩn được ước tính:

©2010, Nguyễn Duy Long, Tiến Sỹ 18

2

22

1

21)( 21 n

snsyySE

9/8/2010

10

Xác định bậc tự do theo:2

22 ss

Qui tắc dễ hơn:◦ df = min(n1, n2) nhưng không lớn hơn (n1 + n2 – 2)

22

22

1212

1

21

111

2

22

11

)()(

)(

n

s

nn

s

n

n

s

n

s

df

( 1, 2) g g ( 1 2 )

©2010, Nguyễn Duy Long, Tiến Sỹ 19

Giả định tính độc lập Giả định quần thể chuẩn Giả định quần thể chuẩn Giả định các nhóm độc lập

©2010, Nguyễn Duy Long, Tiến Sỹ 20

9/8/2010

11

Khi các điều kiện thỏa, khoảng tin chắc chosự khác nhau giữa các trị trung bình của haiự g ị gnhóm độc lập, µ1 - µ2, là:

)()( 21*

21 yySEtyy df

©2010, Nguyễn Duy Long, Tiến Sỹ 21

Kiểm nghiệm t cho hai mẫu (two-sample t-test)

H0: µ1 - µ2 = Δ0 Trị thống kê kiểm nghiệm: )(

)(

21

021

yySEyyt

©2010, Nguyễn Duy Long, Tiến Sỹ 22

9/8/2010

12

Paired Samples

©2010, Nguyễn Duy Long, Tiến Sỹ 23

Dữ liệu đôi (paired data) xuất hiện dưới nhiềucách.◦ Ví dụ: So sánh các đối tượng với chính nó trước và

sau một liệu pháp. Không thể dùng các phương pháp hai mẫu ở

phần trên cho dữ liệu đôi.

©2010, Nguyễn Duy Long, Tiến Sỹ 24

9/8/2010

13

Tên Dặm lái xe với tuầnlàm việc 5 ngày

Dặm lái xe với tuầnlàm việc 4 ngày

Khác nhau

Jeff 2798 2914 -116Jeff 2798 2914 116Betty 7724 6112 1612Roger 7505 6177 1328Tom 838 1102 -264Aimee 4592 3281 1311Greg 8107 4997 3110Larry G. 1228 1695 -467

©2010, Nguyễn Duy Long, Tiến Sỹ 25

yTad 8718 6606 2112Larry M. 1097 1063 34Leslie 8089 6392 1697Lee 3807 3362 445

Nguồn: De Veaux, 2006, tr.574

Vì ta quan tâm đến các sự khác nhau, ta coitất cả chúng (cột ngoài cùng bên phải) nhưhể hú là d l bỏ h đầthể chúng là dữ liệu, bỏ qua hai cột đầu.

Ta chỉ có một cột các giá trị để xem xét, ta cóthể dùng kiểm nghiệm t một mẫu (one-sample t-test).

Về tính toán, kiểm nghiệm t đôi (paired t-test) chỉ là kiểm nghiệm t một mẫu cho các trịtrung bình của sự khác nhau từng đôi(pairwise differences), kích thước mẫu là sốcặp

©2010, Nguyễn Duy Long, Tiến Sỹ 26

9/8/2010

14

Giả định dữ liệu đôi Giả định tính độc lập Giả định tính độc lập Giả định quần thể chuẩn

©2010, Nguyễn Duy Long, Tiến Sỹ 27

Khi các điều kiện thỏa, ta có thể kiểm nghiệmtrị trung bình của sự khác nhau từng đôi cóị g ự gkhác nhau đáng kể so với không.

Giả thiết rỗng H0: µ0 = Δ0

Trị số thống kê: )(1

0

dSE

dnt

Sai số chuẩn:

©2010, Nguyễn Duy Long, Tiến Sỹ 28

n

sddSE )(

9/8/2010

15

Khi các điều kiện thỏa, ta có thể tìm khoảngtin chắc cho trị trung bình của sự khác nhauị g ựtừng đôi:

Với

)(*1 dSEtd n

n

sddSE )(

©2010, Nguyễn Duy Long, Tiến Sỹ 29

©2010, Nguyễn Duy Long, Tiến Sỹ 30