ước lượng khoảng cho tham số thống kê

15
Cao Hào Thi 74 Chươ ng 7 ƯỚ C LƯỢ NG CÁC THAM STHNG KÊ (Estimation) 7.1 KHÁI NIM CHUNG Xét mt tp hợ p chính gm N biến ngu nhiên X có hàm mt độ xác sut là f (x,θ); trong đó θ là các tham sthng kê ca tp hợ p chính. Thí d : Trong phân ph i nhthc: f x C n x x n x  ( , ) ( ) θ ρ ρ = 1   θ = ρ, θ [0 , 1] Trong phân ph i poisson f x e x x ( , ) ! θ λ λ =   θ = λ λ > 0 Trong phân ph i chun f x e x ( , ) ( ) θ πσ µ σ = 1 2 2 2 2 2   θ = (µ, σ 2 ) ; -< µ < +; 0 < σ 2 < + Gi {x 1, x 2 ,.... , x n } là mu ng u nhiên, cỡ mu n đượ c dùng l y ra ttp h ợ p chính tuân theo hàm mt độ xác sut f (x,θ).  đây dng ca hàm f xem như đã biết còn các tham s thng kê θ ca tp hợ p chính xem như chưa biết. Vn đề đặt ra ở chươ ng trình này là da vào các mu quan sát {x 1 ,x 2 ,...,x n } ta ướ c l ượ ng xem giá tr cthca θ bng bao nhiêu (bài toán đó gi ướ c lượ ng đim ) hoc ướ c lượ ng xem θ nm trong khong nào (bài toán ướ c lượ ng khong). 7.2 ƯỚ C LƯỢ NG ĐIM (Point Estimation) 7.2.1 Ướ c lượ ng và giá tr ướ c lượ ng (Estimator And Estimate) a) Ướ c l ượ ng (Estimator) và hàm ướ c l ượ ng - Là biến ngu nhiên hay các tham sthng kê ca mu đượ c dùng để ướ c l ượ ng các tham sthng kê chưa biết ca tp hợ p chính. - Ướ c lượ ng ca tham sthng kê θ ca tp hợ p chính đượ c ký hiu là θ ˆ  - Da vào mu {x 1 ,x 2 ...,x n } ngườ i ta lp ra Hàm θ ˆ = θ ˆ (x 1 ,x 2, ....,x n ) để ướ c lượ ng cho θ. θ ˆ  đượ c gi là hàm ướ c lượ ng ca θ hay gi tt là ướ c lượ ng ca θ.

Transcript of ước lượng khoảng cho tham số thống kê

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 1/15

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 2/15

Cao Hào Thi 75

θ̂ chỉ phụ thuộc vào giá tr ị quan sát x1, x2, ... ,xn chứ không phụ thuộc vào các tham

số chưa biết θ của tập hợ p chính.

b)  Giá tr ị  ướ c l ượ ng (Estimate) hay còn g ọi là giá tr ị  ướ c l ượ ng đ i ể m (Point 

Estimate)

Là giá tr ị cụ thể của ướ c lượ ng θ̂ và đượ c xem như giá tr ị ướ c lượ ng của tham số thống

kê θ của tập hợ p chính.

Tham số thống kê và tập hợ pchính (Population Parameter)

Ướ c lượ ng (Estimation)Giá tr ị ướ c lượ ng

Estimate (Point estimate)

Số trung bình µ  X 

Phươ ng sai 2xσ   Sx

Độ lệch chuẩn σx  Sx 

Tỷ lệ p f ̂ 

7.2.2 Ướ c lượ ng không chệch: (Unbiased Estimators)

a)  Ướ c l ượ ng không chệ ch:

Ướ c lượ ng θ đượ c gọi là ướ c lượ ng không chệch của tham số thống kê θ nếu k ỳ vọng

của θ̂ là θ.

E ( θ̂ ) = θ 

Thí d ụ

 E(X ) = µ => X là ướ c lượ ng không chệch của µ 

E(Sx2) = 2

xσ => Sx2 là ướ c lượ ng không chệch cuả  2

xσ  

E ( f ̂) = p => f ̂ là ướ c lượ ng không chệch của p

b)  Độ chệ ch (The Bias)

Gọi θ̂ là ướ c lượ ng của θ: Bias( θ̂ ) = E ( θ̂ ) - θ 

Đối vớ i ướ c lượ ng không chệch ⇒ Bias = độ chệch = 0

c)  Ướ c l ượ ng hi ệ u quả t ố t nhấ t:

Gọi θ̂ 1 và θ̂ 2 là 2 ướ c lượ ng không chệch của θ dựa trên số lượ ng của mẫu quan sát

giống nhau.

o  θ̂ 1 đượ c gọi là hiệu quả hơ n θ̂ 2 nếu: Var ( θ̂ 1) < Var ( θ̂ 2)

o  Hiệu quả tươ ng đối giữa hai ướ c lượ ng là tỉ số giữa 2 phươ ng sai của chúng.

Hiệu quả tươ ng đối (Relative Efficency) =)ˆ(Var 

)ˆ(Var 

1

2

θ

θ 

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 3/15

Cao Hào Thi 76

o  Nếu θ̂ là ướ c lượ ng không chệch của θ và nếu không có một ướ c lượ ng không

chệch nào có phươ ng sai nhỏ hơ n phươ ng sai của θ̂ thì θ̂  đuợ c gọi là ướ c lượ ng

tốt nhất (Best Estimator) hay θ̂ còn gọi là ướ c lượ ng không chệch có phươ ng sai

nhỏ nhất của θ (Minimum Variance Unbiased Estimator of θ)

θ2θ1

 

θ2

θ1

 

θˆ

1 : ướ c lượ ng không chệch của θ  θˆ

1 θˆ

2: ướ c lượ ng không chệch của θ 

θ̂ 2 : ướ c lượ ng chệch của θ  θ̂ 1 ướ c lượ ng hiệu quả hơ n θ̂ 2:

d)  Sai số bình phươ ng trung bình (Mean Squared Error - MSE)

Sai số bình phươ ng trung bình của ướ c lượ ng θ̂  đượ c định nghĩ a như sau: 

MSE( θ̂ ) = E [( θ̂ - θ)2]

Ngườ i ta chứng minh đượ c r ằng:

MSE ( θ̂ ) = Var( θ̂ ) + [θ - E ( θ̂ )]2

 

MSE ( θ̂ ) = Var ( θ̂ ) + [ Bias( θ̂ )]2 

Nếu θ̂ là ướ c lượ ng không chệch ta có: 

Bias( θ̂ ) = 0

⇒ MSE ( θ̂ ) = Var ( θ̂ )

e)  Ướ c l ượ ng nhấ t quán vữ ng (Consistent Estimators)

θ̂ n = θ̂ (x1, x2,... xn) gọi là ướ c lượ ng vững của θ nếu vớ i mọi ε > 0 ta có:

∞→ilim P( | θ̂ n - θ | ≤ ε) = 1

tức là dãy θ̂ n hội tụ theo xác suất tớ i θ khi n → ∞ 

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 4/15

Cao Hào Thi 77

7.3  ƯỚ C LƯỢ NG KHOẢNG (Interval Estimation)

7.3.1 Khoảng tin cậy (Confidence Interval)

a)  Ướ c l ượ ng khoảng và giá tr ị  ướ c l ượ ng khoảng 

(Interval Estimator And Interval Estimate).

Ướ c lượ ng khoảng: Ướ c lượ ng khoảng đối vớ i tham số thống kê của tập hợ p chính θ 

là một quy tắc dựa trên thông tin của mẫu để xác định miền (Range) hay khoảng

(Interval) mà tham số θ hầu như nằm trong đó.

Gía tr ị ướ c lượ ng khoảng: là giá tr ị cụ thể của miền hay khoảng mà tham số θ nằm

trong đó.

b)  Khoảng tin cậy và độ tin cậy (Confidence Interval and Level of Confidence)

Gọi θ là tham số thống kê chưa biết. Giả sử dựa trên thông tin của mẫu ta có thể xác

định đượ c 2 biến ngẫu nhiên A và B sao cho

P (A < θ < B) = 1 - α vớ i 0 < α < 1

Nếu giá tr ị cụ thể của biến ngẫu nhiên A và B là a và b thì khoảng (a,b) từ a đến b

đượ c gọi là khoảng tin cậy của θ vớ i xác suất là (1 - α)

Xác suất (1 - α) đượ c gọi là độ tin cậy của khoảng.

Ghi chú:

o  Trong thực tế, độ tin cậy (1-α) do nhà thống kê chọn theo yêu cầu của mình,

thông thườ ng độ tin cậy đượ c chọn là 0,90; 0,95; 0,99...

o  α là xác suất sai lầm khi chọn khoảng tin cậy (a, b)

7.3.2  Khoảng tin cậy đối vớ i số trung bình của phân phối chuẩn trong trườ ng hợ pđã biết phươ ng sai của tập hợ p chính:

Nghĩ a là đi tìm ướ c lượ ng của µ trong N (µ, σx2) khi đã biến σx2 

a)  Đi ể m phần tr ăm gi ớ i hạn trên Z (Upper Percentage Cut Off Point)

Gọi Z là biến ngẫu nhiên chuẩn hóa và α là số bất k ỳ sao cho 0 < α < 1

Zα là điểm phần tr ăm giớ i hạn trên nếu.

P (Z > Zα ) = α 

Ghi chú: 

  P (Z > Zα) = F

Z(Z

α) = 1 - α 

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 5/15

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 6/15

Cao Hào Thi 79

Thí d ụ:

Giả sử tr ọng lượ ng của các học sinh lớ p 2 tuân theo phân phối chuẩn vớ i độ lệch chuẩn

1,2kg. Mẫu ngẫu nhiên gồm 25 học sinh có trung bình là 19,8kg. Tìm khoảng tin cậy 95%

đối vớ i tr ọng lượ ng trung bình của tất cả học sinh lớ p 2 trong 1 tr ườ ng.

Giải:

Ta có: 100 (1 - α) = 95 ⇒  α = 0,05

⇒ Zα/2 =Z0,025 

⇒ P(Z > Z0,025) = 0,025

P(Z < Z0,025) = FZ (Z0,025) = 1 - 0,025 = 0,975

Tra bảng ta có: Z0,025 = 1,96

Khoảng tin cậy 95% đối vớ i số trung bình tập chính µ sẽ là

x n 

x n 

x X − < < +α α σ  µ  σ / / 2 2

 

Vớ i X = 19,8 kg σx = 1,2 kg n = 25 Zα/2 = 1,96

Vậy : 19,33 < µ < 20,27

Ghi chú:

ε =n

Z x/ σα 2 : gọi là độ chính xác của ướ c lượ ng hay dung sai

X là trung tâm của khoảng tin cậy vớ i bề r ộng của khoảng tin cậy của µ là

W n 

x = =2

22α  σ ε / 

 

o  W càng nhỏ thì ướ c lượ ng càng chính xác ( ≡ ε càng nhỏ)

o  Vớ i xác suất α và cỡ mẫu nhỏ, σx càng lớ n thì W càng lớ n.

o  Vớ i α và σx cho tr ướ c, n càng lớ n thì W càng nhỏ.

o  Vớ i σx và n cho tr ướ c, (1 - α) càng lớ n thì W càng nhỏ 

n = 25 σx = 1.2 1-α = 0.99

n = 25

n = 64

n = 25

σx = 1.2

σx = 1.2

σx = 1.2

1-α = 0.95

1-α = 0.95

1-α = 0.95 

c)  Khoảng tin cậy của số trung bình µ trong t ập hợ p chính tr ườ ng hợ p cỡ mẫ u l ớ n.

Giả sử ta có mẫu vớ i cỡ mẫu là n đượ c lấy từ tập hợ p chính có số trung bình là µ.

Gọi X là số trung bình của mẫu và Sx là phươ ng sai của mẫu.

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 7/15

Cao Hào Thi 80

Nếu n lớ n thì khoảng tin cậy vớ i xác suất 100(1-α) % đối vớ i µ đượ c xem đúng là:

x n 

x n 

X x − < < +α α µ / / 2 2

 

Ghi Chú:

o  Sự ướ c lượ ng này gần đúng ngay cả khi tập hợ p chính không theo phân phối

chuẩn.

o  Khi n lớ n ta có thể xem gần đúng Sx = σx 

7.3.3  Phân phối Stutent t:

Trong phần tr ướ c, ta đi tìm khoảng tin cậy của µ trong N (µ, σx2) khi đã biết σx

2 hoặc tìm

khoảng tin cậy của µ khi có mẫu lớ n.

Trong tr ườ ng hợ p không biết phươ ng sai σx

2

và cỡ mẫu không lớ n, để tìm khoảng tin cậycủa µ ta cần phải có một phân phối thích hợ p hơ n, đó là phân phối Student t.

a)  Phân phố i Student t 

Cho mẫu ngẫu nhiên vớ i cỡ n vớ i số trung bình của mẫu X và độ lệch chuẩn mẫu Sx;

mẫu đượ c lấy ra từ tập hợ p chính vớ i số trung bình là µ.

Biến ngẫu nhiên :

t x 

S n x 

=− µ 

 t tuân theo phân phối Student t vớ i độ tự do là n - 1

t

0

f(t)Phân phối chuẩn

Phân phối Student tvớ i độ tự do là 3

 

Biến ngẫu nhiên X đượ c gọi là tuân theo phân phối Studen t vớ i độ tự do ν nếu hàm mật

độ xác định có dạng.

f x 

x ( )

( )

( , )

( )

=+

−+

1

1

2 2

2 1

2

ϑ 

ϑ ϑ 

ϑ 

 

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 8/15

Cao Hào Thi 81

b)  Đi ể m phần tr ăm gi ớ i hạn trên t ν,α:

Biến ngẫu nhiên tuân theo phân phối Student t vớ i độ tự do ν, đượ c ký hiệu là tν. tν ,α  là

điểm phần tr ăm giớ i hạn trên nếu:

P(tν > tν ,α ) = α 

Ngườ i ta lập bảng tính sẳn cho các giá tr ị diện tích ở dướ i đườ ng cong từ tν ,α  đến +∞ 

t

α

tυ,α0

f(tυ)

 

Tươ ng tự phần tr ăm trên ta có:

P(-tν ,α /2 < tν  < tν ,α /2) = 1 - α 

t

α/2 α/2

tυ,α/20

f(tυ)

−tυ,α/2 

7.3.4  Khoảng tin cậy đối vớ i số trung bình µ trong phân phối chuẩn khi chư a biếtphươ ng sai:

(Khoảng tin cậy của µ trong N(µ, σx2) khi chưa biết σx

Giả sử ta có mẫu ngẫu nhiên vớ i cỡ mẫu n từ phân phối chuẩn vớ i số trung bình là µ vàphươ ng sai σx

2 chưa biết. Nếu số trung bình mẫu là X và độ lệch chuẩn mẫu là Sx thì

khoảng tin cậy của số trung bình tập hợ p chính µ sẽ đượ c tính bở i .

n

Stx

n

Stx

x/,nx/,n 2121 α−α− +<µ<−  

Trong đó tn-1,α/2 là số có P(tn-1 > tn-1,α/2) =2

αvà tn-1 là biến ngẫu nhiên tuân theo phân phối

Student vớ i độ tự do là n - 1

Chứ ng minh:

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 9/15

Cao Hào Thi 82

P(-tn-1,α/2 < tn-1 < tn-1,α/2) = 1 - α 

α−=⎟⎟⎠

⎞⎜⎜⎝ 

⎛ <

µ−<− α−α− 12121 /,n

x

/,n tn/S

XtP

α−=⎟⎟⎠⎞⎜⎜

⎝ ⎛  <µ−<− α−α− 1

2121

n

StXn

StPx/,nx/,n

 

α−=⎟⎟⎠

⎞⎜⎜⎝ 

⎛ +<µ<− α−α−

12121

n

StX

n

StXP

x/,nx/,n 

Thí d ụ: Mẫu ngẫu nhiên của tr ọng lượ ng 6 học sinh lớ p 2 có giá tr ị như sau:

18,6kg 18,4kg 19,2kg 20,8kg 19,4kg 20,5kg

Tìm khoảng tin cậy 90% đối vớ i số trung bình của tất cả học sinh lớ p 2. Gỉa sử r ằng phân

phối tr ọng lượ ng của tất cả học sinh lớ p 2 là phân phối chuẩn.

Giải: 

Tr ướ c hết ta phải tìm số trung bình mẫu X và phươ ng sai mẫu Sx

Số trung bình mẫu:

x n 

xi = ∑ = =1 1

6116 9 19 4833( . ) .

 

Phươ ng sai mẫu:

S n 

x nx x i 2 2

21

1= − ∑ −( ) 

=

1

52282 41 6 19 4833 0 962( . , , ) ,− × =

 

Độ lệch chuẩn: S x 

= =0 96 098, .  

Khoảng tin cậy 90% đối vớ i tr ọng lượ ng trung bình của tất cả học sinh lớ p 2 là:

x l 

n x 

n x n x  − < < +− −1 2 1 2, ,/ / α α µ 

 

X = 19,4833 , Sx = 0,98 , n = 6

i xi xi2

1 18,6 345,96

2 18,4 338,56

3 19,2 368,64

4 20,8 432,64

5 19,4 376,366 20,5 420,25

Tổn 116,9 2282,4

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 10/15

Cao Hào Thi 83

100 (1-α) = 90 => α = 0,10 => α/2 = 0,05

Tra bảng ta có: tn-1,α/2 = t5,0.05 = 2.015

19 482 015 0 098

619 48

2 015 0 98

6

1867 20 29

.. .

.. .

. .

−×

< < +×

< <

µ 

µ  

Các khoảng tin cậy:

(18.89,4) (20.07,4)

(18.67,2) (20.29,2)

(18.45,0) (20.51,0)

(17.87,-2) (21.09,-

Khoảng tin cậy 99%

Khoảng tin cậy 95%

Khoảng tin cậy 90%

Khoảng tin cậy 80%

 

7.3.5  Khoảng tin cậy đối vớ i phươ ng sai của phân phối chuẩn σ2 

Nhắc lại, giả sử ta có mẫu ngẫu nhiên vớ i cỡ mẫu n đượ c lấy ra từ tập hợ p chính có phân

phối chuẩn N(µx,sx2) và gọi Sx

2 là phươ ng sai của mẫu.

Biến ngẫu nhiên2

22

,

)1(

x

xS n

σ 

χ  α γ 

−= sẽ tuân theo phân phối 2χ  vớ i độ tự do n - 1

a)  Đi ể m phần tr ăm gi ớ i hạn trên2

,α γ χ   

Biến ngẫu nhiên tuân theo phân phối 2χ  vớ i độ tự do γ đượ c ký hiệu 2

,α γ χ   

2

,α γ χ  là điểm phần tr ăm giớ i hạn trên nếu

  P( 2

γ χ  > 2

,α γ χ  ) = α 

α

χ2υ,α

 

Thí dụ: Tìm2

%5;6χ   

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 11/15

Cao Hào Thi 84

P( 2

6χ  > 2

%5;6χ  ) = 5% ⇒  2

%5;6χ  = 12,59

Tươ ng tự ta có:

⎢⎢⎢⎢

−=<

=>

−2

1)(2

)(

2

2/1,

2

2

2/,

2

α χ χ 

α χ χ 

α γ γ 

α γ γ 

 

  α−=χ<χ<χ αγγα−γ 122

2221 )(P /,/,  

t

 

b)  Khoảng tin cậy của phươ ng sai phân phố i chuẩ n σ2:

Khoảng tin cậy vớ i xác suất 100 (1- α)% của σ2 là

2211

22

221

2 11

/,n

x

/,n

x

S)n(S)n(

α−−α− χ

−<σ<χ

− 

Trong đó 221 /,n α−χ là số có P( 2

γ χ  > 221 /,n α−χ ) = α/2

Trong đó  2211 /,n α−−χ là số có P( 2

γ χ  > 2211 /,n α−−χ ) = α/2

Và biến ngẫu nhiên 21−χn tuân theo phân phối 2χ vớ i độ tự do là n – 1

Chứng minh :

α−=χ<χ<χ αγγα−γ 122

2221 )(P /,/,  

α−=χ<χ<χ α−−α−− 1221

21

2211 )(P /,nn/,n  

α−=⎟⎟⎠

⎞⎜⎜⎝ 

⎛ χ<

σ

−<χ α−α−− 1

1 2212

22

211 /,n

x

x/,n

S)n(P

α−=⎟⎟

⎜⎜

⎝ 

⎛ 

χ

−<σ<

χ

α−−α−

111

2211

22

221

2

/,n

xx

/,n

x S)n(S)n(P

Thí dụ : Một mẫu ngẫu nhiên gồm 15 viên thuốc nhức đầu cho thấy độ lệch chuẩn trong

thành phần cấu tạo thuốc là 0,8. Tìm khoảng tin cậy 90% của phươ ng sai lô thuốc nói trên(thành phần trong lô thuốc tuân theo phân phối chuẩn)

α/2α/2

-χ2ν,1-α/2 χ2

ν,α/2

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 12/15

Cao Hào Thi 85

Giải :

n = 15, 2xS = 0,82 = 0,64; α = 10%

Tra bảng 221 /,n α−χ = 68,232

%5;14 =χ   

Và 2211 /,n α−−χ = 57,62

%95;14 =χ   

Vậy:2

211

22

221

2 11

/,n

xx

/,n

x S)n(S)n(

α−−α− χ

−<σ<

χ

− 

⇔  0,378 < 2xσ < 1,364

⇔  0,61 < xσ < 1,17 

7.3.6  Ướ c lượ ng khoảng tin cậy của tham số thống kê p trong phân phối nhị thứ c

trong điều kiện cỡ mẫu lớ n :

Nhắc lại, gọi f là tỷ số của số lần thành công trong n phép thử độc lập:n

Xf  =  

X tuân theo phân phối chuẩn có - số trung bình µ = np

- Phươ ng sai : σ2 = np(1-p)

Ta có : E(f) = p f là ướ c lượ ng không chệch của p.

n

)p(pf 

−=σ

Khi cỡ mẫu đủ lớ n thì biến ngẫu nhiên chuẩn hóa Z =m/)p(p

pf 

1sẽ gần đúng có phân

phối chuẩn chuẩn hóa :

22 11f f  S

n

)f (f 

n

)p(p=

−≈

−=σ  

Khi đó biến ngẫu nhiên Z =n/)f (f 

pf 

1sẽ có phân phối chuẩn chuẩn hóa.

Khi Z tuân theo phân phối chuẩn chuẩn hóa, ta có:

P(-Zα/2 < Z < Zα/2) = 1 - α 

α−=⎟⎟⎠

⎞⎜⎜⎝ 

⎛ <

−<− αα 1

122 // Z

n/)f (f 

pf ZP  

α−=⎟⎟⎠

⎞⎜⎜⎝ 

⎛  −+<<

−− αα 1

1122

n

)f (f Zf p

n

)f (f Zf P //

 

Khoảng tin cậy của p :

Gọi f là tỷ số số lần thành công quan sát đượ c trong phép thử đượ c rút từ tập hợ p chính cótỷ số số lần thành công là p. Nếu n lớ n thì khoảng tin cậy của p là:

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 13/15

Cao Hào Thi 86

n

)f (f Zf p

n

)f (f Zf  //

−+<<

−− αα

1122  

Trong đó Zα/2 là số có P(Z > Zα/2) = α/2 (Z là biến ngẫu nhiên chẩn hóa)

Thí d ụ:

Một công ty đi nhận một lô hàng gồm vài ngàn sản phẩm. Ngườ i giám định lô hàng lấy

ngẫu nhiên 81 sản phẩm và nhận thấy 8 sản phẩm không đạt yêu cầu. Tìm khoảng tin cậy

90% của tỷ lệ số sản phẩm không đạt yêu cầu trong toàn bộ lô hàng.

Giải:

Ta có : α = 10% ⇒ tra bảng Zα/2 = Z5% = 1,645,

099,081

8===

n

X f  và

n

)f (f f 

−=σ

1= 0,033

Khoảng tin cậy 90% của p là :

0,099 -1,645*0,033 < p < 0,099 + 1,645*0,033

0,045 < p < 0,153

7.3.7  Ướ c lượ ng cỡ mẫu (Estimating the Sample Size)

Trong các phần tr ướ c, chúng ta đi tìm các ướ c lượ ng khoảng đối vớ i các tham số thống kê

θ (µx, σ2x, p …) của tập hợ p chính dựa trên các mẫu cho tr ướ c (nghĩ a là đã biết cỡ mẫu

n). Vớ i cách làm đó, ta có thể gặp những k ết quả không mong muốn là bề r ộng của

khoảng tin cậy w quá lớ n, có nghĩ a là độ chính xác của các ướ c lượ ng nhỏ (vì độ chính

xác hay dung sai = w/2 có giá tr ị lớ n).

w = 2ε

ε θ −ˆ θ ̂ ε θ  +ˆ

 

ε nói lên độ chính xác của ướ c lượ ng, nếu ε càng nhỏ thì θ̂ càng gần θ.

Trong thực tế thườ ng sai số cho phép ta ấn định độ chính xác ε (có nghĩ a là ấn định tr ướ cbề r ộng khoảng tin cậy w) từ đó tính toán chọn cỡ mẫu đủ lớ n để đảm bảo độ chính xác ε.

Để xác định cỡ mẫu ta cần các thông tin sau:

-  Định rõ độ tin cậy (1 - α), thườ ng là 90%, 95%, hay 99%.

-  Độ chính xác hay sai số cho phép ε hoặc bề r ộng khoảng tin cậy w.

-  Độ lệch chuẩn.

Cỡ mẫu n lớ n hay nhỏ phụ thuộc độ phân tán σ, sai số cho phép ε chứ không phụ thuộc

vào kích thướ c tập hợ p chính N.

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 14/15

Cao Hào Thi 87

a.  C ỡ mẫ u đố i vớ i khoảng tin cậy của trung bình µ trong N( µ;σ2) vớ i σ2

bi ế t tr ướ c:

- +

w = 2ε

xx

n

Z  σ α  2/x

n

Z  σ α  2/x

 

x n 

x n 

x x − −

− < < +α α σ µ 

σ / / 2 2

 

hay : µ = X  ± 2ε vớ i ε =n

Z x/ σα 2  

Vớ i sai số cho phép ε cho tr ướ c, cỡ mẫu n đối vớ i ướ c lượ ng µ trong N(µ;σ

2

) vớ i σ

2

biếttr ướ c đượ c xác định bở i công thức:

2

22

2/

ε 

σ α  xZ n =  

Thí d ụ: 

Giả sử độ lệch chuẩn của các đườ ng ống thép đượ c sản xuất ra trong ngày ở một phân

xưở ng là 10 kg. Chúng ta muốn ướ c lượ ng trong lượ ng trung bình µ của các đườ ng ống

thép đượ c sản xuất ra trong ngày ở phân xưở ng đó vớ i độ chính xác ± 2,5kg và vớ i độ tin

cậy 95%. Tìm cỡ mẫu cần thiết cho sự ướ c lượ ng nói trên.

Giải:

Ta có: ε = 2,5kg, σ = 10 kg,

α = 5% ⇒ Zα/2 = Z0,025 = 1,96

Vậy: n = 5,615,2

10*96,12

22

=  

Cỡ mẫu n = 62 (ống thép).

b.  C ỡ mẫ u đố i vớ i khoảng tin cậy của trung bình µ trong N( µ;σ2) khi chư a bi ế t σ2:

 

Khoảng tin cậy của trung bình µ trong N(µ;σ2) khi chưa biết σ2: 

n

Stx

n

Stx

x/,nx/,n 2121 α−α− +<µ<−  

⇒  ε =n

S t  xn 2/,1 α −  ⇒ 

2

22

2/,1

ε 

α  xn S t n

−=  

Thí d ụ: 

Một nhà quản lý công ty may muốn ướ c lượ ng khoảng thờ i gian trung bình để một công

nhân hoàn thành một sản phẩm. Cô ta muốn ướ c lượ ng µ vớ i sai số ± 5 phút và vớ i độ tincậy 90%. Bở i vì cô ta chưa có khái niệm gì về giá tr ị độ lệch chuẩn σ của tập hợ p chính,

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 15/15

Cao Hào Thi 88

cô ta lấy mẫu đầu tiên vớ i cỡ mẫu n = 15 công nhân và nhận thấy Sx = 20 phút. Hỏi cỡ  mẫu bằng bao nhiêu để đạt đượ c khoảng tin cậy mong muốn.

Giải:

Ta có: ε = 5 phút, Sx = 20 phút,

α = 10% ⇒ tn-1,α/2 = t14;0,05 = 1,761

Vậy: n = 6,495

20*761,12

22

=  

Cỡ mẫu n = 50 (công nhân).

Ghi chú: sau khi có n = 50 ta phải tính lặp lại lần thứ 2 vớ i cỡ mẫu n = 50 (nghĩ a là tìm Sx

và tn-1,α/2 của mẫu mớ i). Tính lặp nhiều lần ta sẽ đượ c k ết quả hội tụ mong muốn.

c.  C ỡ mẫ u đố i vớ i khoảng tin cậy của p trong phân phố i nhị thứ c: 

Khoảng tin cậy của p trong phân phối nhị thức

n

f f Z f p

n

f f Z f 

)1()1(2/2/

−+<<

−− α α   

⇒  ε =n

f f Z 

)1(2/

−α    ⇒ 

2

2

2/ )1(

ε 

α  f f Z n

−=  

Thí d ụ: 

Một k ỹ sư kiểm tra chất lượ ng sản phẩm muốn tỷ lệ phế phẩm trong dây chuyền sản xuất

vớ i sai số ± 0,05 và độ tin cậy 95%. Trong lần lấy mẫu đầu tiên vớ i 25 sản phẩm ngườ i k ỹ 

sư nhận thấy có 4 phế phẩm. Hỏi cỡ mẫu bằng bao nhiêu để đạt đượ c khoảng tin cậymong muốn.

Giải:

Ta có: ε = 0,05, n = 25, f = 4/25 = 0,16

α = 5% ⇒ Zα/2 = Z0,025 = 1,96

Vậy: n = 5,20605,0

)16,01(*16,0*96,12

2

=−

 

Cỡ mẫu n = 207 (sản phẩm).

Ghi chú:

-  Sau khi có n = 207 ta phải tính lặp lại lần thứ 2 vớ i cỡ mẫu n = 207 (nghĩ a là tìm f của

mẫu mớ i và tính lại n).

-  Nếu ban đầu ta chưa biết cỡ mẫu bằng bao nhiêu ta có thể giả sử f = 0,5 để suy ra n và

thực hiện các bướ c lặp như trên. Tính lặp nhiều lần ta sẽ đượ c k ết quả hội tụ mong

muốn.