GIÁO TRÌNH LÝ THUYẾT XÁC SUẤT VÀ THỒNG KÊ TOÁN

1

ỦY BAN NHÂN DÂN TỈNH NGHỆ AN

TRƢỜNG ĐẠI HỌC KINH TẾ NGHỆ AN

Th.S Bùi Đình Thắng

GIÁO TRÌNH

LÝ THUYẾT XÁC SUẤT

VÀ THỒNG KÊ TOÁN

Lƣu hành nội bộ

Nghệ An, tháng 5 năm 2015

2

LỜI NÓI ĐẦU

Lý thuyết xác suất và thống kê toán học là một ngành toán học ra

đời khoảng thế kỷ XVII, đối tƣợng nghiên cứu của nó là các hiện

tƣợng ngẫu nhiên, các quy luật ngẫu nhiên thƣờng gặp trong thực tế.

Lý thuyết xác suất và thống kê phát triển mạnh mẽ trong thế kỷ XX,

xác suất thống kê đƣợc áp dụng rộng rãi trong nhiều lĩnh vực, trong đó

có kinh tế, xã hội, điều khiển học, y học .... Do đó, ngày nay lý thuyết

Xác suất và thống kê toán đã đƣợc đƣa vào giảng dạy ở hầu hết các

ngành đào tạo trong các trƣờng Đại học và Cao đẳng trong nƣớc và

trên thế giới.

Để kịp thời phục vụ việc học tập của sinh viên, Khoa cơ sở -

Trƣờng Đại học Kinh tế Nghệ An đã tổ chức biên soạn cuốn giáo trình

Lý thuyết xác suất và thống kê toán. Đây là giáo trình dùng chung cho

hệ Cao đẳng và hệ Đại học, dựa vào chƣơng trình giảng dạy bộ môn

Khoa học tự nhiên – Khoa cơ sở có thể lựa chọn nội dung giảng dạy

phù hợp với trình độ của mỗi hệ đào tạo.

Trong giáo trình này chúng tôi không đi sâu vào việc chứng minh

những lý thuyết toán học phức tạp mà trình bày các kiến thức cơ bản

về xác suất và thống kê toán nhằm đảm bảo phần cơ sở toán học cho

quá trình thu thập và xử lý thông tin kinh tế - xã hội sẽ đƣợc tiếp tục

nghiên cứu trong các môn học khác.

Giáo trình đƣợc trình bày gồm 8 chƣơng:

Chương 1. Biến cố ngẫu nhiên và xác suất

Chương 2. Đại lượng ngẫu nhiên và quy luật phân phối xác suất

Chương 3. Một số quy luật phân phối xác suất thường gặp

Chương 4. Đại lượng ngẫu nhiên hai chiều

Chương 5. Các định lý giới hạn

Chương 6. Lý thuyết mẫu

Chương 7. Bài toán ước lượng tham số

Chương 8. Bài toán kiểm định giả thuyết

3

Giáo trình "Lý thuyết xác suất và thống kê toán" đƣợc biên soạn

lần đầu và trong thời gian ngắn nên chắc chắn giáo trình không tránh

khỏi những thiếu sót. Tác giả rất mong nhận đƣợc sự góp ý của bạn

đọc để giáo trình ngày càng đƣợc hoàn thiện.

Tác giả

4

Chƣơng 1

BIẾN CỐ NGẪU NHIÊN VÀ XÁC SUẤT

1.1. BIẾN CỐ NGẪU NHIÊN

1.1.1. Phép thử ngẫu nhiên và các loại biến cố ngẫu nhiên

Phép thử ngẫu nhiên là một thuật ngữ để chỉ một phép thử hay một

thực nghiệm hay một quan sát ... mà kết quả là ngẫu nhiên, không biết

trƣớc một cách chắc chắn. Các kết quả có thể (ký hiệu là ) của phép

thử ngẫu nhiên gọi là các biến cố ngẫu nhiên sơ cấp (biến cố sơ cấp).

1.1.1.1. Định nghĩa. Tập hợp tất cả các biến cố ngẫu nhiên sơ cấp

gọi là không gian mẫu của phép thử, ký hiệu là: Ω.

Số các biến cố sơ cấp của Ω ta ký hiệu là Card(Ω).

Ví dụ 1. 1) Gieo một đồng xu là thực hiện một phép thử ngẫu

nhiên. Các kết quả S = "Xuất hiện mặt sấp", N = "Xuất hiện mặt ngửa" là

các biến cố sơ cấp. Không gian mẫu là = {S, N}. Card() = 2.

2) Gieo ngẫu nhiên một con xúc xắc 6 mặt là thực hiện một phép

thử ngẫu nhiên. Các kết quả Mi: “Xúc xắc xuất hiện mặt i chấm”

(i = 1, 2, ..., 6) là các biến cố sơ cấp. Không gian mẫu là Ω = {M1, M2,

M3, M4, M5, M6}. Card(Ω) = 6.

3) Từ một hộp có 13 viên bi khác nhau ta lấy ra ngẫu nhiên 4 bi,

thì hành động đó là thực hiện một phép thử ngẫu nhiên. Mỗi kết quả

lấy ra đƣợc 4 viên bi trong 13 viên bi là một biến cố sơ cấp. Do đó

không gian mẫu Ω là tập hợp các tổ hợp chập 4 của 13 phần tử.

Card(Ω) = 4

13C = 715.

1.1.1.2. Định nghĩa

Một tập hợp con A đƣợc gọi là một biến cố ngẫu nhiên (biến

cố). Các biến cố ngẫu nhiên sơ cấp A đƣợc gọi là biến cố ngẫu

nhiên sơ cấp thuận lợi cho A. Biến cố A đƣợc gọi là xảy ra khi và chỉ

khi xảy ra một biến cố ngẫu nhiên sơ cấp A. Nhƣ vậy A có thể

có, có thể không xảy ra khi thực hiện phép thử.

Biến cố không bao giờ xảy ra khi thực hiện phép thử đƣợc gọi là

biến cố không thể, ký hiệu là .

5

Biến cố nhất định xảy ra khi thực hiện phép thử đƣợc gọi là biến

cố chắc chắn.

Ví dụ 2. 1) Xét phép thử gieo ngẫu nhiên một con xúc xắc 6 mặt.

Các kết quả:

Ac: “Xúc xắc xuất hiện mặt có số chấm chẵn”;

Al: “Xúc xắc xuất hiện mặt có số chấm lẻ”;

Ant: “Xúc xắc xuất hiện mặt có số chấm là số nguyên tố”;

B: "Xúc xắc xuất hiện mặt có số chấm lớn hơn 4";

C: "Xúc xắc xuất hiện mặt có số chấm bé thua 5"

là các biến cố ngẫu nhiên.

Biến cố "Xúc xắc xuất hiện có số chấm lớn hơn 0" là biến cố chắc

chắn.

Biến cố “Xúc xắc xuất hiện mặt có số chấm lớn hơn 6” là biến cố

không thể.

2) Một hộp có 13 viên bi trong đó có 5 viên bi xanh, 8 viên viên

đỏ. Xét phép thử lấy 5 viên bi. Các kết quả: A = "Lấy ra đƣợc 3 bi

xanh, 2 bi đỏ"; B = "Lấy ra đƣợc 4 bi xanh, 1 bi đỏ"; C = "Lấy ra đƣợc

ít nhất một bi đỏ"; D = "Lấy ra đƣợc nhiều nhất 3 bi xanh" ... là các

biến cố ngẫu nhiên. Biến cố "Lấy ra đƣợc 4 viên bi màu vàng" là biến

cố không thể.

1.1.2. Quan hệ giữa các biến cố

Giả sử A, B là hai biến cố của cùng một phép thử.

1.1.2.1. Quan hệ kéo theo. Ta nói rằng biến cố A kéo theo (hay

thuận lợi) biến cố B nếu biến cố A xảy ra thì biến cố B cũng xảy ra.

Ký hiệu là A ⊂ B.

Ví dụ 3. 1) Xét phép thử gieo một con xúc xắc, ta có: M1⊂ Al,

M4 ⊂ Ac.

2) Chọn ngẫu nhiên một con bài trong bộ bài tú-lơ-khơ gồm 52

quân bài. Gọi A là biến cố chọn đƣợc con bài chất rô; B là biến cố

chọn đƣợc con bài màu đỏ. Khi đó A ⊂ B.

3) Chọn ngẫu nhiên 3 sản phẩm trong một kho hàng có hai loại sản

phẩm loại 1 và loại 2. Gọi A là biến cố chọn đƣợc 3 sản phẩm cùng

loại; B là biến cố chọn đƣợc 3 sản phẩm loại 1. Khi đó B ⊂ A.

6

1.1.2.2. Quan hệ đồng nhất. Ta nói rằng biến cố A đồng nhất (hay

tương đương) với biến cố B nếu trong phép thử đó biến cố A xảy ra

khi và chỉ khi biến cố B xảy ra.

Ký hiệu: A = B.

Ví dụ 4. 1) Xét phép thử gieo một con xúc xắc. Gọi B là biến cố "con

xúc xắc xuất hiện mặt có số chấm là bội của 2 và 3”, thì khi đó B = M6.

2) Thầy giáo chấm bài của 1 sinh viên và cho điểm theo thang

điểm 10. Gọi A là biến cố sinh viên đó đạt điểm nhỏ thua 5; B là biến

cố sinh viên đó không đạt yêu cầu. Khi đó ta có: A = B.

1.1.2.3. Quan hệ xung khắc. Hai biến cố A và B đƣợc gọi là xung

khắc nếu chúng không thể đồng thời xảy ra khi thực hiện phép thử đó.

Trƣờng hợp ngƣợc lại, nếu hai biến cố có thể cùng xảy ra trong

một phép thử thì đƣợc gọi là không xung khắc.

Dãy các biến cố A1, A2, …, An là dãy các biến cố xung khắc từng

đôi nếu Ai, Aj (i j, i, j) xung khắc.

Ví dụ 5. 1) Xét phép thử gieo một con xúc xắc. Các cặp biến cố Mi

và Mj (i ≠ j), M1 và Ant, Ac và Al là xung khắc với nhau.

2) Hai ngƣời cùng bắn vào một mục tiêu. Gọi A là biến cố "ngƣời

thứ nhất bắn trúng"; B là biến cố "ngƣời thứ hai bắn trúng". Khi đó A,

B là hai biến cố không xung khắc, vì khi thực hiện phép thử là cho hai

ngƣời cùng bắn vào mục tiêu thì ngƣời thứ nhất và ngƣời thứ hai có

thể cùng bắn trúng nên A, B có thể đồng thời xảy ra.

3) Chọn ngẫu nhiên 2 viên bi trong một hộp có 3 bi xanh, 4 bi

vàng, 5 bi đỏ.

Gọi A1 là biến cố chọn đƣợc 2 bi xanh; A2 là biến cố chọn đƣợc 2

bi vàng; A3 là biến cố chọn đƣợc 2 bi khác màu. Khi đó A1; A2; A3

xung khắc từng đôi một.

1.1.2.4. Quan hệ đối lập. Hai biến cố A, B đƣợc gọi là đối lập với

nhau nếu trong phép thử đó A xảy ra khi và chỉ khi B không xảy ra.

Ký hiệu biến cố đối lập của biến cố A là A .

Ví dụ 6. 1) Xét phép thử gieo một con xúc xắc. Al = cA .

7

2) Bắn một viên đạn vào mục tiêu. Gọi A là biến cố: "bắn trúng

mục tiêu", A là biến cố "bắn trƣợt mục tiêu". A và A là hai biến cố

đối lập với nhau.

3) Chọn ngẫu nhiên hai viên bi trong một hộp có 3 viên bi xanh, 4

viên bi vàng và 5 viên bi đỏ. Gọi A là biến cố 2 viên bi đƣợc chọn ra

có ít nhất 1 viên bi màu xanh. Gọi A là biến cố 2 viên bi chọn ra

không có viên bi màu xanh.

1.1.3. Các phép toán về biến cố

Giả sử A, B là hai biến cố của cùng một phép thử.

1.1.3.1. Tổng, tích của hai biến cố

Tổng (Hợp) của hai biến cố A và B là một biến cố, ký hiệu là A + B

(hoặc A B ), biến cố A + B xảy ra khi và chỉ khi có ít nhất một trong

hai biến cố A, B xảy ra.

Tích (Giao) của hai biến cố A và B là một biến cố, ký hiệu là

AB (hoặc A B ), biến cố AB xảy ra khi và chỉ khi cả hai biến cố A

và B đồng thời xảy ra.

Ví dụ 7. 1) Xét phép thử gieo một con xúc xắc, ta có:

M2 = AcAnt; = Ac + Al; = MiMj (i j; 1 i, j 6)

2) Bắn hai viên đạn vào một mục tiêu. Gọi A là biến cố "viên thứ

nhất trúng mục tiêu", B là biến cố "viên thứ hai trúng mục tiêu". Khi

đó A + B là biến cố "mục tiêu trúng đạn". AB là biến cố "cả 2 viên

đạn trúng mục tiêu".

3) Một sinh viên chọn ngẫu nhiên một câu hỏi. Gọi A là biến cố

"đƣợc câu lý thuyết", B là biến cố "đƣợc câu khó". Khi đó AB là biến

cố "đƣợc câu lý thuyết khó".

1.1.3.2. Hiệu của 2 biến cố. Hiệu của biến cố A với biến cố B là

một biến cố, ký hiệu là A\B, biến cố A\B xảy ra khi và chỉ khi biến cố

A xảy ra nhƣng biến cố B không xảy ra.

Ví dụ 8. 1) Xét phép thử gieo một con xúc xắc, ta có: M2 = Ant\Al,

Ant\Ac = M5 + M3, Ac\Ant = M4 + M6.

2) Chọn ngẫu nhiên 2 viên bi trong một hộp có 3 viên bi màu

xanh, 4 viên bi màu vàng, 5 viên bi màu đỏ. Gọi A là biến cố chọn

đƣợc ít nhất 1 viên màu xanh; B là biến cố chọn đƣợc 2 viên bi khác

8

màu. A\B là biến cố chọn đƣợc 2 viên bi màu xanh. B\A là biến cố

không thể.

1.1.3.3. Hệ đầy đủ. Các biến cố , ,...,1 2 n

A A A đƣợc gọi là hệ đầy

đủ nếu thỏa mãn:

i) ... ; 1 2 n

A A A

ii) , ,...,1 2 n

A A A đôi một xung khắc.

Ví dụ 9. 1) Xét phép thử gieo một con xúc xắc, ta có: Hệ {Ac, Al},

{M1, M2, …, M6} và {Al, Ant, M4, M6} là các hệ đầy đủ.

2) Cho A là một biến cố bất kỳ. Khi đó {A, Ā} là hệ đầy đủ.

3) Gieo 2 hạt giống, gọi Ai là biến cố có số i hạt nảy mầm

(i = 0, 1, 2). Ta có {A0, A1, A2} là một hệ đầy đủ.

1.1.4. Các tính chất phép toán về biến cố

Các phép toán biến cố A + B, AB, A tƣơng ứng với các phép toán

tập hợp nên chúng có tính chất tƣơng tự.

i) Giao hoán: A + B = B + A; AB = BA;

ii) Kết hợp: A + (B + C) = (A + B) + C; A(BC) = (AB)C = ABC;

iii) Phân phối: A(B + C) = AB + AC;

iv) Lũy đẳng: A + A = A, AA = A;

v) A ; A A; A A;A ;

vi) A = A ;

vii) Luật đối ngẫu De Morgan: . ; A B = A B; AB = A B

viii) A\B = AB. Đặc biệt nếu A và B là hai biến cố xung khắc thì

A\B = A và B\A = B.

9

1.2. XÁC SUẤT CỦA BIẾN CỐ

Xác suất của biến cố là một khái niệm cơ bản trong lý thuyết xác

suất, là đại lƣợng xác định (về số lƣợng) đƣợc dùng để biểu thị cho

khả năng xảy ra của một biến cố trong một phép thử. Biến cố nào có

khả năng xảy ra nhiều hơn thì gán cho giá trị lớn hơn, khả năng xảy ra

nhƣ nhau thì gán cho giá trị bằng nhau.

Qua quá trình phát triển của lý thuyết xác suất và tùy theo đặc

điểm của từng phép thử, chúng ta có những định nghĩa về xác suất

nhƣ sau:

1.2.1. Định nghĩa cổ điển về xác suất

1.2.1.1. Định nghĩa. Xét một phép thử, không gian mẫu

1 2 n, ,... là hữu hạn (gồm một số hữu hạn các biến cố sơ cấp).

Giả sử các biến cố sơ cấp 1, 2, ..., n có đồng khả năng xảy ra

(khả năng xảy ra của các biến cố đó khi thực hiện phép thử là nhƣ nhau).

A là một biến cố ngẫu nhiên bất kỳ, m = Card(A) là số biến cố sơ

cấp thuận lợi cho biến cố A xảy ra.

Khi đó xác suất để biến cố A xảy ra là: m Card(A)

P(A) = .n Card( )

1.2.1.2. Tính chất của xác suất

Từ định nghĩa cổ điển về xác suất ta có thể suy ra các tính chất sau

đây:

i) 0 P(A) 1;

ii) P( ) = 0; P( ) = 1.

Chứng minh:

i) Vì Card(A)

0 Card(A) n 0 1 0 P(A) 1.n

ii) Vì Card() = 0 và Card() = n P( ) 0, P() = 1.

Ví dụ 1. 1) Gieo một con xúc xắc cân đối và đồng chất. Tìm xác

suất của các biến cố:

A là biến cố "xúc xắc xuất hiện mặt có số chấm là số chẵn";

B là biến cố "xúc xắc xuất hiện mặt có số chấm nhỏ thua 3".

Giải. Gọi Mi là biến cố xuất hiện mặt có số chấm là i (i = 1, 2, …, 6).

10

Khi đó không gian các biến cố sơ cấp đồng khả năng có 6 phần tử:

= {A1, A2, A3, A4, A5, A6}

Số biến cố sơ cấp thuận lợi cho biến cố A là 3 gồm {A2, A4, A6}.

Do đó xác suất để biến cố A xảy ra là: 3 1

P(A) 0,5.6 2

Số biến cố sơ cấp thuận lợi cho biến cố B là 2 gồm {A1, A2}. Do

đó xác suất để biến cố B xảy ra là P(B) = 2/6 = 1/3 0,333.

2) Một lô hàng gồm 15 sản phẩm trong đó có 12 sản phẩm tốt và 3

sản phẩm xấu. Lấy ngẫu nhiên 2 sản phẩm. Tính xác suất trong các

trƣờng hợp sau:

a) Một sản phẩm tốt và một sản phẩm xấu;

b) Cả hai sản phẩm xấu.

Giải. Số biến cố sơ cấp đồng khả năng là : 2

15C 105.

a) Gọi A là biến cố hai sản phẩm lấy ra có 1 sản phẩm tốt và 1 sản

phẩm xấu.

Số biến cố sơ cấp thuận lợi cho biến cố A là : 1 1

13 2C C 36.

Vậy xác suất để biến cố A xảy ra là: P(A) 36

0,343.105

b) Gọi B là biến cố có hai sản phẩm tốt đƣợc lấy ra.

Số biến cố sơ cấp thuận lợi cho biến cố B là 2

12C 66.

Vậy xác suất để biến cố B xảy ra là: P(B) 66

0,629105

.

1.2.1.3. Ưu điểm và hạn chế của định nghĩa cổ điển về xác suất

Ƣu điểm: Khi tìm xác suất của biến cố ta không cần phải tiến

hành thực nghiệm (phép thử chỉ tiến hành một cách giả định); kết quả

xác suất tìm ra chính xác khi đáp ứng đƣợc các yêu cầu của định

nghĩa.

Nhƣợc điểm: Chỉ áp dụng đƣợc cho các phép thử có số biến cố

sơ cấp hữu hạn và các biến cố đó đồng khả năng xảy ra; trong thực tế

nhiều khi không biểu diễn đƣợc các kết quả của phép thử dƣới dạng

các biến cố sơ cấp đồng khả năng (Ví dụ: Khi tung con xúc xắc ta giả

11

thiết rằng nó cân đối và đồng chất, tuy nhiên trong thực tế hiếm khi có

một con xúc xắc cân đối, đồng chất).

1.2.2. Định nghĩa thống kê về xác suất

1.2.2.1. Tần suất. Xét một phép thử và A là một biến cố nào đó

liên quan đến phép thử. Ta thực hiện phép thử đó n lần (một cách độc

lập) trong những điều kiện giống nhau, nếu trong n lần đó có m

(0 m n) lần biến cố A xảy ra thì tỷ số n

mf (A)

n đƣợc gọi là tần

suất xảy ra biến cố A trong n phép thử.

Ví dụ 2. 1) Một xạ thủ bắn 1000 viên đạn vào mục tiêu và có 800

lần bắn trúng mục tiêu. Gọi A là biến cố xạ thủ bắn trúng mục tiêu.

Khi đó tần suất xảy ra biến cố A là f1000(A) = 800/1000 = 0,8.

2) Để nghiên cứu khả năng xuất hiện mặt sấp khi thực hiện phép

thử tung một đồng xu. Ngƣời ta tiến hành tung một đồng xu nhiều lần

và thu đƣợc kết quả sau đây:

Ngƣời làm

thí nghiệm Số lần tung

Số lần mặt sấp

xuất hiện Tần suất

Buffon 4040 2048 0,5069

Pearson 12000 6019 0,5016

Pearson 24000 12012 0,5005

Qua ví dụ trên nhận thấy, khi số phép thử tăng lên thì tần suất xuất

hiện mặt sấp sẽ giao động ngày càng ít hơn xung quanh giá trị không

đổi 0,5. Điều đó cho phép hy vọng rằng khi số phép thử tăng lên vô

hạn thì tần suất hội tụ về giá trị 0,5.

1.2.2.2. Định nghĩa. Khi số phép thử n càng lớn thì tần suất nf (A)

sẽ dao động xung quanh một hằng số p với biên độ giảm dần tới 0.

Hằng số p đó đƣợc gọi là xác suất của biến cố A, ký hiệu là P(A) = p.

Nhƣ vậy nf (A) P(A) khi n .

1.2.2.3. Ưu điểm và hạn chế của định nghĩa thống kê về xác suất

Ƣu điểm: Khi xác định xác suất bằng thống kê ngƣời ta không đòi

hỏi điều kiện áp dụng nhƣ đối với định nghĩa cổ điển, nó hoàn toàn

dựa trên các quan sát thực tế để làm cơ sở kết luận.

12

Nhƣợc điểm: Theo định nghĩa thống kê của xác suất, ta không thể

xác định chính xác xác suất của một biến cố vì không thực hiện phép

thử vô hạn lần đƣợc.

1.3. CÁC ĐỊNH LÝ VỀ XÁC SUẤT

1.3.1. Định lý cộng

1.3.1.1. Định lý. i) Nếu A, B là hai biến cố xung khắc với nhau thì:

P(A + B) = P(A) + P(B); ii) Nếu A1, A2, …, An là dãy các biến cố xung khắc với nhau từng

đôi một thì: 1 2 1 2P(A A ... A ) P(A ) P(A ) ... P(A ).n n

Chứng minh: i) Vì A, B là hai biến cố xung khắc nên không có

biến cố sơ cấp nào thuận lợi cho cả A và B. Số biến cố sơ cấp thuận

lợi cho A + B là m = mA + mB, trong đó mA là số biến cố sơ cấp thuận

lợi cho A và mB là biến cố sơ cấp thuận lợi cho B. Từ đó suy ra:

A B A Bm m m mP(A B) P(A) P(B).

n n n

ii) Ta chứng minh theo phƣơng pháp quy nạp toán học:

+ Với n = 2: Theo i) ta có 1 2 1 2P(A A ) P(A ) P(A ) nên ii) đúng

với n = 2.

+ Giả sử ii) đúng với n = k, tức là:

1 2 1 2P(A A ... A ) P(A ) P(A ) ... P(A ).k k

+ Với n = k + 1, ta có:

1 2 k k 1 1 2 k k 1P(A A ... A A ) P(A A ... A ) P(A ) (theo i))

1 2 1(P(A ) P(A ) ... P(A )) P(A ).k k

(theo giả thiết quy nạp) ii) đúng với n = k + 1.

Vậy theo phƣơng pháp chứng minh quy nạp toán học ta có: Nếu

A1, A2, …, An là dãy các biến cố xung khắc với nhau từng đôi một thì:

1 2 1 2P(A A ... A ) P(A ) P(A ) ... P(A ), , 2.n n n n

Ví dụ 1. Một hộp 6 bi đỏ và 4 bi xanh hoàn toàn giống nhau về

kích thƣớc và trọng lƣợng. Ta lấy ngẫu nhiên 2 bi. Tìm xác suất để 2

bi lấy ra cùng màu.

Giải. Gọi A là biến cố 2 bi lấy ra đều màu xanh.

B là biến cố 2 bi lấy ra đều màu đỏ.

13

C là biến cố 2 bi lấy ra đều cùng màu.

Khi đó: C = A + B và A, B xung khắc nên:

P(C) = P(A + B) = P(A) + P(B)

Ta có: 2

4

2

10

C 2P(A) 0,133

C 15 ;

2

6

2

10

C 5P(B) 0,333.

C 15

Vậy xác suất để lấy ra 2 bi cùng màu là:

2 5 7P(C) 0,467.

15 15 15

1.3.1.2. Hệ quả. i) Nếu A là biến cố đối lập của biến cố A thì xác

suất của biến cố A là P(A) 1 P(A);

ii) Nếu A1, A2, …, An là hệ đầy đủ các biến cố thì:

P(A1) + P(A2) + ... + P(An) = 1.

Chứng minh: i) Vì A và A đối lập nên A và A xung khắc do đó

theo Định lý 1.3.1.1 ta có:

P( ) P(A A) P(A) P(A) 1 P(A) P(A) P(A) 1 P(A).

ii) Nếu A1, A2, …, An là hệ đầy đủ các biến cố thì A1, A2, …, An

dãy các biến cố đôi một xung khắc và A1 + A2 + …+ An = .

Do đó:

1 2 n 1 2 n1 P( ) P(A A ... A ) P(A ) P(A ) ... P(A ).

Ví dụ 2. Một hộp có 50 sản phẩm loại I và 15 sản phẩm loại II.

Lấy ngẫu nhiên 10 sản phẩm để kiểm tra. Tính xác suất để có ít nhất 1

sản phẩm loại II trong 10 sản phẩm đƣợc kiểm tra.

Giải. Gọi A là biến cố "có ít nhất 1 sản phẩm loại II trong 10 sản

phẩm đƣợc kiểm tra". Khi đó A là biến cố không có sản phẩm loại II

nào trong 10 sản phẩm đƣợc kiểm tra.

Ta có: 10 10

50 50

10 10

65 65

C CP(A) P(A) 1 0,943.

C C

1.3.1.3. Định lý cộng mở rộng

i) Nếu A, B là 2 biến cố bất kỳ thì P(A + B) = P(A) + P(B) –

P(AB);

14

ii) Nếu A, B, C là 3 biến cố bất kỳ thì P(A + B + C) = P(A) + P(B)

+ P(C) – P(AB) – P(BC) – P(CA) + P(ABC);

iii) Nếu A1, A2, …, An là dãy các biến cố bất kỳ thì n n

i i i j i j k

i 1 i 1 1 i j n 1 i j k n

P A P(A ) P(A A ) P(A A A ) ...

n 1

1 2 n( 1) P(A A ...A ).

Chứng minh: i) Ta có A B A BA ; A và BA xung khắc với nhau.

Khi đó, P(A B) P(A) P(BA) .

Mặt khác, B B(A A) BA BA nên P(B) P(BA) P(BA)

P(BA) = P(B) – P(AB).

Từ đó, ta có: P(A + B) = P(A) + P(B) – P(AB).

ii) P(A + B + C) = P(A) + P(B + C) – P(A(B+C))

= P(A) + P(B) + P(C) – P(BC) – P(AB + AC)

= P(A) + P(B) + P(C) – P(BC) – P(AB + AC) –

{P(AB) + P(AC) – P(ABC)}.

P(A + B + C) = P(A) + P(B) + P(C) – P(BC) – P(AB + AC) –

{P(AB) + P(AC) – P(ABC)}.

iii) Chứng minh tƣơng tự ii.

Ví dụ 3. Một lớp có 20 sinh viên, trong đó có 10 sinh viên biết

tiếng Anh, 12 sinh viên biết tiếng Pháp, 7 sinh viên biết cả 2 thứ tiếng.

Gọi ngẫu nhiên 1 sinh viên. Tìm xác suất để:

a) Sinh viên đó biết ít nhất 1 ngoại ngữ;

b) Sinh viên đó không biết ngoại ngữ.

Giải: a) Gọi A là biến cố sinh viên đƣợc gọi biết tiếng Anh:

10P(A) 0,5.

20

B là biến cố sinh viên đƣợc gọi biết tiếng Pháp: 12

P(B) 0,6.20

AB là biến cố sinh viên biết cả 2 thứ tiếng 7

P(AB) 0,35.20

C là biến cố sinh viên đƣợc gọi biết ít nhất 1 ngoại ngữ: C = A + B

Khi đó: P(C) = P(A + B) = P(A) + P(B) P(AB)

15

10 12 7 15P(C) 0,75.

20 20 20 20

b) C là biến cố sinh viên đƣợc gọi biết ít nhất 1 ngoại ngữ, nên

C là biến cố sinh viên đƣợc gọi không biết ngoại ngữ:

P(C) = 1 P(C) 0,25.

1.3.2. Định lý nhân

1.3.2.1. Xác suất có điều kiện. Giả sử A, B là 2 biến cố, P(B) > 0.

Xác suất có điều kiện của biến cố A khi biến cố B đã xảy ra là một số

không âm, ký hiệu là P(A/B) , nó đặc trƣng cho khả năng xảy ra của

biến cố A trong tình huống biến cố B đã xảy ra.

Ví dụ 4. Một hộp có 4 bi đỏ và 3 bi xanh. Lấy ngẫu nhiên ra lần

lƣợt 2 viên bi, mỗi lần 1 viên (lấy không hoàn lại). Tìm xác suất để:

a) Bi lấy ra lần 2 là bi đỏ, biết rằng bi lấy ra lần 1 là bi đỏ.

b) Bi lấy ra lần 2 là bi xanh, biết rằng bi lấy ra lần 1 là bi xanh.

Giải. Gọi Ai là biến cố bi lấy ra lần thứ i là bi đỏ (i = 1, 2).

a) Khi bi lấy ra lần thứ nhất là bi xanh, trong hộp lúc này chỉ còn

lại 6 viên bi gồm 3 đỏ và 3 xanh. Do đó xác suất lấy ra lần 2 là bi đỏ

khi biết bi lấy ra lần 1 là bi đỏ là: 2 1

3P(A /A ) 0,5.

6

b) Khi bi lấy ra lần thứ nhất là bi xanh, trong hộp lúc này chỉ còn

lại 6 viên bi gồm 4 đỏ và 2 xanh. Do đó xác suất lấy ra lần 2 là bi xanh

khi biết bi lấy ra lần 1 là bi xanh là: 2 1

2P(A /A ) 0,333.

6

1.3.2.2. Định lý nhân. Giả sử A, B là 2 biến cố. Khi đó ta có:

P(AB) = P(B).P(A/B) nếu P(B) > 0

hoặc P(AB) = P(A).P(B/A) nếu P(A) > 0.

Chứng minh: Giả sử n là biến cố sơ cấp đồng khả năng xảy ra của

phép thử. mA, mB là số biến cố sơ cấp thuận lợi cho biến cố A, B; k là

số biến cố sơ cấp thuận lợi cho A và B.

Khi đó: Ak mP(AB) ;P(A)

n n .

Với điều kiện biến cố B đã xảy ra thì tổng số biến cố sơ cấp đồng

khả năng lúc này là mB trong đó có k biến cố thuận lợi cho A. Do đó:

16

B

kP(A / B)

m và P(B) > 0 (vì B đã xảy ra)

Nhƣ vậy:

BB

kk P(AB)nP(A / B) P(AB) P(B).P(A / B).

mm P(B)

n

Vì vai trò của A, B nhƣ nhau nên nếu P(A) > 0 thì

P(AB) = P(A).P(B/A).

Ví dụ 5. Trong một hộp có 5 chính phẩm và 3 phế phẩm. Lấy ngẫu

nhiên lần lƣợt hai sản phẩm. Tìm xác suất để cả hai sản phẩm lấy ra

đều là chính phẩm.

Giải. Gọi Ai là biến cố "sản phẩm lấy ra lần thứ i là chính phẩm"

(i = 1, 2). A là biến cố "cả hai sản phẩm lấy ra đều là chính phẩm".

Khi đó A = A1A2

P(A) = P(A1A2 ) = P(A1).P(A2/A1) = 5 4

. 0,357.8 7

1.3.2.3. Định lý nhân mở rộng. Giả sử A1, A2, …, An là các biến

cố của cùng 1 phép thử. Khi đó:

P(A1A2…An) = P(A1).P(A2/A1).P(A3/A1A2)…P(An/A1A2…An-1)

với điều kiện: P(A1A2…An-1) > 0.

Chứng minh: Ta chứng minh theo phƣơng pháp quy nạp toán học:

+ Với n = 2: Theo Định lý 1.3.2.2, ta có:

P(A1A2) = P(A1).P(A2/A1) Định lý đúng với n = 2.

+ Giả sử định lý đúng với n = k, tức là:

P(A1A2…Ak) = P(A1).P(A2/A1).P(A3/A1A2)…P(Ak/A1A2…Ak-1)

+ Ta chứng minh định lý đúng với n = k + 1.

Theo Định lý 1.3.2.2, ta có:

P(A1A2…Ak+1) = P(A1A2...Ak).P(Ak+1/A1A2…Ak

Theo giả thiết quy nạp, ta có:

P(A1A2…Ak+1) = P(A1).P(A2/A1).P(A3/A1A2)…P(Ak/A1A2…Ak-1).

P(Ak+1/A1A2…Ak)

với n = k + 1 định lý đúng.

17

Vậy theo phƣơng pháp quy nạp toán học ta suy ra Định lý 1.3.3.3

đúng với mọi n .

Ví dụ 6. Một hộp có 4 chính phẩm và 2 phế phẩm. Lấy ngẫu nhiên

lần lƣợt từng sản phẩm một (không hoàn lại) để kiểm tra cho tới khi

lấy ra đƣợc 2 phế phẩm thì thôi. Tìm xác suất các biến cố sau:

a) Việc kiểm tra dừng lại khi kiểm tra tới sản phẩm thứ 2.

b) Việc kiểm tra dừng lại khi kiểm tra tới sản phẩm thứ 3.

c) Giả sử việc kiểm tra dừng lại khi kiểm tra sản phẩm thứ 3. Tìm

xác suất để sản phẩm kiểm tra ở lần 1 là chính phẩm.

Giải.

a) Gọi Ai là biến cố sản phẩm lấy ra kiểm tra lần thứ i là phế phẩm

(i = 1, 2, 3).

iA là biến cố đối lập với biến cố Ai (i = 1, 2).

A là biến cố việc kiểm tra dừng lại khi kiểm tra sản phẩm thứ 2.

Khi đó: A = A1A2

P(A) = P(A1A2) = P(A1)P(A2/A1) = 2 1

. 0,067.6 5

b) Gọi B là biến cố việc kiểm tra dừng lại khi kiểm tra tới sản

phẩm thứ 3.

Khi đó: B = A1 2A A3 + 1A A2A3.

Ta có 2 biến cố A1 2A A3, 1A A2A3 xung khắc nên:

P(B) = P(A1 2A A3) + P(1A A2A3).

Mà P( 1A A2A3) = P(A1).P( 2A /A1).P(A3/A1 2A ).

trong đó: P(A1) = 2

6; P( 2A /A1) =

4

5; P(A3/A1 2A ) =

1.

4

P(A1 2A A3) = 2 4 1

. . 0,067.6 5 4

Lại có: P(1A A2A3) = P(

1A ).P(A2/ 1A ).P(A3/ 1A A2)

= 4 2 1 1

. . 0,067.6 5 4 15

18

Vậy P(B) = 2

0,133.15

c) Việc kiểm tra dừng lại khi kiểm tra sản phẩm thứ 3. Xác suất để

kiểm tra sản phẩm kiểm tra ở lần 1 là chính phẩm là:

P(1A /B) = 1P(A B)

.P(B)

Mà 1 1 2 3

1P(A B) = P(A A A ) 0,067.

15

do đó: P(1A /B) =

1115 0,5.

2 2

15

1.3.2.4. Tính chất của xác suất có điều kiện

i) P(/B) = 0; P(/B) = 1;

ii) P((A + C)/B) = P(A/B) + P(C/B) – P(AC/B);

Nếu A, C xung khắc thì P((A + C)/B) = P(A/B) + P(C/B)

iii) P(A/B) = 1 P(A/B).

1.3.3. Tính độc lập của các biến cố

1.3.3.1. Định nghĩa. Hai biến cố A và B của cùng một phép thử

đƣợc gọi là độc lập với nhau nếu sự xảy ra hay không xảy ra của biến

cố này không làm ảnh hƣởng đến xác suất của biến cố kia, tức là

P(A/B) = P(A), P(B/A) = P(B).

Trong lý thuyết và tính toán, ngƣời ta nhận biết tính độc lập bởi

công thức, còn trong thực tế ngƣời ta nhận biết tính độc lập của các

biến cố bằng trực giác.

Ví dụ 7. Hai xạ thủ cùng bắn vào một mục tiêu. Gọi A, B lần lƣợt

là biến cố ngƣời thứ nhất, ngƣời thứ hai bắn trúng mục tiêu. Vì việc hai

ngƣời bắn trúng hay trƣợt mục tiêu không ảnh hƣởng đến kết quả của

nhau nên A, B là hai biến cố độc lập.

Ví dụ 8. Gieo đồng thời hai con xúc xắc. Gọi A là biến cố con xúc

xắc thứ nhất xuất hiện mặt chấm chẵn, B là biến cố con xúc xắc thứ

hai xuất hiện mặt chấm lẻ. Vì việc xuất hiện mặt có số chấm chẵn hay

19

lẻ của mỗi con xúc xắc không làm ảnh hƣởng đến nhau nên A, B là

hai biến cố độc lập.

1.3.3.2. Định lý. Nếu A với B độc lập thì A với B , A với B, A

với B cũng độc lập.

Chứng minh: Vì A, B độc lập với nhau nên P(A/B) = P(A), P(B/A)

= P(B).

Ta có: P(B / A) 1 P(B / A) 1 P(B) P(B) do đó B,A độc lập

với nhau.

Vì vai trò của A, B nhƣ nhau nên A,B độc lập với nhau.

Lại có: P(B / A) 1 P(B / A) 1 P(B) P(B) do đó A với B

độc lập.

1.3.3.3. Hệ quả. Hai biến cố A và B với P(B) > 0 là độc lập khi và

chỉ khi P(AB) = P(A).P(B).

Chứng minh: +) Giả sử A, B độc lập với nhau. Khi đó

P(B/A) = P(B), do đó P(AB) = P(A).P(B).

+) Ngƣợc lại, giả sử P(AB) = P(A).P(B), mà P(AB) = P(A).P(B/A)

nên P(B/A) = P(B). Tƣơng tự P(A/B) = P(A). Vậy A và B độc lập với

nhau.

Ví dụ 9. Hai công ty hoạt động độc lập với nhau đƣợc mời tham

gia đấu thầu một dự án gồm nhiều gói thầu. Khả năng trúng thầu của

các công ty tƣơng ứng là 0,8 và 0,9. Tính xác suất để có ít nhất một

công ty trúng thầu.

Giải. Gọi A1, A2 lần lƣợt là biến cố công ty thứ nhất, thứ hai trúng

thầu.

A là biến cố có ít nhất một công ty trúng thầu.

Khi đó: A = A1 + A2 và A1, A2 độc lập nhƣng không xung khắc.

1 2 1 2 1 2P(A A ) P(A ) P(A ) P(A A )

1 2 1 2P(A ) P(A ) P(A ).P(A ) 0,8 0,9 0,8.0,9 0,98 .

1.3.3.4. Định nghĩa. Các biến cố A1, A2, …, An đƣợc gọi là độc

lập từng đôi một nếu mỗi cặp hai biến cố bất kỳ trong n biến cố độc

lập với nhau.

Khi đó ta có: P(AiAj) = P(Ai).P(Aj) với i ≠ j.

20

Ví dụ 10. Tung một đồng xu 3 lần, gọi Ai (i = 1, 2, 3) là biến cố

"mặt sấp xuất hiện ở lần tung thứ i". Khi đó A1, A2, A3 độc lập từng

đôi một.

1.3.3.5. Định nghĩa. Các biến cố A1, A2, …, An đƣợc gọi là độc

lập toàn phần nếu chúng độc lập từng đôi một và mỗi biến cố độc lập

với tích của một số tùy ý các biến cố còn lại.

Khi đó ta có: P(A1A2…An) = P(A1).P(A2)…P(An).

Chú ý. Các biến cố độc lập toàn phần thì độc lập với nhau từng đôi

một, điều ngƣợc lại không đúng.

Ví dụ 11. Hộp 1 có 3 bi đỏ và 4 bi xanh; Hộp 2 có 2 bi đỏ và 5 bi

xanh. Lấy ngẫu nhiên từ mỗi hộp ra 1 bi. Tìm xác suất các biến cố

sau:

a) 2 bi lấy ra đều màu đỏ;

b) 2 bi lấy ra cùng màu.

Giải. a) Gọi A là biến cố 2 bi lấy ra đều màu đỏ.

Ai là biến cố bi lấy ra từ hộp i là bi đỏ (i = 1, 2).

Khi đó A = A1A2.

Ta có 2 biến cố A1, A2 là độc lập nên P(A) = P(A1).P(A2) =

3 2. 0,123.

7 7

b) iA là biến cố đối lập của Ai (i = 1, 2). Gọi B là biến cố 2 bi lấy

ra đều màu xanh.

Khi đó: B = 1 2A .A ;

1A , 2A độc lập.

1 2 1 2

4 5P B = P A .A P A .P A . 0,408.

7 7

Gọi C là biến cố 2 bi lấy ra đều cùng màu; C = A + B; A, B xung

khắc.

26

P C = P A + B = P(A) + P(B) 0,531.49

1.4. CÁC HỆ QUẢ CỦA ĐỊNH LÝ CỘNG, ĐỊNH LÝ NHÂN

XÁC SUẤT

1.4.1. Công thức xác suất từng phần (đầy đủ)

21

Giả sử A1, A2, …, An là các biến cố tạo thành hệ đầy đủ và

P(Ai) > 0 (i = 1,n ). A là biến cố bất kỳ của phép thử đó. Khi đó ta có:

P(A) = P(A1).P(A/A1) + …+ P(An).P(A/An) = i i

1

P(A )P(A/A ).n

i

Chứng minh: Vì A1, A2, …, An là các biến cố tạo thành hệ đầy đủ

nên:

1 2 nA A ... A 1 2 nA A. AA AA ... AA .

Vì A1, A2, …, An đôi một xung khắc nên 1 2 nAA ,AA ,...,AA cũng đôi

một xung khắc.

Do đó: 1 2 nP(A) P(AA ) P(AA ) ... P(AA )

1 1 2 2 n nP(A) P(A )P(A / A ) P(A )P(A / A ) ... P(A )P(A / A )

n

i i

i 1

P(A )P(A / A ).

Ví dụ 1. Có 3 hộp hoàn toàn giống nhau về hình thức.

Hộp 1 có 4 chính phẩm, 2 phế phẩm.



Lấy ngẫu nhiên 1 hộp rồi từ đó lấy ra 1 sản phẩm. Tìm xác suất để

sản phẩm đó là chính phẩm.

Giải. Gọi Ai là biến cố hộp i đƣợc lấy ra (i = 1, 2, 3)

1 2 3

1P(A ) = P(A ) = P(A ) .

3

Ta có: {A1, A2, A3} là hệ đầy đủ.

Gọi A là biến cố lấy ra đƣợc chính phẩm. Áp dụng công thức xác

suất từng phần ta có:

P(A) = P(A1).P(A/A1) + P(A2).P(A/A2) + P(A3).P(A/A3).

trong đó: P(A/A1) = 4

6; P(A/A2) =

3

6; P(A/A3) =

5.

6

1 4 3 5 2P(A) .

3 6 6 6 3

22

1.4.2. Định lý Bayes

Giả sử A1, A2, …, An là các biến cố tạo thành hệ đầy đủ và

P(Ai) > 0 (i = 1,n ). A là biến cố bất kỳ của phép thử đó và P(A) > 0.

Khi đó ta có:

i ii

P(A ).P(A/A )P(A /A) = , i=1,n .

P(A)

Chứng minh: Theo Định lý 1.3.2.2, ta có:

i i i iP(AA ) P(A)P(A / A) P(A )P(A / A ), i 1,n .

Do đó: i ii

P(A )P(A / A )P(A / A) , i 1,n.

P(A)

Ví dụ 2. Một cửa hàng bán bóng đèn cùng loại do 3 cơ sở sản xuất

cung cấp. Cơ sở 1, cơ sở 2, cơ sở 3 cung cấp lƣợng hàng tƣơng ứng là

40%, 35%, 25%. Biết tỉ lệ bóng hỏng do cơ sở 1, cơ sở 2, cơ sở 3 sản

xuất tƣơng ứng là 2%, 2%, 3%. Ta mua ngẫu nhiên 1 bóng của cửa

hàng.

a) Tìm xác suất để bóng mua bị hỏng;

b) Giả sử bóng mua bị hỏng. Hỏi bóng mua do cơ sở nào sản xuất

là có khả năng xảy ra cao nhất.

Giải. a) Gọi Ai là biến cố bóng mua do cơ sở i sản xuất

(i = 1, 2, 3).

Gọi A là biến cố bóng mua bị hỏng.

P(A1) = 0,4; P(A2) = 0,35; P(A3) = 0,25.

Hệ {A1; A2; A3} tạo thành hệ đầy đủ. Do đó áp dụng công thức

xác suất từng phần ta có:

P(A) = P(A1).P(A/A1) + P(A2).P(A/A2) + P(A3).P(A/A3)

trong đó: P(A/A1) = 0,02; P(A/A2) = 0,02; P(A/A3) = 0,03.

Vậy P(A) = 0,023.

b) Bóng mua bị hỏng có thể là do cơ sở 1, hoặc cơ sở 2, hoặc cơ sở

3 sản xuất.

Xác suất để bóng hỏng mua do cơ sở 1 sản xuất là:

1 11

P(A ).P(A/A ) 0,4.0,02 80P(A /A) = = = .

P(A) 0,0225 225

23


2 22

P(A ).P(A/A ) 0,35.0,02 70P(A /A) = = = .

P(A) 0,0225 225


3 33

P(A ).P(A/A ) 0,25.0,03 75P(A /A) = = = .

P(A) 0,0225 225

Vậy bóng mua bị hỏng do cơ sở 1 sản xuất xảy ra nhiều nhất.

1.4.3. Công thức Bernoulli

1.4.3.1. Định nghĩa. Tiến hành n lần phép thử độc lập trong những

điều kiện nhƣ nhau. Giả sử ở mỗi phép thử, biến cố A xảy ra với xác

suất p không đổi. Khi đó xác suất để trong n phép thử biến cố A xảy ra

đúng k lần là:

k k n k

n nP (k) = C p (1 p) , k = 1, 2, ..., n

công thức trên đƣợc gọi là công thức Bernoulli.

1.4.3.2. Hệ quả. Với các giả thiết nhƣ trên ta có:

i) Xác suất để trong n phép thử biến cố A không xảy ra lần nào là:

(1 – p)n;

ii) Xác suất để trong n phép thử biến cố A luôn luôn xảy ra là: pn;

iii) Để trong n phép thử biến cố A xảy ra ít nhất k1 lần và nhiều

nhất k2 lần là: Pn(k1 ≤ k ≤ k2) = 2

1

kk k n k

n

k = k

C p (1 p) .

Ví dụ 3. Một xạ thủ bắn 1 phát vào bia một cách độc lập. Xác suất

trúng đích của mỗi phát bắn đều 0,8. Tìm xác suất để:

a) Trong 10 phát bắn có đúng 6 phát trúng.

b) Trong 10 phát bắn có ít nhất 8 phát trúng.

Giải. Xem mỗi phát bắn là một phép thử. Gọi A là biến cố bắn

trúng đích.

Do đó theo giả thiết bài toán, ta thực hiện 10 phép thử độc lập.

Trong mỗi phép thử biến cố A xảy ra với xác suất không đổi là

p = P(A) = 0,8.

a) Áp dụng công thức Bernoulli ta có, xác suất để trong 10 phát

bắn có đúng 6 phát trúng đích là:

24

6 6 4

10 10P (6) C (0,8) (1 0,8) .

b) Xác suất để trong 10 phát bắn có ít nhất 8 phát trúng là:

10 10 10P = P (8) + P (9) + P (10) 8 8 2 9 9 9 10 10 10

10 10 10P C (0,8) (1 0,8) C (0,8) (1 0,8) C (0,8) (1 0,8) .

25

BÀI TẬP CHƢƠNG 1

Bài 1.1. Gieo một con xúc xắc đối xứng và đồng chất. Tìm xác

suất để đƣợc:

a. Mặt sáu chấm xuất hiện.

b. Mặt có số chấm xuất hiện là mặt chấm chẵn lớn hơn 2.

Đ/s: a. 1/6; b. 1/3.

Bài 1.2. Có 100 tấm bìa hình vuông đƣợc đánh số từ 1 đến 100. Ta

lấy ngẫu nhiên một tấm bìa. Tìm xác suất:

a. Đƣợc một tấm bìa có số không có chữ số 5.

c. Đƣợc một tấm bìa có số chia hết cho 2 hoặc cho 5 hoặc cả cho 2

và cho 5.

Đ/s: a. 0,81; b. 0,6.

Bài 1.3. Một bộ bài Tú- lơ-khơ có 52 quân bài. Lấy ngẫu nhiên ra

2 quân bài. Tính xác suất:

a. Hai con bài lấy ra đều là con 2.

b. Hai con bài lấy ra có một con 2 và một con Át.

c. Hai con bài lấy ra ít nhất có một con Át.

Đ/s: a. 1

221; b. 8

663; c.

33

221.

Bài 1.4. Một hộp chứa 9 thẻ đánh số từ 1 đến 9. Chọn ngẫu nhiên

ra 3 thẻ. Tính xác suất để 3 thẻ lấy ra đều là số chẵn.

Đ/s: 1

21.

Bài 1.5. Một hộp có 10 sản phẩm trong đó có 4 phế phẩm, 6 chính

phẩm. Lấy ngẫu nhiên ra 3 sản phẩm. Tính xác suất:

a. 3 sản phẩm lấy ra đều là chính phẩm.

b. Có đúng 2 phế phẩm.

Đ/s: a. 1

6; b. 3

10.

Bài 1.6. Một lô hàng gồm 10 sản phẩm loại I, 4 sản phẩm loại II

và 3 phế phẩm. Lấy ngẫu nhiên ra 3 sản phẩm. Tìm xác suất để có:

a. Hai sản phẩm loại I.

26

b. Hai sản phẩm loại I và một sản phẩm loại II.

c. Cả 3 sản phẩm cùng loại.

Đ/s: a. 63

136; b. 9

34; c. 25

136.

Bài 1.7. Gieo ngẫu nhiên hai đồng xu cân đối và đồng chất. Tìm

xác suất để đƣợc:

a. Cả 2 đồng xu đều xuất hiện mặt sấp.

b. Một đồng xu xuất hiện mặt sấp.

c. Ít nhất một đồng xu xuất hiện mặt sấp.

Đ/s: a. 0,25; b. 0,5; c. 0,75.

Bài 1.8. Gieo ngẫu nhiên hai con xúc xắc cân đối và đồng chất.

Tìm xác suất của biến cố sau:

a. A là biến cố "Tổng số chấm xuất hiện ở mặt trên của cả hai con

xúc xắc bằng 7".

b. B là biến cố "Hiệu số chấm xuất hiện ở mặt trên của cả hai con


c. C là biến cố "Tích số chấm xuất hiện ở mặt trên của cả hai con


Đ/s: a. 1/6; b. 10/36; c. 1/9.

Bài 1.9. Một hộp có 6 quả cầu trắng, 4 quả cầu đỏ và 2 quả cầu

đen. Chọn ngẫu nhiên 6 quả cầu. Tìm xác suất để chọn đƣợc 3 quả cầu

trắng, 2 quả cầu đỏ và 1 quả cầu đen.

Đ/s: 20/77.

Bài 1.10. Một hộp có 15 quả cầu kích thƣớc nhƣ nhau, trong đó

có 5 quả cầu màu xanh, 10 quả cầu màu đỏ. Lấy ngẫu nhiên từ trong

hộp ra 3 quả. Tìm xác suất để:

a. Ba quả cầu lấy ra không cùng màu.

b. Trong ba quả cẩu lấy ra có ít nhất một quả màu xanh.

Đ/s: a. 65

91; b. 67

91.

Bài 1.11. Trong một hộp có 10 sản phẩm, trong đó có 2 sản phẩm

là phế phẩm. Lấy ngẫu nhiên ra 6 sản phẩm. Tìm xác suất để:

a. Có không quá một sản phẩm là phế phẩm.

b. Có ít nhất là một phế phẩm.

27

Đ/s: a.2 / 3 ; b.13 /15

Bài 1.12. Một nhóm có 30 nhà đầu tƣ các loại, trong đó có 13 nhà

đầu tƣ vàng, 17 nhà đầu tƣ chứng khoán, 10 nhà đầu tƣ cả vàng và

chứng khoán. Một đối tác gặp ngẫu nhiên một nhà đầu tƣ trong nhóm.

Tính xác suất để ngƣời đó gặp đƣợc nhà đầu tƣ ít nhất một trong 2 loại

vàng, chứng khoán.

Đ/s: 2/3.

Bài 1.13. Xác suất để một xạ thủ bắn bia trúng 10 điểm là 0,1;

trúng 9 điểm là 0,2; trúng 8 điểm là 0,25 và ít hơn 8 điểm là 0,45. Xạ

thủ ấy bắn một viên đạn. Tìm xác suất để xạ thủ đó bắn đƣợc ít nhất là

9 điểm. Đ/s: 0,3.

Bài 1.14. Trong một phân xƣởng có 10 máy hoạt động. Qua

theo dõi thấy xác suất để trong một ca có một máy phải sửa là 0,2;

xác suất để có hai máy phải sửa là 0,13 và xác suất để có nhiều

hơn hai máy phải sửa là 0,07. Tìm xác suất để trong một ca phân

xƣởng đó không phải sửa máy.

Đ/s: 0,6.

Bài 1.15. Có 2 hộp đựng chi tiết. Hộp thứ nhất đựng 10 cái ốc,

trong đó có 6 cái tốt. Hộp thứ hai đựng 15 cái vít, trong đó có 9 cái tốt.

Lấy ngẫu nhiên từ mỗi hộp một chi tiết. Tìm xác suất để lấy đƣợc một

bộ ốc vít tốt.

Đ/s: 9/15.

Bài 1.16. Một ngƣời có 4 bóng đèn trong đó có 2 bóng đèn bị

hỏng. Ngƣời đó thử lần lƣợt từng bóng đèn (không hoàn lại) cho đến

khi chọn đƣợc bóng tốt. Tính xác suất để ngƣời đó thử đến lần thứ 2.

Đ/s: 1/3.

Bài 1.17. Một lô hàng có 100 sản phẩm. Lấy ngẫu nhiên liên tiếp 5

sản phẩm để kiểm tra. Nếu có ít nhất một sản phẩm xấu thì không

nhận lô hàng. Tìm xác suất để nhận lô hàng. Biết rằng tỷ lệ phế phẩm

của lô hàng là 5%.

Đ/s: 0,77

Bài 1.18. Trong hộp có 8 quả cầu đỏ và 12 quả cầu trắng kích

thƣớc nhƣ nhau. Một ngƣời lấy ngẫu nhiên từ trong hộp ra mỗi lần

28

một quả cầu sau đó hoàn lại rồi lấy tiếp cho đến khi lấy đƣợc quả cầu

đỏ thì dừng lại. Tìm xác suất để lấy quả cầu thứ tƣ thì dừng lại.

Đ/s: 54/625.

Bài 1.19. Một hộp có 36 bóng đèn điện, trong đó có 4 loại bóng

đèn màu xanh. Ta lấy ngẫu nhiên lần lƣợt hai bóng đèn. Tìm xác suất

để lần thứ hai lấy đƣợc một loại bóng đèn màu xanh nếu lần thứ nhất

lấy đƣợc một bóng đèn màu xanh.

Đ/s: 3/35.

Bài 1.20. Trong một lô hàng có 50 sản phẩm, trong đó có 10 sản

phẩm loại I, 40 sản phẩm loại II. Lấy ngẫu nhiên lần lƣợt 3 sản phẩm

(lấy không hoàn lại). Tính xác suất để:

a. Cả ba sản phẩm đều cùng loại I.

b. Cả ba sản phẩm đều cùng loại.

Đ/s: a. 3/490; b. 25/49.

Bài 1.21. Có ba ngƣời bắn vào một mục tiêu. Xác suất ngƣời thứ

nhất bắn trúng là 0,7; ngƣời thứ hai bắn trúng là 0,8 và ngƣời thứ ba

bắn trúng là 0,5. Tìm xác suất để:

a. Có một ngƣời bắn trúng mục tiêu.

b. Có hai ngƣời bắn trúng mục tiêu.

c. Cả ba ngƣời đều bắn trật mục tiêu.

Đ/s: a. 0,22; b. 0,47; c. 0,03.

Bài 1.22. Có 3 sinh viên cùng làm bài thi. Xác suất làm đƣợc bài

của từng sinh viên lần lƣợt là: 0,8; 0,7; 0,6.

a. Tìm xác suất để có một sinh viên làm đƣợc bài thi.

b. Tìm xác suất để có hai sinh viên làm đƣợc bài thi.

c. Nếu có hai sinh viên làm đƣợc bài thi, tìm xác suất để sinh viên

thứ nhất không làm đƣợc bài thi.

Đ/s: a.0,188 ; b. 0,452; c. 21/113.

29

Chƣơng 2

ĐẠI LƢỢNG NGẪU NHIÊN

VÀ QUY LUẬT PHÂN PHỐI XÁC SUẤT

2.1. ĐỊNH NGHĨA VÀ PHÂN LOẠI ĐẠI LƢỢNG NGẪU

NHIÊN

2.1.1. Định nghĩa. Cho một phép thử ngẫu nhiên và là không

gian mẫu của phép thử đó. Một đại lƣợng mà ứng với mỗi kết quả

nhận một giá trị thực duy nhất nào đó đƣợc gọi là đại lượng

ngẫu nhiên một chiều liên kết với phép thử đã cho (gọi tắt là biến ngẫu

nhiên hay đại lƣợng ngẫu nhiên).

2.1.1.1. Các ký hiệu

Đại lƣợng ngẫu nhiên (ĐLNN) liên kết với một phép thử thƣờng

đƣợc ký hiệu bởi các chữ cái in hoa: X, Y, Z, ..., X1, X2, ...

Giá trị của ĐLNN X ứng với mỗi kết quả cụ thể của phép thử là

số thực thƣờng đƣợc ký hiệu là X() hay ký hiệu bởi các chữ in

thƣờng x, y, z, ..., x1, x2, ...

Tập hợp các giá trị thực mà ĐLNN X đƣợc ứng với tất cả các kết

quả đƣợc gọi là tập giá trị của ĐLNN X, ký hiệu là DX.

Ký hiệu: (X a) là biến cố / X( ) a

(X a) là biến cố / X( ) a

(X a) là biến cố / X( ) a

(a X b) là biến cố / a X( ) b ...

Chú ý: Nếu X, Y, .. là các ĐLNN liên kết với cùng một phép thử

ngẫu nhiên thì X, X + Y, XY, X/Y, ... cũng là một ĐLNN.

2.1.1.2. Các ví dụ

Ví dụ 1. Xét phép thử gieo một lần 2 đồng xu cân đối đồng chất,

mỗi đồng xu có 2 mặt là S và N, ta có = {SS, NN, SN, NS}.

ĐLNN X chỉ số mặt N xuất hiện khi gieo 2 đồng tiền, khi đó X là

ĐLNN với phép thử đã cho.

30

Ứng với = SS ta có X() = 0, với = NN ta có X() = 2, với

= SN ta có X() = 1, với = NS ta có X() = 1

Vậy tập giá trị của ĐLNN X là DX = {0, 1, 2}

Ví dụ 2. Một rổ cam có 10 quả trong đó có 4 quả hỏng. Lấy ngẫu

nhiên 5 quả. Đại lƣợng Y chỉ số quả hỏng có trong 5 quả lấy ra là 1

ĐLNN.

Ứng với kết quả = lấy ra đƣợc 5 quả tốt thì Y() = 0, với kết

quả lấy ra đƣợc 4 quả tốt 1 quả hỏng thì Y() = 1, ...

Tập giá trị của ĐLNN X là DY = {0, 1, 2, 3, 4}.

Ví dụ 3. Xét phép thử gieo đồng thời 2 con xúc xắc cân đối đồng

chất. Ta có không gian mẫu = { = (x, y)/ x, y {1, 2, 3, 4, 5, 6}}.

Card() = 36.

Đại lƣợng Z là tổng số chấm xuất hiện trên 2 con xúc xắc là

ĐLNN.

Ứng với mỗi = (x, y) ta có gía trị của Z là Z() = x + y.

Tập giá trị của ĐLNN Z là:

DZ = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}.

2.1.2. Phân loại đại lƣợng ngẫu nhiên

2.1.2.1. Đại lượng ngẫu nhiên rời rạc

ĐLNN X đƣợc gọi là ĐLNN rời rạc nếu tập giá trị có thể có của

nó là hữu hạn hoặc vô hạn đếm đƣợc.

Ví dụ 4. Tung một con xúc xắc cân đối, đồng chất. Gọi X là số

chấm xuất hiện. Khi đó X là một ĐLNN rời rạc, và nhận các giá trị có

thể có: 1, 2, 3, 4, 5, 6.

Ví dụ 5. Các ĐLNN trong các ví dụ 1, ví dụ 2, ví dụ 3 là các

ĐLNN rời rạc.

2.1.2.2. Đại lượng ngẫu nhiên liên tục

ĐLNN X đƣợc gọi là ĐLNN liên tục nếu tập giá trị có thể có của

nó lấp đầy một khoảng trên trục số.

Ví dụ 6. Xe buýt chạy với tần suất 15 phút một chuyến. Gọi X là

thời gian chờ xe của một ngƣời. Khi đó X là một ĐLNN liên tục, các

giá trị có thể có của X lấp đầy đoạn [0, 15].

31

Ví dụ 7. ĐLNN chỉ chiều cao của sinh viên trƣờng ĐH kinh tế

Nghệ An là một ĐLNN ngẫu nhiên liên tục.

2.2. QUY LUẬT PHÂN PHỐI XÁC SUẤT

Quy luật phân phối xác suất của ĐLNN là một hình thức cho phép

mô tả mối quan hệ giữa các giá trị có thể có của ĐLNN với xác suất

tƣơng ứng để ĐLNN nhận các giá trị có thể có đó.

Trong thực tế ngƣời ta thƣờng sử dụng 3 phƣơng pháp mô tả quy

luật phân phối xác suất của ĐLNN là: Bảng phân phối xác suất, hàm

phân phối xác suất và hàm mật độ phân phối xác suất.

2.2.1. Bảng phân phối xác suất

2.2.1.1. Định nghĩa. Cho X là ĐLNN rời rạc nhận có tập giá trị

DX = {x1, x2, …, xn} và có xác suất tƣơng ứng là pi = P(X = xi),

(i = 1, 2, …, n).

Bảng phân phối xác suất của X là bảng số có dạng:

1 2 n

1 2 n

X x x ... x

P p p ... p

2.2.1.2. Tính chất

i) 0 ≤ pi ≤ 1, (i =1, 2, …, n);

ii) i

i 1

p 1n

;

iii) i

i

x I

P X I P(X x )

, trong đó I .

Chứng minh: i) Dễ dàng suy ra từ tính chất của xác suất.

ii) Vì dãy các biến cố (X = x1), (X = x2), ..., (X = xn) lập thành một

hệ đầy đủ các biến cố nên: n n

i i

i 1 i 1

P(X x ) 1 p 1

.

iii) Biến cố (X I) = (X = x1) + (X = x2) + ... + (X = xk) trong đó:

ix I, i 1,k và (X = x1), (X = x2), ..., (X = xk) đôi một xung khắc.

Do đó i i

i i

x I x I

P X I P (X x ) P(X x ).

32

Ví dụ 1. Cho ĐLNN X có bảng phân phối xác suất

X -2 1 3

P 0,3 – m 0,2 + m 0,1 + 2m

a) Tìm m.

b) Tính P(0 < X 4).

Giải. a) Điều kiện:

0,3 m 0

0,2 m 0 (*)

0,1 2m 0

Theo tính chất ii, ta có: (0,3 – m) + (0,2 + m) + (0,1 + 2m) = 1

m = 0,2 (thỏa mãn điều kiện (*)). Vậy m = 0,2.

b) P(0 < X 4) = P(X = 1) + P(X = 3) = 0,4 + 0,5 = 0,9.

Ví dụ 2. Có 10 sinh viên, trong đó 2 sinh viên giỏi, 3 sinh viên

khá, 5 sinh viên trung bình. Chọn ngẫu nhiên 3 sinh viên. Gọi X là số

sinh viên giỏi đƣợc chọn. Lập bảng phân phối xác suất của X.

Giải. DX = {0, 1, 2}.

P(X = 0) = 0 3

2 8

3

10

7

15

C C

C ;

P(X = 1) = 1 2

2 8

3

10

7

15

C C

C ;

P(X = 2) = 2 1

2 8

3

10

2

15

C C

C .

Do đó bảng phân phối xác suất của X là:

X 0 1 2

P 7

15

7

15

1

15

Ví dụ 3. Hai ngƣời thi bắn súng, khả năng bắn trúng đích của mỗi

ngƣời là: 0,8; 0,9. Gọi X là số ngƣời bắn trúng đích. Lập bảng phân

phối của X.

Giải. DX = {0, 1, 2}.

Gọi Ai là biến cố ngƣời i bắn trúng đích (i = 1, 2).

33

(X = 0) = 1 2A .A P(X = 0) = P(

1 2A .A )

= P(1A ).P(

2A ) (Vì 1 2A ,A độc lập).

P(X = 0) = (1 – 0,8).(1 – 0,9) = 0,02.

(X = 1) = 1 2A .A +

1 2A .A và 1 2A .A ,

1 2A .A xung khắc.

P(X = 1) = P(1 2A .A ) + P(

1 2A .A )

= P(A1).P(2A ) + P(

1A ).P(A2) (Vì A1, 2A và 1A , A2

độc lập)

P(X = 1) = 0,8.(1 – 0,9) + (1 – 0,8).0,9 = 0,26.

(X = 2) = 1 2A .A P(X = 2) = P( 1 2A .A )

= P(A1).P(A2) (Vì A1, A2 độc lập)

= 0,8.0,9 = 0,72.

Vậy bảng phân phối xác suất của X là:

X 0 1 2

P 0,02 0,26 0,72

2.2.2. Hàm phân phối xác suất

2.2.2.1. Định nghĩa. Cho X là ĐLNN (rời rạc hoặc liên tục). Hàm

số ký hiệu và xác định nhƣ sau gọi là hàm phân phối xác suất của

ĐLNN X.

F(t) = P(X < t), với t .

Ví dụ 4. Lập hàm phân phối xác suất của ĐLNN chỉ số mặt ngửa (N)

xuất hiện khi gieo hai đồng xu cân đối đồng chất một cách ngẫu nhiên.

Giải. Ta có tập giá trị của ĐLNN X là DX = {0, 1, 2}.

+ Nếu t 0 ta có (X < t) = nên F(t) = P(X < t) = P() = 0.

+ Nếu 0 < t 1 ta có (X < t) = (X = 0) = {SS} nên F(t) = P(X < t)

= P({SS}) = 1/4.

+ Nếu 1 < t 2 ta có (X < t) = (X = 0) + (X = 1) = {SS, SN, NS}

nên F(t) = 3/4.

+ Nếu 2 < t ta có (X < t) = nên F(t) = P() = 1.

Vậy hàm phân phối xác suất của ĐLNN X là:

34

0 khi t 0

1/ 4 khi 0 t 1F(t)

3 / 4 khi 1 t 2

1 khi 2 t

.


i) 0≤ F(t) ≤ 1, t ;

ii) t t

F( ) lim F(t) 1;F( ) lim F(t) 0

;

iii) F(t) là hàm không giảm.

iv) Hàm F(t) liên tục trái tại mọi điểm t = a .

Nếu X là ĐLNN liên tục thì F(t) liên tục tại mọi điểm t = a ;

v) Với a,b ,a b, ta có: P(a ≤ X < b) = F(b) – F(a).

Nếu X là ĐLNN liên tục thì P(X < a) = P(X a) và P(a ≤ X ≤ b) =

P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b) = F(b) – F(a).

Chứng minh: i) Theo tính chất của xác suất, ta có:

0 P(X t) 1, t .

0 F(t) 1, t .

ii) Khi t + thì biến cố (X < t) dần tới biến cố chắc chắn. Do

đó khi t + thì P(X < t) 1, tức là t

F( ) lim F(t) 1.

Khi t – thì biến cố (X < t) dần tới biến cố không thể. Do đó

khi t – thì P(X < t) 0, tức là t

F( ) lim F(t) 0.

iii) 1 2t , t , nếu 1 2t t thì 2 1 1 2(X t ) (X t ) (t X t )

1 2 1 2 1 2(X t ) (X t ) P(X t ) P(X t ) F(t ) F(t ) , nghĩa

là hàm F(t) không giảm.

iv) Với a , khi t a thì biến cố (X < t) (X < a)

t a t alim F(t) lim P(X t) P(X a) F(a)

F(t) liên tục bên

trái tại điểm a.

35

+) Vì X là ĐLNN liên tục nên tập giá trị của X có dạng (a, b), a có

thể là – , b có thể là + , hay [a, b]. Khi đó hàm phân phối xác suất

của X có dạng:

0 khi t a

F(t) P(X t) khi a t b

1 khi b t

Vì F(t) xác định trên (a, b) nên F(t) liên tục trên (a, b).

+) Xét tính liên tục tại t = a:

t a t a t a t alim F(t) lim P(X t) lim P( ) 0 F(a) lim F(t)

F(t) liên

tục tại t = a.

+) Xét tính liên tục tại t = b:

t b t b t b t blim F(t) lim P(X t) lim P( ) 1 F(b) lim F(t)

F(t) liên

tục tại t = b.

Vậy F(t) liên tục trên .

v) Vì a < b nên (X < b) = (X < a) + (a X < b)

P(X b) P(X a) P(a X b) F(b) F(a) P(a X b)

P(a X b) F(b) F(a) .

+) Với t , cho t số gia t .

Xét t 0 : P(t X t t) F(t t) F(t)

Vì X là ĐLNN liên tục nên

t 0 t 0

lim P(t X t t) lim F(t t) F(t)

P(X t) F(t) F(t) 0.

Tƣơng tự với t 0 , ta cũng có: P(X t) F(t) F(t) 0.

Vậy với X là ĐLNN liên tục thì F(t) = 0, t.

Do đó: P(X a) = P(X < a) + P(X = a) = P(X < a).

và P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b)

= F(b) – F(a).

36

Ví dụ 5. Cho X là ĐLNN có bảng phân phối xác suất.

X 0 1 2

P 7

15

7

15

1

15

Tìm hàm phân phối xác suất F(t) của X.

Giải. + Nếu t ≤ 0 thì F(t) = P(X < t) = P() = 0.

+ Nếu 0 < t ≤ 1 thì F(t) = P(X < t) = P(X = 0) = 7

15.

+ Nếu 1 < t ≤ 2 thì F(t) = P(X = 0) + P(X = 1) = 7

15+

7

15 =

14

15.

+ Nếu t > 2 thì F(t) = P(X = 0) + P(X = 1) + P(X = 2) = 1.

Vậy

0 khi t 0,

7 khi 0 < t 1,

15F(t)

14 khi 1 < t 2,

15

1 khi t > 2.

Ví dụ 6. Cho ĐLNN liên tục X có hàm phân phối xác suất

2

0 khi t 0,

F(t) mt khi 0 < t 3,

1 khi t > 3.

a) Tìm hệ số m.

b) Tính P(– 1 < X 2).

Giải. a) Vì hàm số F(t) là hàm phân phối của ĐLNN X liên tục nên

F(t) liên tục tại mọi điểm t nên F(t) liên tục tại t = 0 và t = 3.

Do đó:

2

t 0 t 0 t 0 t 0

2

t 3 t 3 t 3 t 3

F(0) lim F(t) lim F(t) 0 lim(mt ) lim 0

F(3) lim F(t) lim F(t) 9m lim1 lim(mt )

9m 1 m 1/ 9.

37

b) Sử dụng tính chất của hàm phân phối, ta có:

P(– 1 < X 2) = F(2) – F(–1) = 4 4

0 0,444.9 9

2.2.3. Hàm mật độ phân phối xác suất

2.2.3.1. Định nghĩa. Cho ĐLNN X có hàm phân phối xác suất

F(t), F(t) khả vi tại mọi điểm t . Hàm mật độ phân phối xác suất

của ĐLNN X là hàm số đƣợc ký hiệu và xác định nhƣ sau:

f (t) F'(t), t .


i) f(t) 0, t ;

ii) F(x) f(t)dt, ;

x

x

iii) P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b)

= P(a < X < b) f(t)dt

b

a

;

iv) f(t)dt 1.

Chứng minh: i) Vì 0≤ F(t) ≤ 1, t nên f(t) = F'(t) 0,

t .

ii) Do F(t) là một nguyên hàm của f(t) nên với x ta có:

xx

f (t) F(t) F(x) F( ) F(x)

.

iii) Vì F(t) là một nguyên hàm của f(t) nên:

P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b)

F(b) F(a) F(t) f(t)dt

bb

a

a

.

iv) Vì f(t)dt F(t) F(+ ) F( ) 1 0 1.

Ví dụ 7. Cho ĐLNN X có hàm phân phối F(t).

38

2

0 khi t 0

tF(t) khi 0 < t 3

9

1 khi t > 3.

a) Tìm hàm mật độ phân phối của X;

b) Tính P(-1 < X 2).

Giải. a)

0 khi t 0 t > 3

f(t) = F'(t) 2t khi 0 < t 3.

9

b) Sử dụng tính chất của hàm mật độ phân phối, ta có:

2 0 2

1 1 0

22

0

2tP( 1 X 2) f (t)dt 0.dt dt

9

t 4 0,444.

9 9

Ví dụ 8. Cho ĐLNN X có hàm mật độ xác suất:

2

0 khi t 2

f(t) k khi t > 2.t

a) Tìm k;

b) Tìm hàm phân phối của ĐLNN X;

c) Tìm P(- 3 ≤ X ≤ 3).

Giải. a)

2

2

22

k k k1 f(t)dt 0dt dt k 2.

t t 2

b) + Nếu x ≤ 2 thì F(x) 0dt 0.

x

+ Nếu x > 2 thì

2

2

22 2

2 2 2F(x) f(t)dt f(t)dt dt 1

t t

xx x

x

.

39

Vậy

0 khi x 2

F(x) 2 1 khi x > 2.

x

c) Cách 1: Sử dụng tính chất của hàm mật độ phân phối, ta có:

P(- 3 ≤ X ≤ 3) = 33

2

22

2 2 1dx 0,333.

t t 3

Cách 2: Sử dụng tính chất của hàm phân phối, ta có:

P(- 3 ≤ X ≤ 3) = F(3) – F(-3) = 2 1

(1 ) 0 0,3333 3

2.3. CÁC THAM SỐ ĐẶC TRƢNG CỦA ĐẠI LƢỢNG

NGẪU NHIÊN

2.3.1. Kỳ vọng

2.3.1.1. Định nghĩa. Kỳ vọng của ĐLNN X là một số thực đƣợc

ký hiệu E(X) và xác định nhƣ sau:

i) Nếu X là ĐLNN rời rạc có bảng phân phối xác suất

1 2 n

1 2 n

X x x ... x

P p p ... p

thì n

i i

i 1

E(X) x p

;

ii) Nếu X là ĐLNN liên tục có hàm mật độ phân phối xác suất f(t)

thì E(X) t.f(t)dt

.

Ví dụ 1. Có 2 ngƣời, mỗi ngƣời bắn 1 viên đạn vào bia với xác

suất bắn trúng tƣơng ứng là 0,6 và 0,9. Hãy tính kỳ vọng của số viên

đạn trúng bia.

Giải. Gọi X là số viên đạn trúng bia DX = {0, 1, 2}.

P(X = 0) = (1 – 0,6).(1 – 0,9) = 0,04.

P(X = 1) = 0,6.(1 – 0,9) + (1 – 0,6).0,9 = 0,42.

P(X = 2) = 0,6.0,9 = 0,54.

Bảng phân phối xác suất của X là:

40

X 0 1 2

P 0,04 0,42 0,54

E(X) = 0.0,04 + 1.0,42 + 2.0,54 = 1,5.

Ví dụ 2. Cho X là ĐLNN liên tục có hàm mật độ xác suất

2

0 khi t (0,3)

f(t) t khi t 0, 3 .

9

Tính kỳ vọng của ĐLNN X?

Giải. 30 3 2 4

0 3 0

t t 9E(X) t.f(t)dt t.0dt t. dt t.0dt 2,25

9 36 4

.


i) E(C) = C, C là hằng số;

ii) E(C.X) = C.E(X), C là hằng số;

iii) E(X Y) = E(X) E(Y);

iv) Nếu X, Y độc lập thì E(XY) = E(X)E(Y).

Chứng minh: i) Ta có thể xem hằng số là ĐLNN chỉ nhận giá trị C

với xác suất bằng 1. Do đó: E(C) = 1.C = C.

ii) Đặt Y = C.X. Nếu X là ĐLNN rời rạc thì Y = CX là ĐLNN rời

rạc có bảng phân phối xác suất:

1 2 n

1 2 n

Y = C.X k x kx ... kx

P p p ... p

thì n n

i i i i

i 1 i 1

E(Y) = E(C.X) (kx )p k x p k.E(X)

.

iii) Ta chứng minh trong trƣờng hợp X, Y là các ĐLNN rời rạc có

bảng phân phối xác suất:

1 2 n

1 2 n

X x x ... x

P p p ... p 1 2 m

1 2 m

Y y y ... y

P q q ... q

Khi đó, bảng phân phối xác suất của X + Y là:

41

1 1 1 2 n m

11 12 nm

X+Y x y x y ... x y

P p p ... p

trong đó n

ij j

i=1

p q j 1,m và m

ij i

j=1

p p i 1,n

Thật vậy, khi biến cố (X = xi) xảy ra thì ĐLNN X + Y nhận các

giá trị: xi + y1, xi + y2, ..., xi + ym. Do đó:

i i i 1 i 2p P(X x ) P(X Y x y ) P(X Y x y ) ...

i mP(X Y x y )

m

i i1 i2 im ij

j 1

p p p ... p p

.

Tƣơng tự chứng minh đƣợc: n

ij j

i=1

p q .

Ta có: E(X + Y) = n m n m n m

i j ij i ij j ij

i 1 j 1 i 1 j 1 i 1 j 1

(x y )p (x p ) (y p )

n m m n

i ij j ij

i 1 j 1 j 1 i 1

x p y p

n m

i i j j

i 1 j 1

x p y q E(X) E(Y).

iv) Ta chứng minh trong trƣờng hợp X, Y là các ĐLNN độc lập,

rời rạc có bảng phân phối xác suất:

1 2 n

1 2 n

X x x ... x

P p p ... p 1 2 m

1 2 m

Y y y ... y

P q q ... q

Khi đó, bảng phân phối xác suất của XY là:

1 1 1 2 n m

1 1 1 2 n m

X+Y x y x y ... x y

P p q p q ... p q

n m n m

i j i j i i j j

i 1 j 1 i 1 j 1

E(XY) x y p q x p y q E(X).E(Y).

42

2.3.1.3. Ý nghĩa

Kỳ vọng của một ĐLNN là số đại diện về giá trị trung bình

theo xác suất của các giá trị của ĐLNN.

Ví dụ 3. Một ngƣời tham gia trò chơi tung 3 con xúc xắc. Mỗi lần

tham gia trò chơi ngƣời đó bỏ ra a đồng. Nếu có 1, 2 hoặc 3 mặt "1

chấm" xuất hiện thì thu về tƣơng ứng 2a, 3a hoặc 4a đồng. Nếu không

có mặt "1 chấm" nào xuất hiện thì mất a đồng bỏ ra. Hỏi ngƣời đó có

nên tham gia trò chơi này không?

Giải. Gọi X là số tiền thu về cho 1 lần khi tham gia trò chơi, ta có

X là một ĐLNN nhận các giá trị rời rạc là 0, 2a, 3a, 4a.

P(X = 0) = 3

3

5 125

6 216 ; P(X = 2a) =

1 2

3

3

C .5 75

6 216 ;

P(X = 3a) = 2

3

3

C .5 15

6 216 ; P(X = 4a) =

3

3

3

C 1

6 216 .

Bảng phân phối xác suất của X là:

X 0 2a 3a 4a

P 125

216

75

216

15

216

1

216

Kỳ vọng của ĐLNN X là E(X) = 199a

216, nghĩa là trung bình mỗi

lần tham gia trò chơi này ngƣời đó thu về 199a

216 đồng. Mà mỗi lần

tham gia trò chơi ngƣời đó bỏ ra a đồng. Do đó số tiền thực chất ngƣời

đó nhận đƣợc là 199a 17a

a 0216 216

nên ngƣời đó không nên tham gia

trò chơi này nhiều lần.

2.3.2. Phƣơng sai

2.3.2.1. Định nghĩa. Giả sử ĐLNN X có kỳ vọng E(X) = µ.

Phương sai của ĐLNN X là một số thực không âm, ký hiệu D(X) và

đƣợc xác định nhƣ sau: D(X) = E{(X – E(X))2}.

i) Nếu X là ĐLNN rời rạc thì D(X) = n

2

i i

i 1

(x μ) p

;

43

ii) Nếu X là ĐLNN liên tục thì D(X) = 2(x μ) f(x)dx

.

Ví dụ 4. Cho X là ĐLNN rời rạc có bảng phân phối xác suất

X 0 1 2

P 0,4 0,2 0,4

Tính phƣơng sai của ĐLNN X?

Giải. Ta có kỳ vọng E(X) = 0.0,4 + 1.0,2 + 2.0,4 = 1.

D(X) = (0 – 1)2.0,4 + (1 – 1)

2.0,2 + (2 – 1)

2.0,4 = 0,8.


i) D(C) = 0, với C là hằng số;

ii) D(CX) = C2D(X), với C là hằng số;

iii) D(X) = E(X2) – [E(X)]

2;

iv) Nếu X, Y là 2 ĐLNN độc lập thì D(X Y) = D(X) + D(Y).

Chứng minh: i) Theo định nghĩa phƣơng sai, ta có:

2 2D(C) E (C E(C)) E(C C) E(0) 0.

ii) Ta có: 2 2D(CX) E (CX E(CX)) E (CX CE(X))

2 2 2 2E C .(X E(X)) C .E (X E(X))

2C .D(X).

iv) Ta có:

22 2D(X) E (X E(X)) E X 2X.E(X) E(X)

22E(X ) E 2X.E(X) E E(X) .

Mà E(X) là một hằng số, do đó:

22D(X) E(X ) 2E(X).E X E(X) = E(X

2) – [E(X)]

2.

iv) Theo iii) ta có:

22D(X Y) E(X Y) E(X Y)

= 22 2E(X 2XY Y ) E(X) E(Y)

44

D(X Y) = E(X2) + E(2XY) + E(Y

2) – [E(X)]

2 2E(X).E(Y) –

[E(Y)]2 = E(X

2) 2E(X).E(Y) + E(Y

2) – [E(X)]

2 2E(X).E(Y) –

[E(Y)]2 = E(X

2) – [E(X)]

2 + E(Y

2) – [E(Y)]

2 = D(X) + D(Y).

Ví dụ 5. Cho X là ĐLNN rời rạc có bảng phân phối xác suất

X 0 1 2

P 0,4 0,2 0,4

Tính phƣơng sai của ĐLNN X?

Giải. Ta có E(X) = 1.

E(X2) = 0

2.0,4 + 1

2.0,2 + 2

2.0,4 = 1,8.

Vậy D(X) = E(X2) – (E(X))

2 = 1,8 – 1 = 0,8.

Ví dụ 6. Cho X là ĐLNN liên tục có hàm mật độ xác suất nhƣ sau:

2

0 khi t (0,3)

f(t) t khi t 0,3 .

9

Tính phƣơng sai của ĐLNN X.

Giải. Cách 1. Ta có D(X) = E(X2) – (E(X))

2; Theo ví dụ 10,

E(X) = 9

4.

E(X2) =

0 3

2 2 2 2

0 3

t f(t)dt t f(t)dt t f(t)dt t f(t)dt

35

0

t 2435,467

45 45 .

Vậy D(X) =

2243 9 27

0,33645 4 80

.

Cách 2. 2 23 2

0

9 9 tD(X) t f(t)dt t dt

4 4 9

45

D(X)

35 4 3

0

t t 9t 27+ 0,336

45 8 48 80

.

2.3.2.3. Ý nghĩa. Phƣơng sai của ĐLNN X để đo mức độ phân tán

của các giá trị của ĐLNN X quanh giá trị kỳ vọng toán E(X). Phƣơng

sai càng lớn thì độ phân tán càng nhiều, phƣơng sai càng nhỏ thì độ

phân tán càng ít.

Ví dụ 7. Một nhà đầu tƣ đang cân nhắc giữa việc đầu tƣ vào hai dự

án A và B trong hai lĩnh vực độc lập nhau. Khả năng thu hồi vốn sau 2

năm (tính bằng %) của hai dự án là các ĐLNN có bảng phân phối xác

suất nhƣ sau:

Dự án A:

XA 65 67 68 69 70 71 73

P 0,04 0,12 0,16 0,28 0,24 0,08 0,08

Dự án B:

XB 66 68 69 70 71

P 0,12 0,28 0,32 0,2 0,08

Từ các bảng phân phối ta tìm đƣợc:

E(XA) = 69,16%; D(XA) = 3,094.

E(XB) = 68,72%; D(XB) = 1,802.

Nhƣ vậy nếu cần chọn phƣơng án đầu tƣ sao cho tỷ lệ thu hồi vốn

có kỳ vọng cao hơn thì nên chọn dự án A, song nếu cần chọn phƣơng

án đầu tƣ sao cho độ rủi ro của tỷ lệ thu hồi vốn thấp hơn tức khả năng

thu hồi vốn ổn định hơn thì ta nên chọn dự án B.

2.3.3. Độ lệch chuẩn. Độ lệch chuẩn của ĐLNN X đƣợc ký hiệu

là σ và đƣợc xác định bởi công thức: σ = D(X) .

Ta thấy rằng đơn vị đo của phƣơng sai bằng bình phƣơng đơn vị

đo của ĐLNN. Vì vậy khi cần đánh giá mức phân tán của ĐLNN theo

đơn vị đo của nó ngƣời ta thƣờng tính độ lệch chuẩn.

2.3.4. Trung vị

46

2.3.4.1. Định nghĩa. Cho X là một ĐLNN, nếu tồn tại số thực a

sao cho 1

P(X a)2

và 1

P(X a)2

thì số a đƣợc gọi là trung vị

của ĐLNN X và ký hiệu là a = med(X).

2.3.4.2. Hệ quả

i) Nếu X là ĐLNN rời rạc và có i

i

x a

1p

2

i

i

x a

1và p

2

thì med(X) = a;

ii) Nếu X là ĐLNN liên tục và có F(a) = 1

2

a1

(hay f (t)dt )2

thì med(X) a.

Ví dụ 8. Tìm trung vị của ĐLNN X có bảng phân phối xác suất:

X 1 2 3 4

P 0,4 0,3 0,2 0,1

Giải. Ta có P(X < 2) = P(X = 1) = 0, 4 < 1

2;

P(X > 2) = P(X = 3) + P(X = 4) = 0,3 < 1

2. Do đó med(X) = 2.

Ví dụ 9. Tìm trung vị của ĐLNN X có hàm phân phối xác suất nhƣ

sau:

2

0 khi x 0

xF(x) khi 0 x 30

900

1 khi 30 x

Giải. Ta có

22a 1

a 4501F a a 15 2.900 2

2 0 a 300 a 30

Vậy trung vị của ĐLNN X là med(X) = 15 2 .

47

Nhận xét. - Số trung vị là số đặc trƣng cho giá trị trung tâm của

ĐLNN.

- Đối với ĐLNN rời rạc có thể có nhiều số trung vị, nhƣng đối với

ĐLNN liên tục chỉ có duy nhất một số trung vị.

2.3.5. Số mốt

Định nghĩa. i) Cho X là ĐLNN rời rạc, nếu có P(X = a) =

max{P(X = ai)} = max{pi}, i = 1, 2, ..., n thì số a đƣợc gọi là số mốt

của X.

ii) Cho X là ĐLNN liên tục có hàm mật độ phân phối xác suất là

f(t) đạt giá trị lớn nhất tại t = a trên thì a gọi là số mốt của X.

Ký hiệu: a = Mod(X).

Ví dụ 10. 1) Tìm số mốt của ĐLNN X chỉ tổng số chấm trên 2 mặt

xảy ra khi gieo ngẫu nhiên 2 con xúc xắc.

Giải. Ta có bảng phân phối xác suất của ĐLNN X là:

X 2 3 4 5 6 7 8 9 10 11 12

P 1

36

2

36

3

36

4

36

5

36

6

36

5

36

4

36

3

36

2

36

1

36

Ta có P(X = 7) = 6/36 = 1/6 = ii 1,11max p

Mod(X) = 1/36.

2) Tìm số mốt của ĐLNN liên tục X có hàm mật độ phân phối xác

suất là:

2

1f (t) , t .

(1 t )

Giải. Ta có 2

2

1 1(1 t ) 0, t , t

(1 t )

.

Do đó t

1max f (t)

, tại t = 0 Mod(X) = 0.

48


Bài 2.1. Trong một hộp có 6 quả cầu trắng, 4 quả cầu đỏ. Lấy ngẫu

nhiên 1 quả cầu. Gọi X là số quả cầu đỏ đƣợc lấy ra. Lập bảng phân

phối xác suất của X.

Đ/s:

X 0 1

P 3

5

2

5

Bài 2.2. Một ngƣời đƣợc phát 3 viên đạn để bắn lần lƣợt vào bia

cho đến khi trúng với xác suất bắn trúng mỗi viên là 0,8. Lập bảng

phân phối xác suất của số viên đạn đƣợc bắn ra.

Đ/s: Gọi X là ĐLNN chỉ số viên đạn đƣợc bắn ra.

X 0 1 2 3

P 0,008 0,8 0,16 0,032

Bài 2.3. Một hộp có 8 sản phẩm trong đó có 2 phế phẩm, 6 chính

phẩm.

a. Lấy ngẫu nhiên 3 sản phẩm. Gọi X là số chính phẩm có trong 3

sản phẩm lấy ra. Lập bảng phân phối xác suất của X.

b. Lấy lần lƣợt từng sản phẩm một cho tới khi lấy đƣợc chính

phẩm thì thôi. Gọi Y là số sản phẩm đƣợc lấy ra. Lập bảng phân phối

xác suất của Y, tính kỳ vọng và phƣơng sai.

c. Lấy lần lƣợt từng sản phẩm cho tới khi lấy đƣợc 2 chính phẩm

thì thôi. Gọi Z là số sản phẩm đƣợc lấy ra. Lập bảng phân phối xác

suất của Z.

Đ/s: a. Ta có bảng phân phối xác suất của X.

X 1 2 3

P 3

28

15

28

5

14

b. Bảng phân phối xác suất của Y.

49

Y 1 2 3

P 6

8

3

14

1

28

c. Bảng phân phối xác suất của Z.

Z 2 3 4

P 15

28

5

14

3

28

Bài 2.4. Gieo đồng thời 2 con xúc xắc cân đối đồng chất. Gọi

X là tổng số chấm xuất hiện ở 2 mặt con xúc xắc.

a. Lập bảng phân phối xác suất của X.

b. Lập hàm phân phối xác suất của X.

Đ/s: a. Bảng phân phối xác suất của X.

X 2 3 4 5 6 7 8 9 10 11 12

P 1

36

1

18

1

12

1

9

5

36

1

6

5

36

1

9

1

12

1

18

1

36

Bài 2.5. Trong một cái bát có 5 hạt đậu trong đó có 2 hạt đậu

đỏ. Lấy ngẫu nhiên ra 2 hạt. Gọi X là số hạt đậu đỏ đƣợc lấy ra.

a. Lập bảng phân phối xác suất của X.

b. Lập hàm phân phối xác suất của X.

c. Tính P(0 < X < 3)

Đ/s: a. Bảng phân phối xác suất của X là:

X 2 3 4

P 3

10

3

5

1

10

c. P(0 < X < 3) = 7/10.

Bài 2.6. Cho X là ĐLNN có bảng phân phối xác suất nhƣ sau:

X 2 3 5

P 0,3 0,5 0,2

a. Tính E(X), D(X).

b. Tìm hàm phân phối xác suất của X.

c. Tính E(3X – 2).

50

d. Tính D(3X – 2).

e. Tìm số mod(X) và Trung vị của X.

Bài 2.7. Cho ĐLNN X có bảng phân phối

X 1 3 4

P 0,1 0,4 + m 0,2 + 2m

a. Tìm m.

b. Tìm E(X), D(X).

c. Tìm hàm phân phối xác suất của X.

d. Tính P(2 < X < 5).

e. Tìm số mod(X) và Trung vị của X.

Bài 2.8. Cho ĐLNN X có hàm phân phối xác suất:

2

0 0

( ) 0 1

1 1

khi x

F x mx khi x

khi x

a. Tìm m.

b. Tìm hàm mật độ phân phối xác suất của X.

c. Tìm xác suất để giá trị ĐLNN X thuộc khoảng (0,25; 0,75).

d. Tính kỳ vọng, phƣơng sai của ĐLNN X.

Đ/s: a. m = 1.

b.

0 0

( ) '( ) 2 0 1

0 1

khi x

f x F x x khi x

khi x

c. P(0,25 < X < 0,75) = 0,5.

d. E(X) = 2/3; D(X) = 1/18.

Bài 2.9. Cho ĐLNN X có hàm mật độ phân phối xác suất:

mcos ;2 2

( )

0 ;2 2

x khi x

f x

khi x

a. Tìm m.

51

b. Tìm hàm phân phối xác suất của X.

c. Tìm xác suất để giá trị ĐLNN X thuộc khoảng (0; /4).

d. Tính kỳ vọng, phƣơng sai của ĐLNN X.

Đ/s: a. m = 1/2.

b.

0 2

1( ) (sinx 1) -

2 2 2

1 2

khi x

F x khi x

khi x

c. 2

4.

d. E(X) = 0.

Bài 2.10. Thời gian xếp hàng chờ mua hàng của khách là ĐLNN

có hàm phân phối xác suất nhƣ sau (đơn vị phút)

3 2

0 0

( ) mx - 3x +2x 0 1

1 1

khi x

F x khi x

khi x

a. Tìm tham số m.

b. Tìm thời gian xếp hàng trung bình.

c. Tìm xác suất để trong 3 ngƣời xếp hàng thì có không quá 2

ngƣời phải chờ quá 0,5 phút.

Đ/s: a. m = 2; b. E(X) = 0,5; c. 0,875.

Bài 2.11. Cho X là ĐLNN có hàm phân phối xác suất nhƣ sau

0 0

1( ) - mcosx 0

2

1

khi x

F x khi x

khi x

a. Tìm tham số m.

b. Tìm P(0 < X < /2).

52

c. Tìm E(X).

Đ/s: a. m = 1/2; P(0 < X < /2) = 1/2; E(X) = /2.

Bài 2.12. Cho X1, X2, X3 là các ĐLNN độc lập và có bảng phân

phối xác suất của chúng nhƣ sau:

X1 0 1 X2 1 2 X3 0 2

P 0,6 0,4

P 0,4 0,6 P 0,8 0,2

Đặt 1 2 3X X XX

3

. Tính E(X);D(X).

Đ/s: E(X) 0,8;D(X) 0,12.

53

Chƣơng 3

MỘT SỐ QUY LUẬT PHÂN PHỐI

XÁC SUẤT THƢỜNG GẶP

Trong thực tế, mỗi ĐLNN đều tuân theo một quy luật phân phối

xác suất nào đó và ngƣợc lại mỗi quy luật phân phối xác suất lại tƣơng

ứng với một lớp các ĐLNN. Vì vậy phân loại các ĐLNN theo từng

quy luật phân phối xác suất giúp cho việc sử dụng chúng đƣợc dễ

dàng hơn. Ở trong chƣơng này, chúng tôi giới thiệu một số qui luật

phân phối xác suất thƣờng gặp với các ĐLNN rời rạc và liên tục. Mỗi

quy luật phân phối xác suất sẽ đƣợc giới thiệu dạng phân phối và các

tham số đặc trƣng cơ bản của nó.

3.1. MỘT SỐ QUY LUẬT PHÂN PHỐI XÁC SUẤT RỜI RẠC

3.1.1. Qui luật phân phối xác suất Không – Một


ĐLNN rời rạc X đƣợc gọi là ĐLNN có quy luật phân phối

không – một với tham số p (0 < p < 1) nếu bảng phân phối xác suất

của X có dạng:

X 0 1

P 1 – p p

Ký hiệu ĐLNN có phân phối không – một với tham số p là: A(p)

hay X A(p).

Ví dụ 1. 1) ĐLNN X chỉ số mặt N xuất hiện khi gieo ngẫu nhiên 1

đồng xu là ĐLNN có quy luật phân phối không – một với tham số

p = 1/2.

2) ĐLNN Y chỉ số mặt chấm 1 xuất hiện khi gieo một con xúc xắc

là ĐLNN có quy luật phân phối không – một với tham số p = 1/6.

3.1.1.2. Các tham số đặc trưng

Cho X là ĐLNN có quy luật phân phối A(p). Khi đó:

E(X) = 0.(1 – p) + 1.p = p.

Nhƣ vậy: E(X) = p.

E(X2) = 0

2.(1 – p) + 1

2.p = p .

Do đó: D(X) = E(X2) – [E(X)]

2 = p – p

2 = p(1 – p).

54

3.1.2. Quy luật phân phối xác suất nhị thức


ĐLNN rời rạc X đƣợc gọi là ĐLNN có quy luật phân phối nhị

thức nếu X có bảng phân phối dạng:

X 0 ... k ... n

P 0 0 n

nC p q ... k k n k

nC p q ... n n 0

nC p q

với 0 < p < 1, q = 1 – p.

Khi X có phân phối nhị thức ta ký hiệu X B(n,p) ; n, p gọi là các

tham số của phân phối nhị thức.

Ví dụ 2. Xác suất để một cây sống sau một thời gian trồng là p

(0 < p < 1). Trồng 1000 cây, gọi X là số cây sống sau một thời gian

trồng. Khi đó X là một ĐLNN có phân phối nhị thức B(1000, p).


Cho X là ĐLNN có quy luật phân phối B(n, p). Khi đó:

E(X) = np; D(X) = np(1 – p) = npq.

Chứng minh: Áp dụng công thức khai triển nhị thức Newton, ta

có: n n

n k k n k n 1 k k 1 n k

n n

k 0 k 1

(q x) C x q n(q x) kC x q

n

n 1 k k 2 n k

n

k 1

n(n 1)(q x) k(k 1)C x q

.

Thay x = p, ta đƣợc: n

k k 1 n k

n

k 1

n kC p q

và n

k k 2 n k

n

k 1

n(n 1) k(k 1)C p q

.

Ta có: n n

k k n k k k 1 n k

n n

k 0 k 1

E(X) kC p q p kC p q pn

.

n n n2 2 k k n k k k n k k k n k

n n n

k 0 k 0 k 0

E(X ) k C p q k(k 1)C p q kC p q

55

n n

2 2 k k 2 n k k k n k 2

n n

k 1 k 0

E(X ) p k(k 1)C p q kC p q n(n 1)p np

.

2 2D(X) n(n 1)p np (np) np(1 p) npq.

Ví dụ 3. Một xạ thủ bắn 20 phát vào bia, xác suất trúng đích của mỗi

phát là 0,8.

a) Tính xác suất để bắn 20 phát có 18 phát trúng.

b) Tìm số phát trúng trung bình khi bắn 20 phát.

c) Tìm xác suất để có ít nhất 18 phát trúng.

Giải. Gọi X là số phát bắn trúng đích khi bắn 20 phát. Khi đó X là

ĐLNN có phân phối nhị thức với tham số n = 20, p = 0,8.

a) Do đó xác suất để trong 20 phát có 18 phát trúng là:

P(X = 18) = 18 18 2

20 (0,8) (1 0,8)C b) Số phát trúng trung bình khi bắn 20 phát là: E(X) = np = 20.0,8 = 16

c) Xác suất để trong 20 phát bắn có ít nhất 18 phát trúng là:

P(18 ≤ X ≤ 20) = P(X = 18) + P(X = 19) + P(X = 20) 18 18 2 19 19 1 20 20 0

20 20 20(0,8) (1 0,8) (0,8) (1 0,8) (0,8) (1 0,8) .C C C 3.1.3. Quy luật phân phối xác suất Poisson


ĐLNN rời rạc X đƣợc gọi là ĐLNN có phân phối quy luật Poisson

nếu X có bảng phân phối:

X 0 ... k ... n ...

P λe ... λ ke λ

k!

... λ ne λ

n!

...

trong đó > 0 là tham số.

Ký hiệu X có phân phối Poisson với tham số là X P().

Ví dụ 4. Số nguyên tử bị phân hủy trong một quảng thời gian của

trình phân rã các nguyên tố phóng xạ là một ĐLNN có quy luật phân

phối Poisson.

56


Cho X là ĐLNN có phân phối Poisson với tham số . Khi đó:

E(X) = ; D(X) = .

3.1.3.3. Mối liên hệ giữa phân phối B(n, p) với phân phối P()

Giả sử X B(n, p) . Khi n lớn, p khá bé thì X có phân phối xấp xỉ

phân phối Poisson với tham số = np. Khi đó:

P(X = k) = λ k

k k n k

n n

e λP (k) = C p (1 p) .

k!

Trong thực tế công thức Poisson có thể dùng thay cho công thức

Bernoulli nếu thỏa mãn n 20 và p 0,1 (tức là np np(1 - p)).

Ví dụ 5. Gieo 1000 hạt giống biết xác suất không nảy mầm của 1

hạt là 0,005. Tìm xác suất để trong 1000 hạt đó có 10 hạt không nảy

mầm.

Giải. Gọi X là số hạt giống không nảy mầm khi gieo 1000 hạt thì

X là 1 ĐLNN có phân phối nhị thức với tham số n = 1000, p = 0,005.

Ta có n = 1000 khá lớn, p = 0,005 khá bé. Khi đó áp dụng phân

phối Poisson ta đƣợc xác suất để có 10 hạt không nảy mầm khi gieo

1000 hạt giống:

P(X = 10) = 5 10

10 990 10

1000

5(0,995) (0,005) .

10!

e

C

3.2. MỘT SỐ QUY LUẬT PHÂN PHỐI XÁC SUẤT LIÊN TỤC

3.2.1. Quy luật phân phối đều U[a, b]

Quy luật phân phối đều là quy luật phân phối đơn giản nhất trong

các quy luật phân phối xác suất của ĐLNN liên tục.


ĐLNN liên tục X đƣợc gọi là phân phối theo quy luật đều trong

đoạn [a, b] nếu hàm mật độ xác suất của nó có dạng:

1khi x a,b

f (t) b a

0 khi x a,b

[ ]

[ ]


57

Kỳ vọng:

bb 2

a a

t t b aE(X) tf (t)dt dt .

b a 2(b a) 2

Phƣơng sai: D(X) = E(X2) – [E(X)]

2

D(X) 2 2b 2

2

a

b a t b at f (t)dt dt

2 b a 2

b 23

a

t b a

3(b a) 2

= 222 2 b ab ab a a b.

3 2 12

Quy luật phân phối đều có ứng dụng rộng rãi trong thống kê

toán. Trong một số kết luận về lý thuyết thống kê ngƣời ta thƣờng

xuất phát từ quy tắc sau đây: Nếu ta không biết gì về giá trị của tham

số cần ƣớc lƣợng thì mỗi giá trị có thể có của tham số đó là đồng khả

năng. Điều đó dẫn tới việc quan niệm tham số cần ƣớc lƣợng nhƣ một

ĐLNN tuân theo quy luật phân phối đều.

Ví dụ 1. Khi thâm nhập thị trƣờng mới, doanh nghiệp không thể

khẳng định đƣợc một cách chắc chắn doanh số hàng tháng có thể đạt

đƣợc sẽ là bao nhiêu mà chỉ dự kiến đƣợc rằng doanh số tối thiểu sẽ là

20 triệu đồng/tháng và tối đa là 40 triệu đồng/tháng. Tìm xác suất để

doanh nghiệp đạt đƣợc doanh số tối thiểu là 35 triệu đồng/tháng.

Giải. Gọi X là doanh số hàng tháng mà doanh nghiệp đó có thể đạt

đƣợc ở thị trƣờng đó.

Do không có thông tin gì hơn về X nên ta có thể xem X là ĐLNN

có phân phối đều trên khoảng (20, 40).

Vậy hàm mật độ phân phối xác suất của X là:

40 200,05 khi x (20,40)

f (t) 2

0 khi x (20,40)

58

Từ đó xác suất để doanh nghiệp đạt đƣợc doanh số tối thiểu là 35

triệu đồng/tháng đƣợc tìm theo tính chất của hàm mật độ phân phối

xác suất nhƣ sau:

P(X > 35) = 40

40

35

35 35

f (t)dt 0,05dt 0,05 0,25.

3.2.1. Quy luật phân phối chuẩn


ĐLNN liên tục X nhận các giá trị trên (- ∞, + ∞) đƣợc gọi là phân

phối theo quy luật chuẩn với tham số µ và > 0, ký hiệu là

X N(µ, 2), nếu hàm mật độ xác suất của X có dạng:

21 x μ

2 σ1f(x)

σ 2πe

Đặc biệt: Khi µ = 0, = 1 thì phân phối chuẩn N(0, 1) đƣợc gọi là

phân phối chuẩn hóa hay chuẩn tắc.


Cho X là ĐLNN có quy luật phân phối chuẩn N(µ, 2), khi đó:

E(X) = µ; D(X) = 2; Med(X) = µ; Mod(X) = µ.

3.2.1.3. Định lý

Nếu ĐLNN X có phân phối chuẩn N(µ, 2) thì ĐLNN

X μY =

σ

có phân phối chuẩn tắc N(0, 1).

3.2.1.4. Hàm số La-pla-ce

Hàm số đƣợc ký hiệu và xác định nhƣ sau đƣợc gọi là hàm La–

pla–ce:

2x t

2

0

1(x) e dt, x ( ; )

2π

.

Các giá trị hàm La-pla-ce đƣợc tính theo bảng 1.

a) Tính chất

i) (x) là hàm số lẻ: (– x) = – (x);

ii) (x) là hàm tăng thực sự: x1 < x2 (x1) < (x2);

iii) 1 1

lim (x) ; lim (x) ;2 2

x x

59

iv) Nếu F(x) là hàm phân phối xác suất của ĐLNN X có phân phối

chuẩn N(µ, 2) thì:

F(x) = P(X < x) =

21 t μx x

2 σ1 1 x μf(t)dt .

2 σσ 2πe dt

và từ đó ta có:

P(α < x < β) = P(α ≤ x < β) = P(α < x ≤ β)

= F(β) – F(α) = β μ α μ

.σ σ

b) Hệ quả. X có phân phối chuẩn N(µ, 2), với mọi > 0 ta có:

ε

P X μ ε 2 .σ

Chứng minh:

μ + ε μ μ ε μ

P X μ ε P μ ε X μ + ε σ σ

ε ε ε ε ε

2σ σ σ σ σ

.

Ví dụ 2. Cho X là ĐLNN có phân phối chuẩn E(X) = 3, = 2.

Tính P(X < 2); P(X > 1,5); P(1,3 < X < 2).

Giải. Ta có 1 2 3 1 1 1

P(X 2) 0,52 2 2 2 2

= 0,5 – 0,192 = 0,308.

1

P(X 1,5) 1 P(X 1,5) 1 0,752

0,5 0,75 0,5 0,75

= 0,5 + 0,273 = 0,773.

0,5 0,85 0,191 0,302 0,111 .

Ví dụ 3. Các vòng bi do một máy tự động sản xuất ra đƣợc coi là

đạt tiêu chuẩn nếu đƣờng kính của nó sai lệch so với đƣờng kính thiết

kế không quá 0,7 mm. Biết rằng sai lệch này là ĐLNN có phân phối

chuẩn với = 0 và = 0,4 mm. Tìm tỷ lệ vòng bi đạt tiêu chuẩn của

máy đó.

60

Giải. Tỷ lệ vòng bi đạt tiêu chuẩn chính là xác suất để lấy một

vòng bi đạt tiêu chuẩn. Nếu gọi X là độ sai lệch giữa đƣờng kính của

vòng bi sản xuất ra với đƣờng kính vòng bi thiết kế thì vòng bi đạt tiêu

chuẩn khi X 0,7 .

Do đó ta có:

P( X 0,7) P( X 0,7) 0,7

2 2 1,75 0,9189.0,4

3.2.1.5. Định nghĩa. Cho U N(0, 1) và 0 < α < 1 cho trƣớc. Khi

đó giá trị Uα thỏa mãn P(U > Uα) = α đƣợc gọi là phân vị chuẩn mực α.

Tính chất. i) U1 – α = – Uα;

ii) (Uα) = 0,5 – α.

Ví dụ 4. Tìm U0,025; U0,975; U0,05.

Giải. Ta có: (U0,025) = 0,5 – 0,025 = 0,475 = (1,96) U0,025 = 1,96.

U0,975 = – U1 – 0,975 = – U0,025 = – 1,96.

(U0,05) = 0,5 – 0,05 = 0,45 (1,64) U0,05 = 1,64.

3.2.1.6. Một số định lý về phân phối chuẩn

a) Định lý. Cho C là hằng số, ĐLNN X N(µ, 2). Khi đó:

CX N(Cµ, C2

2); X C N(µ C,

2)

b) Định lý. Giả sử n ĐLNN X1, X2, ..., Xn độc lập và

Xi N(µi, i2) ( i 1,n ). Khi đó: X = X1 + X2 + ... + Xn là ĐLNN có

phân phối chuẩn N(µ, 2) với µ = µ1 + µ2 + ... + µn và

2 = 1

2 + 2

2 +

...+ n2.

c) Định lý Lindeberg – Levy. Nếu Xi N(µ, 2) ( i 1,n ) n khá lớn

và n ĐLNN Xi độc lập với nhau thì ĐLNN n

2

i

i 1

X X N(n ,n )

và2n

i

i 1

1Y X N ,

n n

. Tức là với n khá lớn thì:

P(X < x)1 x μ

2 σ

n

n

và P(Y < x)

1 (x μ) n

2 σ

,

với là hàm La-pla-ce.

61

c) Định lý Moa-vơ-rơ. Cho X B(n, p) .Với n khá lớn thì ĐLNN X

xấp xỉ có phân phối chuẩn N(np, np(1 – p)).

Tức là P(α < x < β) = P(α ≤ x < β) = P(α < x ≤ β) = P(α ≤ x ≤ β)

= β np α np

np(1 p) np(1 p)

.

với là hàm La-pla-ce.

Ví dụ 5. Gieo ngẫu nhiên độc lập 10000 lần một đồng xu cân đối.

Tính xác suất để trong 10000 lần gieo đó có số lần mặt ngửa (N) xuất

hiện nằm trong khoảng (5050; 5100).

Giải. Gọi X là số lần mặt N xuất hiện trong 10000 lần gieo đó, ta

có X là ĐLNN có phân phân phối nhị thức B(10000; 0,5). Xác suất

cần tìm là P(5050 < X < 5100).

Vì n khá lớn nên X xấp xỉ có phân phối chuẩn N(5000; 25002), do

đó:

P(5050 < X < 5100) = 5100 10000.0,5 5050 10000.0,5

10000.0,5.0,5 10000.0,5.0,5

= 2 1 0,474 0,314 0,160 .

Ví dụ 6. Một công ty bảo hiểm, bảo hiểm 10000 xe máy. Mỗi chủ

xe phải nộp 100000 đồng/năm và trung bình nhận lại 5 triệu đồng nếu

xe của họ bị tai nạn giao thông. Qua thống kê biết tỷ lệ để 1 xe máy bị

tai nạn giao thông trong 1 năm là 0,006. Tìm xác suất để:

a) Sau 1 năm hoạt động công ty bị lỗ.

b) Sau 1 năm hoạt động công ty lãi ít nhất 800 triệu.

Giải. a) Gọi X là số xe bị tai nạn giao thông trong một năm, ta có

X là ĐLNN có phân phối nhị thức n = 10000; p = 0,006.

np = 60; np(1 – p) = 59,69; np(1 p) 7,726 .

Công ty bị lỗ khi số xe tai nạn lớn hơn 200 chiếc (vì khi đó số tiền

chi trả nhiều hơn số tiền thu vào).

Gọi A là biến cố công ty bảo hiểm bị lỗ trong 1 năm.

Ta có: A = (200 X 10000). Vì n khá lớn nên:

62

P(A) = 10000 60 200 60

060.0,994 60.0,994

.

Vậy xác suất công ty bị lỗ sau 1 năm hoạt động là 0.

b) Công ty lãi ít nhất 600 triệu khi số xe bị tai nạn nhỏ hơn hoặc

bằng 80 chiếc, vì khi đó số tiền chi trả cho xe bị tai nạn nhỏ hơn số

tiền thu vào là 400 triệu.

Gọi B là biến cố sau 1 năm hoạt động công ty lãi ít nhất 600 triệu

đồng.

P(B) = 80 60 80 60

(0 80) 0,99560.0,994 60.0,994

P X

.

3.2.2. Quy luật phân phối – bình phƣơng

3.2.2.1. Định nghĩa. Cho dãy ĐLNN X1, X2, ..., Xn có phân phối

chuẩn hóa N(0, 1). Khi đó ĐLNN n

2 2

i

i 1

χ X

sẽ phân phối theo quy

luật - bình phương (khi bình phƣơng) với n bậc tự do, ký hiệu là: 2 2χ χ (n) .

Hàm mật độ phân phối xác suất của ĐLNN 2 có dạng:

x n1

2 2n

2

0 khi x 0

1f (x) e .x khi x 0

n2 .

2

trong đó x 1 t

0

(x) t e dt

là hàm Gamma.


Cho 2χ là ĐLNN có phân phối theo quy luật khi bình phƣơng với

n bậc tự do, khi đó: E(2) = n; D(

2) = 2n.

3.2.2.3. Định nghĩa. Cho 2 2χ χ (n) và 0 < α < 1 cho trƣớc. Khi

đó giá trị 2

αχ (n) sao cho 2 2

αP(χ > χ (n)) = α đƣợc gọi là phân vị khi

bình phương n bậc tự do.

Các giá trị phân vị 2

αχ (n) đƣợc tính sẵn thành bảng 3a, bảng 3b.

63

Ví dụ 7. (Tra bảng 3b) 2

0,05χ (14) 23,685 ; 2

0,01χ (24) 42,980 .

3.2.3. Quy luật phân phối Student – T(n)

3.2.3.1. Định nghĩa. Nếu U N(0, 1), 2 2χ χ (n) thì ĐLNN

2

UT

χ

n

sẽ phân phối theo quy luật Student với n bậc tự do, ký hiệu

là: T T(n) .


Cho T là ĐLNN có phân phối Student với n bậc tự do, khi đó:

E(T) = 0; D(T) = n

n 2.

3.2.3.3. Định nghĩa. Cho T T(n) và 0 < α < 1 cho trƣớc. Khi đó

giá trị αt (n) sao cho αP(T > t (n)) = α đƣợc gọi là phân vị Student n

bậc tự do với mức ý nghĩa α.

Các giá trị phân vị αt (n) đƣợc tính sẵn thành bảng 2.

Nhận xét: i) α 1 αt (n) = t (n) ;

ii) Với n 30 thì α αt (n) = U .

Ví dụ 8. 0,025t (8) 2,306 ;

0,99 1 0,01 0,01t (24) t (24) t (24) 2,492 ;

0,005 0,005t (35) U =2,57 .

64


Bài 3.1. Gieo một con xúc xắc đối xứng và đồng chất. Tìm quy

luật phân phối xác suất và các tham số đặc trƣng của số lần xuất hiện

mặt 6 chấm.

Đ/s: Gọi X là số lần xuất hiện của mặt 6 chấm khi gieo con xúc

xắc. 1 5

E(X) ;D(X)6 36

.

Bài 3.2. Điều tra ý kiến của khách hàng đối với sản phẩm của

doanh nghiệp thì thấy có 60% khách hàng thích sản phẩm đó. Tìm quy

luật phân phối xác suất và các tham số đặc trƣng của thái độ ƣa thích

của khách hàng đối với sản phẩm.

Đ/s: Gọi X là ĐLNN chỉ thái độ ƣa thích của khách hàng đối với

sản phẩm.

X A(0,6). E(X) = 0,6. D(X) = 0,24.

Bài 3.3. Bắn 5 viên đạn vào mục tiêu. Xác xuất trúng đích của mỗi

lần bắn nhƣ nhau và bằng 0,2. Muốn phá hủy mục tiêu phải có ít nhất

3 viên trúng mục tiêu. Tính xác suất để mục tiêu bị phá hủy.

Đ/s: P = 0,0579.

Bài 3.4. Gieo 10.000 hạt giống với xác suất để mỗi hạt giống nảy

mầm là 0,85. Gọi X là số hạt nảy mầm. Hỏi X tuân theo quy luật phân

phối xác suất gì? Tìm E(X), D(X).

Bài 3.5. Tổng đài điện thoại phục vụ 100 máy điện thoại. Xác suất

để trong mỗi phút mỗi máy gọi đến tổng đài là 0,02. Tìm số máy gọi

đến tổng đài trung bình trong 1 phút.

Đ/s: 2 máy.

Bài 3.6. Cho U N(0, 1). Tìm các xác suất sau:

a. P(U > 1,96) b. P(U > 1,64) c. P(U < - 1,64)

d. P(U < 1,64) e. P(1 < U < 1,5) d. P(-1 < U < 2).

Bài 3.7. Cho X N(10, 25). Tìm các xác suất sau:

a. P(X > 20) b. P(20 < X < 25)

c. P(X < 10) d. P(12 < X < 24).

65

Bài 3.8. Trong hệ thống tỷ giá hối đoái thả nổi, sự biến động của

tỷ giá hối đoái chịu sự tác động của rất nhiều nhân tố và có thể xem

nhƣ biến ngẫu nhiên phân phối chuẩn. Giả sử ở một giai đoạn nào đó

tỷ giá của USD với VNĐ có trung bình là 15000đ và độ lệch chuẩn là

500đ. Tìm xác suất để trong một ngày nào đó.

a. Tỷ giá sẽ cao hơn 16000đ.

b. Tỷ giá sẽ thấp hơn 14500đ.

c. Tỷ giá sẽ nằm trong khoảng từ 14500 đến 16500đ.

Bài 3.9. Trọng lƣợng sản phẩm X do một máy tự động sản xuất là

ĐLNN tuân theo quy luật chuẩn với E(X) = 100 gam và độ lệch chuẩn

1 gam. Sản phẩm đƣợc coi là đạt tiêu chuẩn kỹ thuật nếu trọng lƣợng

của nó đạt từ 98 đến 102 gam.

a. Tìm tỷ lệ sản phẩm đạt tiêu chuẩn của nhà máy.

b. Tìm tỷ lệ phế phẩm của nhà máy.

Đ/s: a. 95,44%; b. 4,56%.

66

Chƣơng 4

ĐẠI LƢỢNG NGẪU NHIÊN HAI CHIỀU

Ở các chƣơng trƣớc chúng ta đã xét các ĐLNN mà tập giá trị có

thể của chúng đƣợc biểu diễn bằng một số thực, đó là các ĐLNN một

chiều. Ngoài ĐLNN một chiều, trong thực tế chúng ta còn gặp các

biến số mà tập giá trị đƣợc xác định bằng bộ n số (x1, x2, ..., xn) với

n 2, những ĐLNN này gọi là ĐLNN n chiều. Việc nghiên cứu

ĐLNN nhiều chiều cho ta xác định đƣợc quy luật xác suất của nó cũng

nhƣ việc tác động qua lại giữa các thành phần với nhau. Trong kinh tế

và xã hội thì điều này rất quan trọng, chẳng hạn muốn đánh giá ảnh

hƣởng của thu nhập đến tiêu dùng nhƣ thế nào ta xét một ĐLNN hai

chiều là thu nhập và tiêu dùng.

4.1. ĐỊNH NGHĨA. Cho X1, X2, ..., Xn là n ĐLNN cùng liên kết

với một phép thử có không gian mẫu . Bộ (X1, X2, ..., Xn) đƣợc gọi

là đại lượng ngẫu nhiên n chiều, nếu x1, x2, ..., xn là n giá trị tƣơng

ứng của X1, X2, ..., Xn thì bộ số thực (x1, x2, ..., xn) gọi là giá trị của

ĐLNN n chiều (X1, X2, ..., Xn).

Ví dụ 1. Gieo ngẫu nhiên một lần 2 con xúc xắc, gọi X1, X2 là 2

ĐLNN tƣơng ứng là chỉ số chấm xuất hiện của con xúc xắc thứ nhất

và thứ 2. Khi đó ĐLNN (X1, X2) có 36 giá trị là (x1, x2) = {(1, 1);

(1, 2); ...; (6, 6)}.

ĐLNN n chiều (X1, X2, ..., Xn) đƣợc gọi là ĐLNN n chiều rời rạc

nếu X1, X2, ..., Xn là các ĐLNN rời rạc; và gọi là ĐLNN n chiều liên

tục nếu X1, X2, ..., Xn là các ĐLNN liên tục.

Trong chƣơng này chúng ta chỉ nghiên cứu về ĐLNN hai chiều.

4.2. HÀM PHÂN PHỐI XÁC SUẤT CỦA ĐLNN HAI CHIỀU

4.2.1. Định nghĩa. Cho (X, Y) là ĐLNN hai chiều. Hàm số hai

biến số ký hiệu và xác định nhƣ sau gọi là hàm phân phối xác suất của

ĐLNN hai chiều.

F(x, y) P(X x;Y y), x, y .

trong đó biến cố (X x;Y y) (X x) (Y y) .

4.2.2. Tính chất

67

i) 0 F(x, y) 1 ;

ii) F(x, y) là hàm không giảm theo mỗi biến, nghĩa là:

1 2 1 2F(x , y) F(x , y), khi x x

và 1 2 1 2F(x, y ) F(x, y ), khi y y ;

iii) x y x

y

lim F(x, y) 0; lim F(x, y) 0; lim F(x, y) 0

;

x y x

y

lim F(x, y) F(y); lim F(x, y) F(x); lim F(x, y) 1

.

4.3. PHÂN PHỐI XÁC SUẤT CỦA ĐLNN HAI CHIỀU

4.3.1. Bảng phân phối xác suất của ĐLNN hai chiều rời rạc

4.3.1.1. Định nghĩa. Cho X, Y là hai ĐLNN ngẫu nhiên cùng liên

kết với một phép thử có miền giá trị lần lƣợt là DX = {x1, x2, ..., xn} và

DY = {y1, y2, ..., ym}.

Đặt pij = P(X = xi; Y = yj), i 1,n; j 1,m .

Khi đó bảng số có dạng dƣới đây gọi là bảng phân phối xác suất

của ĐLNN hai chiều (X, Y).

X

Y x1 x2 ... xi ... xn

y1 p11 p21 ... pi1 ... pn1

y2 p12 p22 ... pi2 ... pn2

... ... ... ... ... ... ...

yj p1j p2j ... pij ... pnj

... ... ... ... ... ... ...

ym p1m p2m ... pim ... pnm

Ví dụ 1. Cho X, Y là 2 ĐLNN chỉ số mặt ngửa xuất hiện của đồng

tiền thứ nhất và thứ 2 khi gieo ngẫu nhiên 2 đồng tiền cân đối.

Ta có tập giá trị của X là DX = {0, 1}; DY = {0, 1}.

11

1p P(X 0;Y 0) P(SS)

4 ;

21

1p P(X 1;Y 0) P(NS)

4 ;

68

12

1p P(X 0;Y 1) P(SN)

4 ;

22

1p P(X 1;Y 1) P(NN)

4 .

Vậy bảng phân phối của ĐLNN ngẫu nhiên hai chiều (X, Y) là:

X

Y 0 1

0 1

4

1

4

1

1

4

1

4

4.3.1.2. Tính chất. Cho (X, Y) là ĐLNN hai chiều rời rạc có bảng

phân phối nhƣ ở mục 4.3.1.1. Khi đó ta có:

i) 0 p 1, i 1,n, j 1,m ij ;

ii) m n n m

j 1 i 1 i 1 j 1

p p 1

ij ij;

iii) n

j j

i 1

p q P(Y y )

ij ; m

i i

j 1

p p P(X x )

ij.

Qua tính chất iii) ta thấy nếu biết phân phối của ĐLNN hai chiều

(X, Y) thì ta sẽ biết luật phân phối của các biến ngẫu nhiên X, Y.

Ví dụ 2. Cho X, Y là ĐLNN rời rạc có bảng phân phối xác suất

nhƣ sau:

X

Y 0 1 2

1 0,4 0,3 0

2 0 0,12 0,18

Khi đó: P(X = 0) = 0,4 + 0 = 0,4.

P(X = 1) = 0,3 + 0,12 = 0,42.

P(X = 2) = 0 + 0,18 = 0,18.

Vậy bảng phân phối của ĐLNN X là:

69

X 0 1 2

P 0,4 0,42 0,18

Tƣơng tự bảng phân phối của ĐLNN Y là:

Y 1 2

P 0,7 0,3

4.3.1.3. Định lý. Điều kiện cần và đủ để hai ĐLNN rời rạc X và Y

độc lập với nhau là pij = P(X = xi; Y = yj) = P(X = xi).P(Y = yj) = piqj ,

i 1,n; j 1,m .

Ví dụ 3. Cho X, Y là 2 ĐLNN chỉ số mặt ngửa xuất hiện của đồng

tiền thứ nhất và thứ 2 khi gieo ngẫu nhiên 2 đồng tiền cân đối. Khi đó

X và Y độc lập với nhau.

Ví dụ 4. Cho X, Y là ĐLNN rời rạc có bảng phân phối xác suất

nhƣ sau:

X

Y 0 1 2

1 0,4 0,3 0

2 0 0,12 0,18

Ta thấy X và Y phụ thuộc nhau, vì P(X = 0; Y = 1) = 0,4

P(X = 0)P(Y = 1) = 0,4.0,7.

4.3.2. Hàm mật độ phân phối xác suất của ĐLNN hai chiều liên tục

4.3.2.1. Định nghĩa. Cho ĐLNN hai chiều liên tục (X, Y) có hàm

phân phối xác suất là F(x, y). Nếu tồn tại hàm hai biến f(x, y) không

âm, khả tích trên 2 và thỏa mãn đẳng thức:

yx

F(x, y) f u,v dudv

thì hàm f(x, y) đƣợc gọi là hàm mật độ phân phối xác suất của ĐLNN

liên tục hai chiều (X, Y).

4.3.2.2. Tính chất. Cho f(x, y) là hàm mật độ phân phối xác suất

của ĐLNN hai chiều (X, Y). Khi đó ta có:

i) f x, y dxdy 1

;

70

ii) 2

D

P (X,Y) D f x, y dxdy, D ;

iii) Nếu F(x, y) có đạo hàm riêng cấp 2 hỗn hợp tại điểm 2(x, y) thì

"

xyF (x,y) f (x, y) ;

iv) Gọi fX(x), fY(y) là các hàm mật độ phân phối xác suất của

ĐLNN X, Y. Khi đó: Xf (x) f x, y dy

; Yf (y) f x, y dx

.

Ví dụ 5. Tìm hàm mật độ của ĐLNN 2 chiều (X, Y) có hàm phân

phối xác suất là:

1 1 1 1F(x, y) arctan x arctan y , x, y .

2 2

Giải. Ta có: '

x 2

1 1 1F (x, y) arctan y

(1 x ) 2

.

''

xy 2 2

1 1F (x, y) .

(1 x ) (1 y )

.

Hàm mật độ của ĐLNN 2 chiều (X, Y) là:

2 2 2

1f (x, y)

(1 x )(1 y )

.

Ví dụ 6. Cho ĐLNN 2 chiều (X, Y) có hàm mật độ phân phối xác

suất:

2 2 2

Af (x, y) .

(16 x )(25 y )

a) Xác định hằng số A;

b) Tìm hàm phân phối của (X, Y);

c) Tìm các hàm phân phối của X và Y.

Giải.

a) Ta có: 2 2 2

A1 f x, y dxdy dxdy

(16 x )(25 y )

2 2 2

A 1 1dx. dy

(16 x ) (25 y )

71

2

A 1 x 1 y. arctan . arctan4 4 5 5

2

A A( ) ( )

20 2 2 2 2 20

A = 20.

Vậy 2 2 2

20f (x, y)

(16 x )(25 y )

.

b) Ta có:

y yx x

2 2 2

20 1 1F(x, y) f x, y dxdy dx. dy

(16 x ) (25 y )

2

1 x yarctan arctan .

4 2 5 2

c) Ta có:

X 2y y

1 x yF (x) lim F(x, y) lim arctan arctan

4 2 5 2

2

1 x 1 xarctan arctan

4 2 2 2 4 2

.

Yx

F (y) lim F(x,y)

1 y

arctan5 2

.

4.3.2.3. Định lý. Giả sử X Yf (x),f (y) lần lƣợt là hàm mật độ của

ĐLNN X và Y; f(x, y) là hàm mật độ phân phối của ĐLNN (X, Y).

Điều kiện cần và đủ để X và Y độc lập với nhau là f(x, y) =

fX(x).fY(y).

4.4. PHÂN PHỐI XÁC SUẤT CÓ ĐIỀU KIỆN CỦA ĐLNN HAI CHIỀU

4.4.1. Phân phối có điều kiện của ĐLNN hai chiều rời rạc

Cho X, Y là hai ĐLNN ngẫu nhiên cùng liên kết với một phép thử

có miền giá trị lần lƣợt là DX = {x1, x2, ..., xn} và DY = {y1, y2, ..., ym}.

Gọi i j i jP x y P X x Y y i 1,n; j 1,m là xác suất

có điều kiện để thành phần X nhận giá trị bằng xi với điều kiện thành

phần Y nhận giá trị bằng yj.

72

Bảng phân phối xác suất có điều kiện của thành phần X với điều

kiện Y = yj có dạng:

jX y 1x 2x ... ix ... nx

P 1 jP x y 2 jP x y ... i jP x y ... n jP x y

trong đó các xác suất có điều kiện đƣợc tính bằng công thức:

i j ij

i j

j j

P x , y pP x y

P(Y y ) P(Y y )

i 1,n; j 1,m

Tƣơng tự, ta có bảng phân phối xác suất có điều kiện của thành

phần Y với điều kiện X = xi có dạng:

iY x 1y 2y ... jy ... my

P 1 iP y x 2 iP y x ... j iP y x ... m iP y x

trong đó các xác suất có điều kiện đƣợc tính bằng công thức:

i j ij

j i

i i

P x , y pP y x

P(X x ) P(X x )

i 1,n; j 1,m

Ví dụ 1. Phân phối xác suất của lƣơng tháng Y (triệu đồng) và giới

tính X của công nhân một công ty nhƣ sau:

Y

X 0,5 1 1,5

Nữ: 0 0,1 0,3 0,2

Nam: 1 0,06 0,18 0,16

Tìm phân phối xác suất của lƣơng tháng của nữ công nhân.

Giải. Trƣớc hết ta tìm P(x1) = P(X = 0) = 0,1 + 0,3 + 0,2 = 0,6.

từ đó: 1 11 1

1

P(x ,y ) 0,1 1P y x

P(x ) 0,6 6 ;

1 22 1

1

P(x ,y ) 0,3 1P y x

P(x ) 0,6 2 ;

73

1 33 1

1

P(x ,y ) 0,2 1P y x

P(x ) 0,6 3 .

Vậy bảng phân phối xác suất của lƣơng tháng của nữ công nhân là:

1Y x 0,5 1 1,5

P 1

6

1

2

1

3

4.4.2. Phân phối có điều kiện của ĐLNN hai chiều liên tục

Giả sử (X, Y) là ĐLNN hai chiều liên tục có hàm mật độ phân

phối xác suất f(x, y). Hàm mật độ xác suất có điều kiện của thành

phần X với Y = y, ký hiệu f(x/y) là biểu thức:

X

f (x, y)f x y

f (x) .

Tƣơng tự, hàm mật độ xác suất có điều kiện của thành phần Y với

X = x, ký hiệu f(y/x) là biểu thức:

Y

f (x, y)f y x

f (y) .

trong đó fX(x), fY(y) lần lƣợt là hàm mật độ phân phối xác suất của X, Y.

Ví dụ 2. Cho ĐLNN 2 chiều (X, Y) có hàm mật độ phân phối xác

suất:

2 2 2

2

2 2 2

1khi x y r

f x, y r

0 khi x y r

Tìm các hàm mật độ phân phối xác suất có điều kiện của các thành

phần.

Giải. Với 2 2 2x y r , ta có f(x, y) = 0 nên fX(x) = 0

Với 2 2 2 2 2x y r x r y , ta có 2

1f x, y

r

nên

2 2

2 2

r y 2 2

X 2 2 2

r y

2 r y1 1f (x) f (x, y)dx dx dx

r r r

.

74

2 2

2 2 2

2X

2 2 2

2 r ykhi x y r

f (x) r

0 khi x y r

Do đó

2 2

2 2

X 2 2

1khi x r y

f (x, y) 2 r yf x yf (x)

0 khi x r y

.

Tƣơng tự, ta xác định đƣợc:

2 2

2 2

Y 2 2

1khi y r xf (x, y)

2 r xf y xf (y)

0 khi y r x

.

4.5. KỲ VỌNG CÓ ĐIỀU KIỆN

4.5.1. Kỳ vọng có điều kiện của ĐLNN hai chiều rời rạc

Cho X, Y là hai ĐLNN ngẫu nhiên cùng liên kết với một phép thử

có miền giá trị lần lƣợt là DX = {x1, x2, ..., xn} và DY = {y1, y2, ..., ym}.

- Kỳ vọng có điều kiện của ĐLNN X với điều kiện (Y = yj) là một

số đƣợc ký hiệu và xác định nhƣ sau:

n

j i i j

i 1

E X / y x P x / y ; j 1,m

.

- Kỳ vọng có điều kiện của ĐLNN Y với điều kiện (X = xi) là một

số đƣợc ký hiệu và xác định nhƣ sau:

m

i j j i

j 1

E Y / x y P y / x ;i 1,n.

Ví dụ 1. Tìm kỳ vọng có điều kiện ĐLNN rời rạc hai chiều có

bảng phân phối xác suất sau đây:

X

Y 0 1 2

1 0,4 0,3 0

2 0 0,12 0,18

Giải. Ta có bảng phân phối xác suất có điều kiện

75

1X y 1 0 1 2

P(xi/1) 4

7

3

7 0

Do đó 1

4 3 3E X y 1 0. 1. 2.0

7 7 7 .

Tƣơng tự ta có: 2

8E X y 2

5 ; 1E Y x 0 1;

2

9E Y x 1 ;

5 3E Y x 2 2.

4.5.2. Kỳ vọng có điều kiện của ĐLNN hai chiều liên tục

Giả sử (X, Y) là ĐLNN hai chiều liên tục có hàm mật độ xác suất

có điều kiện f(x/y) và f(y/x).

- Kỳ vọng có điều kiện của ĐLNN X với điều kiện Y = y là một số

đƣợc ký hiệu và xác định nhƣ sau: E X / y x.f (x / y)dx.

- Kỳ vọng có điều kiện của ĐLNN Y với điều kiện X = x là một số

đƣợc ký hiệu và xác định nhƣ sau: E Y / x y.f (y / x)dy.

76


Bài 4.1. Cho bảng phân phối xác suất đồng thời của ĐLNN 2

chiều rời rạc

X

Y 26 30 41 50

2,3 0,05 0,08 0,12 0,04

2,7 0,09 0,3 0,11 0,21

a. Tìm bảng phân phối xác suất của các thành phần X, Y. Tính

E(X); EY).

b. Hỏi X, Y có độc lập không? Vì sao?.

c. Tìm bảng phân phối xác suất có điều kiện của Y khi X = 26 và

của X khi Y = 2,7.

Đ/s: b. X, Y không độc lập với nhau.

c.

Y/X = 26 2,3 2,7

P 0,357 0,643

X/Y = 2,7 26 30 41 50

P 0,1268 0,4225 0,1549 0,2958

Bài 4.2. Thống kê dân số của một nƣớc theo trình độ học vấn X và

lứa tuổi Y cho kết quả sau:

Y

X

(25 – 35)

30

(35 – 55)

45

(55 – 100)

70

Thất học 0 0,01 0,02 0,05

Tiểu học 1 0,03 0,06 0,10

Trung học 2 0,18 0,21 0,15

Đại học 3 0,07 0,08 0,04

a. Tìm xác suất để lấy ngẫu nhiên 1 ngƣời thì ngƣời đó ở độ tuổi

40 và học Đại học.

77

b. Xây dựng bảng phân phối xác suất của học vấn và của lứa tuổi.

c. Xây dựng bảng phân phối xác của học vấn của những ngƣời độ

tuổi 30.

Đ/s. a. 0,08 c. P(X/y = 30) = 1/29; 3/29; 18/29; 7/29.

Bài 4.3. Cho các ĐLNN X và Y có bảng phân phối xác xuất đồng

thời nhƣ sau:

Y

X 1 2 3

1 0,12 0,15 0,03

2 0,28 0,35 0,07

a. Chứng minh X và Y độc lập với nhau.

b. Lập bảng phân phối xác suất của ĐLNN XY.

Đ/s: b.

XY 1 2 3 4 6

P 0,12 0,43 0,03 0,35 0,07

Bài 4.4. Cho X và Y là hai ĐLNN độc lập có phân phối xác suất

nhƣ sau:

X 0 1 2 3

P 0,4 0,3 0,2 0,1

Y 0 1 2 3 4

P 0,1 0,3 0,4 0,15 0,05

a. Tìm bảng phân phối xác suất của (X, Y).

b. Tính P{X > Y}.

Đ/s: b. P{X > Y} = 0,19.

Bài 4.5. Giả sử X = (X, Y) là ĐLNN liên 2 chiều có hàm mật độ

phân phối xác suất: f (x,y) k(4 x y) với 0 < x, y < 1.

a. Tìm k. b. Xác định Xf (x) , Yf (y). c. Tính P(X + Y < 0,5).

Đ/s: a. k = 2/5; b. X

2f (x) (3 x)

5 với 0 < x < 1;

c. Y

2 7f (y) ( 2y)

5 2 với 0 < y < 1.

78

Chƣơng 5

CÁC ĐỊNH LÝ GIỚI HẠN

5.1. ĐỊNH NGHĨA. Dãy các ĐLNN {Xn} đƣợc gọi là hội tụ theo

xác suất tới ĐLNN X nếu với > 0, n

nlimP X X 1.

Khi đó

ta ký hiệu: P

nX X .

5.2. BẤT ĐẲNG THỨC TRÊ-BƢ-SÉP. Cho ĐLNN X có kỳ

vọng E(X) và phƣơng sai D(X) đều hữu hạn. Khi đó với mọi > 0,

ta có:

2 2

D(X) D(X)P X E(X) 1 hay P X E(X)

(1)

Các bất đẳng thức (1) đƣợc gọi là các bất đẳng thức Trê-bư-sép.

Chứng minh: Giả sử X là ĐLNN liên tục có hàm mật độ phân phối

f(t).

Theo tính chất hàm mật độ, ta có:

E(X)

E(X)

P X E(X) P E(X) X E(X) f (t)dt

E(X)

E(X)

1 f (t)dt f (t)dt

. (2)

Mặt khác:

2

2 2

2

t E(X)t E(X) t E(X) 1

2

2

t E(X)f (t). f (t)

(vì f(t) 0).

Vì f(t) 0 nên

E(X)

E(X)

f (t)dt f (t)dt f (t)dt

2E(X)2

2 2

E(X)

t E(X) 1f (t)dt f (t)dt f (t)dt t E(X) f (t)dt

E(X)

2

E(X)

1f (t)dt f (t)dt .D(X)

(3)

79

Từ (2) và (3) suy ra: 2

D(X)P X E(X) 1 .

Về mặt thực tế bất đẳng thức Trê-bƣ-sép chỉ cho phép đánh giá

cận trên hoặc cận dƣới xác suất để ĐLNN X nhận giá trị sai lệch so

với kỳ vọng của nó lớn hơn hoặc bé thua . Đôi khi sự đánh giá đó là

hiển nhiên và không có ý nghĩa. Chẳng hạn, nếu D(X) 2 thì bất

đẳng thức là hiển nhiên đúng. Song nó lại có ƣu điểm là áp dụng đƣợc

đối với mọi ĐLNN mà không cần biết quy luật phân phối xác suất của

nó.

Ví dụ 1. Thu nhập trung bình hàng năm của dân cƣ một vùng là

700 USD và độ lệch chuẩn là 120 USD. Hãy xác định một khoảng thu

nhập hàng năm xung quanh giá trị trung bình của ít nhất 95% dân cƣ

vùng đó.

Giải. Gọi X là thu nhập hàng năm của dân cƣ vùng đó thì X là

ĐLNN với quy luật phân phối xác suất chƣa biết song có kỳ vọng toán

E(X) = 700 và độ lệch chuẩn D(X) = 120. Do đó theo bất đẳng thức

Trê-bƣ-sép, ta có:

2

130P X 700 1 0,95 536,656

Vậy ít nhất 95% dân cƣ vùng đó có thu nhập hàng năm nằm trong

khoảng (700 – 536,656; 700 + 536,656), tức là khoảng (163,344;

1236,656).

5.3. ĐỊNH LÝ TRÊ-BƢ-SÉP

5.3.1. Định lý. Giả sử X1, X2, ..., Xn là dãy các ĐLNN độc lập từng

đôi một, có kỳ vọng E(Xi) đều hữu hạn ( i 1,n ) và phƣơng sai

D(Xi) bị chặn trên bởi hằng số C (nghĩa là D(Xi) C, C là hằng số,

i 1,n ). Khi đó > 0 ta có:

n n

i in

i 1 i 1

1 1lim P X E(X ) 1

n n

.

Khi đó ta nói: n n

(P)

i i

i 1 i 1

1 1X E(X )

n n

.

Chứng minh:

80

Đặt n n n

n i n i i

i 1 i 1 i 1

1 1 1S X E(S ) E X E(X )

n n n

và n n

n i i2 2i 1 i 1

1 1 nC CD(S ) D X D(X )

n n n n

.

Áp dụng bất đẳng thức Trê-bƣ-sép đối với ĐLNN Sn, ta có:

nn n 2 2

D(S ) C0,P S E(S ) 1 1

n

n n 2n n

Clim P S E(S ) lim 1 1

n

Mà xác suất của một biến cố không vƣợt quá 1 nên:

n nn

0,limP S E(S ) 1

n n

i in

i 1 i 1

1 10, lim P X E(X ) 1.

n n

5.3.2. Hệ quả. Giả sử X1, X2, ..., Xn là dãy các ĐLNN độc lập

cùng tuân theo một quy luật phân phối xác suất nào đó với kỳ vọng

E(Xi) = và phƣơng sai D(Xi) = 2 hữu hạn ( i 1,n ). Khi đó > 0

ta có:

n

in

i 1

1lim P X 1

n

Qua hệ quả trên ta thấy khi n khá lớn thì trung bình cộng các

ĐLNN có cùng kỳ vọng hầu nhƣ lấy những giá trị xấp xỉ kỳ vọng của

chúng và xấp xỉ này càng tốt nếu n càng lớn. Điều này có ý nghĩa thực

tiễn rất lớn, chẳng hạn nhƣ muốn đo đạc một đại lƣợng vật lý nào đó

ta cần thực hiện nhiều lần và lấy trung bình cộng của các kết quả làm

giá trị thực của đại lƣợng.

Nội dung hệ quả này còn là cơ sở cho một phƣơng pháp đƣợc áp

dụng trong thống kê là phƣơng pháp mẫu mà thực chất của nó là dựa

vào mẫu ngẫu nhiên để đi đến kết luận cho tổng thể các đối tƣợng

đƣợc nghiên cứu.

5.4. ĐỊNH LÝ BERNOULLI

81

Định lý: Giả sử fn(A) là tần suất xuất hiện biến cố A trong n phép

thử độc lập và p là xác suất xuất hiện biến cố A trong mỗi phép thử.

Khi đó > 0 ta có: nnlimP f (A) p 1

.

Chứng minh: Gọi Xi là số lần xuất hiện biến cố A trong phép thử

thứ i, i 1,n .

Ta có:

Do đó: Xi A(p) ( i 1,n )

2

i i

p 1 p 1E(X ) p;D(X ) p(1 p) , i 1,n.

2 4

D(Xi) bị chặn, i 1,n .

n n n

n i n i i

i 1 i 1 i 1

1 1 1f (A) X E f (A) E X E(X ) p.

n n n

Áp dụng định lý Trê-bƣ-sép cho dãy các ĐLNN X1, X2, ..., Xn ở

trên ta có:

n n

i in

i 1 i 1

1 10, lim P X E(X ) 1

n n

nnlimP f (A) p 1.

Định lý Bernoulli nêu lên sự hội tụ theo xác suất của tần suất xuất

hiện biến cố trong n phép thử độc lập về xác suất xuất hiện biến cố đó

trong mỗi phép thử khi số phép thử tăng lên vô hạn. Do đó trong thực

tế khi số phép thử tăng lên khá lớn ta lấy fn(A) làm giá trị xấp xỉ cho

xác suất P(A).

5.5. ĐỊNH LÝ GIỚI HẠN TRUNG TÂM

Định lý. Giả sử X1, X2, ..., Xn là dãy các ĐLNN độc lập cùng tuân

theo một quy luật phân phối xác suất nào đó với kỳ vọng E(Xi) = và

phƣơng sai D(Xi) = 2 hữu hạn ( i 1,n ). Khi đó:

1 nếu A xuất hiện ở phép thử thứ i

0 nếu A không xuất hiện ở phép thử thứ i iX

82

Đại lƣợng ngẫu nhiên 1 2 nX X ... XX

n

sẽ hội tụ theo xác

suất tới một ĐLNN có quy luật phân phối xác suất chuẩn 2

N ,n

khi n .

hay đại lƣợng ngẫu nhiên X

U n

sẽ hội tụ theo xác suất tới

quy luật phân phối xác suất chuẩn hóa N(0, 1) khi n .

Trong thực hành tính toán, khi n > 30 thì ta có thể xấp xỉ:

2 X

X N , hay n N 0,1n

.

Ví dụ. 1) Chọn ngẫu nhiên 192 số trên đoạn [0, 1]. Tìm xác suất để

tổng số điểm thu đƣợc X nằm trong khoảng (88, 104).

Giải. Ta có thể coi nhƣ 192

i

i 1

X X

, trong đó mọi ĐLNN Xi độc

lập và cùng tuân theo quy luật phân phối đều U(0, 1).

Từ đó ta có E(Xi) = 0 1

0,52

; D(Xi) =

2(1 0) 1

12 12

, i 1,192 .

E(X) = 192.0,5 = 96 và D(X) = 192/12=16 = 4.

Vì vậy P(88 X 104) 104 96 88 96

2 2 0,954.4 4

2) Cho biến ngẫu nhiên X B(1000; 0,02). Tìm xác suất để X

nhận giá trị trong khoảng (40, 50).

Giải. Có thể coi 1000

i

i 1

X X

, trong đó Xi độc lập và có cùng phân

phối không một A(0,02). Từ đó theo định lý giới hạn trung tâm suy ra

X N(, 2), trong đó = np = 1000.0,02 = 20;

2 = np(1 – p) = 19,6.

P(40 X 50) 50 20 40 20

6,77 4,51 0,5 4,99919,6 19,6

= 0,001.

83


Bài 5.1. Xác suất xuất hiện sản phẩm loại 1 khi kiểm tra một sản

phẩm là 0,5. Gọi X là số lần xuất hiện sản phẩm loại 1 khi tiến hành

kiểm tra 100 sản phẩm. Đánh giá xác suất của biến cố (40 < X < 60).

Đ/s: X B(100; 0,5).

Áp dụng BĐT Trê-bƣ-sép, ta có:

P(40 < X < 60) = 2

25P( X 50 10) 1 0,75

10 .

Bài 5.2. Cho X là ĐLNN có E(X) = 1; D(X) = 0,04. Chứng minh

rằng:

a. 1 3

P( X ) 0,84.2 2

b. P(0 X 2) 0,96.

Bài 5.3. Hãy tìm , biết X là ĐLNN có D(X) = 0,01 thỏa mãn:

P( X E(X) ) 0,96.

Đ/s: 0 < 0,5.

Bài 5.4. Gieo một con xúc xắc cân đối đồng chất n lần một cách

độc lập. Gọi X là số lần xuất hiện mặt 6 chấm. Chứng minh rằng:

n n 31P n X n

6 6 36

.

Bài 5.5. Giả sử tiền điện của một gia đình phải trả trong một tháng

là ĐLNN với trung bình 16 USD và độ lệch chuẩn 1 USD. Sử dụng

bất đẳng thức Trê-bƣ-sép, hãy xác định số M nhỏ nhất để với xác suất

0,99 số tiền điện phải trả trong một năm (12 tháng) không vƣợt quá M.

Đ/s: M = 226,64.

Bài 5.6. Gieo một con xúc xắc 120 lần. Tính xác suất để số lần

xuất hiện mặt 6 chấm nhỏ hơn 15. Biết rằng con xúc xắc cân đối đồng

chất.

Đ/s: 0,113.

84

Chƣơng 6

LÝ THUYẾT MẪU

6.1. KHÁI NIỆM VỀ PHƢƠNG PHÁP MẪU

Trong thực tế chúng ta thƣờng phải nghiên cứu một tập hợp các

phần tử đồng nhất theo một hay nhiều dấu hiệu định tính hay định

lƣợng đặc trƣng cho các phần tử đó. Để nghiên cứu tập hợp các phần

tử này theo một dấu hiệu nhất định, đôi khi ta sử dụng phƣơng pháp

nghiên cứu toàn bộ, tức là thống kê toàn bộ tập hợp đó và phân tích

từng phần tử theo dấu hiệu nghiên cứu.

Ví dụ 1. Nghiên cứu dân số của một nƣớc theo các dấu hiệu nhƣ

tuổi tác, trình độ văn hóa, địa bàn cƣ trú, cơ cấu nghề nghiệp, ... có thể

tiến hành điều tra dân số và phân tích từng ngƣời theo các dấu hiệu

trên từ đó tổng hợp thành dấu hiệu chung cho toàn bộ dân số của nƣớc

đó.

Tuy nhiên, trong thực tế việc áp dụng phƣơng pháp nghiên cứu

toàn bộ sẽ gặp phải những khó khăn chủ yếu sau: Nếu quy mô tập hợp

quá lớn thì việc nghiên cứu toàn bộ sẽ đòi hỏi nhiều chi phí vật chất,

thời gian và đôi khi dẫn tới trùng hoặc bỏ sót các phần tử của nó; Có

khi trong quá trình nghiên cứu các đối tƣợng đó bị thay đổi hình dạng,

hoặc bị phá hủy, chúng không còn giá trị sử dụng nữa, hoặc chƣa có

thể xác định đƣợc tất cả các đối tƣợng.

Ví dụ 2. Kiểm tra chất lƣợng của một kho hàng có 106 sản phẩm,

ta không thể kiểm tra tất cả 106 sản phẩm; Để xác định tổng số ngƣời

còn mù chữ ở Việt Nam, ta không thể điều tra toàn bộ dân số Việt

Nam; Để tìm hiểu tâm lý của những ngƣời mắc bệnh truyền nhiễm

HIV, ta không thể tìm hiểu hết những ngƣời mắc bệnh HIV, vì còn

một bộ phận những ngƣời mắc bệnh đó ta chƣa phát hiện ra.

Vì thế, trong thực tế phƣơng pháp nghiên cứu toàn bộ thƣờng chỉ

đƣợc áp dụng với các tập hợp có quy mô nhỏ. Đối với đối tƣợng

nghiên cứu có số phần tử lớn ngƣời ta áp dụng phƣơng pháp nghiên

cứu không toàn bộ, đặc biệt là phƣơng pháp nghiên cứu chọn mẫu (gọi

là phương pháp mẫu). Phƣơng pháp này chủ trƣơng từ tập hợp nghiên

85

cứu chọn ra một số phần tử đại diện để nghiên cứu, khảo sát rồi từ đó

trên cơ sở các phƣơng pháp suy luận toán học ngƣời ta rút ra những

kết luận về các tính chất cần thiết của một dấu hiệu hay một đặc điểm

của tập tất cả các đối tƣợng nói chung.

Việc thu thập, sắp xếp và trình bày các số liệu của tổng thể hoặc

một mẫu gọi là thống kê mô tả. Còn việc sử dụng thông tin của mẫu để

tiến hành các suy đoán, kết luận về tổng thể gọi là thống kê suy diễn.

Ví dụ 3. Muốn khảo sát chiều cao trung bình của thanh niên Việt

Nam hiện nay có tăng lên so với trƣớc đây hay không, ta phải đo chiều

cao của tất cả các thanh niên Việt Nam. Điều này tuy làm đƣợc nhƣng

rõ ràng tốn rất nhiều thời gian, tiền bạc, công sức,… Do đó ta có thể

khảo sát khoảng 1 triệu thanh niên và từ chiều cao trung bình của 1

triệu ngƣời này, ta suy ra chiều cao trung bình của toàn bộ thanh niên

Việt Nam.

6.2. TỔNG THỂ VÀ MẪU

Tập hợp có các phần tử là các đối tƣợng mang dấu hiệu X mà ta

cần nghiên cứu đƣợc gọi là tổng thể. Số phần tử của tập hợp đó đƣợc

gọi là kích thước của tổng thể, ký hiệu là N.

Từ tổng thể ta chọn ra n phần tử thì n phần tử đó đƣợc gọi là một

mẫu có kích thước n (gọi là cỡ mẫu). Kích thƣớc mẫu thƣờng nhỏ hơn

rất nhiều so với kích thƣớc của tổng thể. Từ tổng thể ta có thể lấy ra

nhiều mẫu khác nhau với cùng một kích thƣớc n. Tập hợp tất cả các

mẫu có thể lấy ra đƣợc từ tổng thể đƣợc gọi là không gian mẫu.

Ví dụ 1. Ở ví vụ 3, tổng thể là tất cả các thanh niên Việt Nam, kích

thƣớc mẫu là 1 triệu thanh niên Việt Nam.

Ví dụ 2. Cần đánh giá chất lƣợng của nhà máy bia Hà Nội sản xuất

trong một tháng, ta không thể đem mở hết tất cả các chai bia để kiểm

tra chất lƣợng, vì nếu làm nhƣ vậy thì không còn bia để bán mà chỉ

mở một số chai bia nào đó, đánh giá chất lƣợng trên những chai bia

đƣợc mở này để đƣa ra kết luận (mang tính tƣơng đối) cho chất lƣợng

bia của toàn nhà máy. Số chai bia sản xuất trong một tháng là kích

thƣớc tổng thể, số chai bia đƣợc mở là kích thƣớc mẫu.

86

Thay vì nghiên cứu tất cả các phần tử có mặt trong tổng thể ta

chuyển sang nghiên cứu một bộ phận của tổng thể là mẫu, vì vậy mẫu

phải đại diện một cách khách quan nhất cho tổng thể. Để đảm bảo yêu

cầu trên ngƣời ta đƣa ra các phƣơng pháp chọn mẫu sau.

6.3. CÁC PHƢƠNG PHÁP CHỌN MẪU

6.3.1. Phƣơng pháp chọn mẫu có lặp. là phƣơng pháp ban đầu

lấy ngẫu nhiên một phần tử từ tổng thể và nghiên cứu, khảo sát phần

tử đó ghi nhận kết quả sau đó trả lại phần tử đó cho tổng thể rồi tiếp

tục chọn phần tử thứ 2 từ tổng thể, nghiên cứu, khảo sát nó ghi nhận

kết quả, rồi trả lại phần tử đó cho tổng thể, và cứ tiếp tục nhƣ thế cho

đến khi chọn đƣợc phần tử thứ n.

Cách chọn này có ƣu điểm là các phần tử chọn ra là một kết quả

của các phép thử độc lập, thuận lợi cho việc xét các điều kiện trong

các định lý toán học, nhƣng nó cũng có nhƣợc điểm là các phần tử

trong mẫu có thể lặp lại làm cho kích thƣớc mẫu giảm và không thể áp

dụng nếu trong trƣờng hợp quá trình nghiên cứu phần tử chọn ra bị

phá hủy cấu trúc.

6.3.2. Phƣơng pháp chọn mẫu không lặp. Từ tập hợp cần nghiên

cứu, rút ngẫu nhiên 1 phần tử, ghi lại các đặc số cần thiết từ phần tử

này và không trả phần tử đó về tập hợp ban đầu. Tiếp tục lấy tiếp ngẫu

nhiên lần sau.

Ta nhận thấy rằng với kích thƣớc n, số lƣợng các mẫu trong

trƣờng hợp lấy mẫu không lặp là n

NA , số lƣợng các mẫu trong trƣờng

hợp lặp là Nn. Khi N lớn hơn rất nhiều so với n thì n

NA và Nn sai khác

nhau không đáng kể vì vậy việc lấy mẫu có hoàn lại gần giống nhƣ

việc lấy mẫu không hoàn lại.

Ví dụ 3. Khi nghiên cứu về số cá trong một hồ thì tổng số cá trong

hồ là kích thƣớc của tổng thể. Từ hồ đó chọn ngẫu nhiên 10 cá thể cá

thì đƣợc mẫu không hoàn lại kích thƣớc 10. Nếu từ hồ đó chọn ngẫu

nhiên 1 cá thể cá rồi thả xuống, sau đó tiếp tục chọn 1 cá thể khác, tiến

hành 10 lần nhƣ thế ta đƣợc mẫu có hoàn lại kích thƣớc 10.

87

6.4. MẪU NGẪU NHIÊN VÀ MẪU CỤ THỂ

Khi nghiên cứu về dấu hiệu X, X là ĐLNN tuân theo quy luật

phân phối xác suất nào đó. Giả sử ta tiến hành n phép thử (quan sát)

độc lập để xác định n giá trị của mẫu. Gọi Xi là ĐLNN ứng với giá trị

sẽ thu đƣợc ở phép thử thứ i ( i 1,n ). Các ĐLNN Xi là độc lập với

nhau và có cùng phân phối với X, sau khi thực hiện phép thử Xi nhận

giá trị xi ( i 1,n ).

6.4.1. Định nghĩa. Một mẫu ngẫu nhiên có kích thƣớc n là n đại

lƣợng ngẫu nhiên độc lập, có cùng phân phối xác suất với X, đƣợc ký

hiệu là W = (X1, X2, ..., Xn).

Thực hiện một phép thử đối với W = (X1, X2, ..., Xn) ta sẽ thu

đƣợc một mẫu cụ thể (x1, x2, ..., xn). Nhƣ vậy mẫu cụ thể là một giá trị

của mẫu ngẫu nhiên.

6.4.2. Các ví dụ

Ví dụ 1. Khảo sát điểm thi môn Toán của một lớp. Ta tiến hành

quan sát 5 sinh viên. Khi đó dấu hiệu X cần nghiên cứu là điểm môn

Toán của sinh viên, X là một ĐLNN. Gọi Xi là điểm Toán của sinh

viên thứ i (i = 1,…, 5), Xi là các ĐLNN có cùng phân phối với X.

Khi đó W = (X1, X2, X3, X4, X5 ) là mẫu ngẫu nhiên có kích thƣớc 5.

Trong một lần quan sát mẫu ngẫu nhiên W, sinh viên thứ nhất

đƣợc 5 điểm, sinh viên thứ hai đƣợc 7 điểm, sinh viên thứ ba đƣợc 4

điểm, sinh viên thứ tƣ đƣợc 6 điểm, sinh viên thứ năm đƣợc 5 điểm.

Khi đó w = (x1, x2, …, xn) = (5, 7, 4, 6, 5) là giá trị cụ thể (hay còn gọi

là một mẫu cụ thể) của mẫu ngẫu nhiên W = (X1, X2, X3, X4, X5 ).

Ví dụ 2. Gọi X là ĐLNN chỉ "số sản phẩm làm ra của một tổ sản

xuất của nhà máy A trong một tháng". X1, X2, X3 lần lƣợt là ĐLNN

chỉ "sản lƣợng của tổ 1, 2, 3".

Khi đó ta có mẫu ngẫu nhiên kích thƣớc n = 3 là W = (X1, X2, X3),

tập i i, , x X ,i 1,3 1 2 3

w x x x là các giá trị của mẫu ngẫu nhiên

W. Chẳng hạn nhƣ w = (40, 30, 60) là một giá trị cụ thể của mẫu

W = (X1, X2, X3), hay là một mẫu cụ thể.

88

Ví dụ 3. Khi nghiên cứu chiều cao của một cộng đồng ngƣời, gọi X

là ĐLNN chỉ chiều cao. Ta chọn ngẫu nhiên 100 ngƣời, gọi Xi là

ĐLNN chỉ chiều cao của ngƣời thứ i ( i 1,100 ). Xi là một ĐLNN, nó có

cùng phân phối với X. Khi đó W = (X1, X2, ..., X100) là một mẫu ngẫu

nhiên có kích thƣớc 100. Sau khi đo đạc rồi, ta sẽ xác định đƣợc các giá

trị của Xi là xi ( i 1,100 ), khi đó bộ n số thực

w = (x1, x2, ..., x100) là một mẫu cụ thể.

6.5. CÁC PHƢƠNG PHÁP SẮP XẾP MẪU CỤ THỂ

Để nghiên cứu dấu hiệu X từ tổng thể ta rút ra mẫu ngẫu nhiên

có kích thƣớc n là W = (X1, X2, ..., Xn). Trong một lần thực hiện phép

thử mẫu ngẫu nhiên W ta đƣợc mẫu cụ thể w = (x1, x2, ..., xn), để khai

thác thông tin chứa đựng trong dãy số liệu này ta cần sắp xếp số liệu

nhằm dễ dàng nhận ra các đặc trƣng của dãy số liệu đó.

6.5.1. Sắp xếp theo bộ số tăng dần hoặc giảm dần

Trong trƣờng hợp mẫu có kích thƣớc n nhỏ, ngƣời ta thƣờng sắp

xếp các giá trị trong mẫu theo một bộ số khắc có giá trị tăng dần từ

nhỏ đến lớn hay từ lớn đến nhỏ, dƣới dạng (x1, x2, ..., xn)

với x1 x2 ... xn hay x1 x2 ... xn.

6.5.2. Sắp xếp theo bảng phân phối tần số, tần suất thực

nghiệm

6.5.2.1. Bảng phân phối tần số, tần suất thực nghiệm không chia lớp

Giả sử trong n giá trị của mẫu cụ thể w = (x1, x2, ..., xn) có k giá trị

phân biệt, không mất tính tổng quát ta giả thiết k giá trị đó là

x1< x2 < ...< xk, trong đó x1 có số lần lặp lại là n1, x2 có số lần lặp lại là

n2, ..., xk có số lần lặp lại là nk. Số ni gọi là tần số của giá trị xi.

Khi đó các số liệu của mẫu cụ thể đƣợc sắp xếp dƣới dạng bảng

sau đây gọi là bảng phân phối tần số.

Giá trị xi x1 x2 … xk

Tần số ni n1 n2 … nk

trong đó 1 2 kn n ... n n .

Hay theo bảng

89


Tần suất fi f1 f2 … fk

trong đó ii

nf ( i 1,k)

n gọi là tần suất của giá trị xi. Bảng trên gọi

là bảng phân phân phối tần suất.

Ví dụ 1. Khảo sát ngẫu nhiên thu nhập của 30 ngƣời trong một

công ty ta có số liệu (đơn vị: triệu đồng/tháng): 2; 3; 4; 2; 5; 4; 6; 3; 6;

6; 5; 7; 2; 4; 8; 9; 10; 8; 9; 8; 8; 7; 5; 6; 3; 3; 9; 5; 7; 10.

Sắp xếp số liệu lại ta có bảng phân phối tần số:

xi 2 3 4 5 6 7 8 9 10

ni 3 4 3 4 4 3 4 3 2

Hay bảng phân phối tần suất:

xi 2 3 4 5 6 7 8 9 10

fi 3/20 4/20 3/20 4/20 4/20 3/20 4/20 3/20 2/20

6.5.2.2. Bảng phân phối tần số, tần suất thực nghiệm chia lớp

Trong trƣờng hợp mẫu có nhiều phần tử, các giá trị của các phần

tử chênh lệch nhau không nhiều, để thuận tiện cho việc tính toán ta

phân miền giá trị của mẫu thành k lớp (có thể chia đều hoặc không

đều nhau): [a0, a1), [a1, a2), ..., [ak, ak+1) và trong các khoảng có các tần

số tƣơng ứng là ni, i 1,k . Khi đó mẫu đƣợc sắp xếp theo bảng sau:

Giá trị xi [a0, a1) [a1, a2) … [ak-1, ak)


gọi là bảng phân phối tần số phân lớp.

Khi đó đối với mỗi khoảng, ta thay bởi 1 điểm đại diện, thông

thƣờng ngƣời ta lấy điểm giữa của khoảng.

Từ đó ta có bảng rút gọn:



90

trong đó: i 1 ii

a ax , i 1,k.

2

Và từ đó ta cũng suy ra đƣợc bảng phân phối tần suất phân lớp:

Giá trị xi [a0, a1) [a1, a2) … [ak-1, ak)

Tần suất ni f1 f2 … fk

và bảng phân phối tần suất phân lớp rút gọn:


Tần suất fi f1 f2 … fk

Ví dụ 2. Điều tra Glucoza trong máu ở 100 ngƣời, ta thu đƣợc kết

quả nhƣ sau:

Khoảng GLucoza 65-80 80-95 95-110 110-125 125-140

Số ngƣời 16 34 33 9 8

Ta có bảng phân phối tần số rút gọn:

Khoảng GLucoza 72,5 87,5 102,5 117,5 132,5

Số ngƣời 16 34 33 9 8

6.6. CÁC ĐẶC TRƢNG MẪU

6.6.1. Hàm mẫu (thống kê). Hàm G = G(X1, X2, ..., Xn) với

(X1, X2, ..., Xn) là một mẫu ngẫu nhiên gọi là một hàm mẫu hay một

thống kê.

Vì mẫu (X1, X2, ..., Xn) là một ĐLNN nên thống kê

G = G(X1, X2, ..., Xn) cũng là một ĐLNN.

Với mẫu cụ thể (x1, x2, ..., xn) của mẫu ngẫu nhiên (X1, X2, ..., Xn)

thì thống kê G = G(X1, X2, ..., Xn) cũng có một giá trị

g = G(x1, x2, ..., xn).

Phân phối xác suất của thống kê G(X1, X2, ..., Xn) phụ thuộc vào

phân phối xác suất của ĐLNN X ở tổng thể.

6.6.2. Trung bình mẫu, phƣơng sai mẫu, phƣơng sai mẫu điều chỉnh

6.6.1.1. Trung bình mẫu (Kỳ vọng mẫu)

91

a. Định nghĩa. Cho mẫu ngẫu nhiên W = (X1, X2, ..., Xn) của

ĐLNN X, khi đó thống kê n

i

i=1

1X X

n gọi là trung bình mẫu hay kỳ

vọng mẫu của X.

Giả sử mẫu cụ thể (x1, x2, ..., xn) là một giá trị của mẫu ngẫu nhiên

(X1, X2, ..., Xn), khi đó thống kê n

i

i=1

1X X

n cũng có một giá trị tƣơng

ứng đó là: n

i

i=1

1x x

n .

b. Cách tính giá trị trung bình mẫu

Giả sử các số liệu của mẫu cụ thể (x1, x2, ..., xn) đƣợc sắp xếp dƣới

dạng bảng phân phối tần số:



trong đó k

i 1 2 k

i 1

n n n ... n n

.

Khi đó trung bình mẫu (kỳ vọng mẫu) đƣợc xác định nhƣ sau: k

i i

i 1

1x n x .

n

6.6.1.2. Phương sai mẫu

a. Định nghĩa. Cho mẫu ngẫu nhiên W = (X1, X2, ..., Xn) của

ĐLNN X, khi đó thống kê n n2 22 2

i i

i =1 i =1

1 1S X -X = X X

n n đƣợc gọi

là phương sai mẫu của X.

Giả sử mẫu cụ thể (x1, x2, ..., xn) là một giá trị của mẫu ngẫu nhiên

(X1, X2, ..., Xn), khi đó thống kê 2S cũng có một giá trị tƣơng ứng đó

là: n n2 22 2

i i

i =1 i =1

1 1s x -x = x x

n n .

b. Cách tính giá trị phương sai mẫu

92

Giả sử các số liệu của mẫu cụ thể (x1, x2, ..., xn) đƣợc sắp xếp dƣới

dạng bảng phân phối tần số:



trong đó k

i 1 2 k

i 1

n n n ... n n

.

Khi đó phƣơng sai mẫu đƣợc xác định nhƣ sau: k

22 2

i i

i 1

1s n x x .

n

6.6.1.3. Phương sai mẫu điều chỉnh

Cho mẫu ngẫu nhiên W = (X1, X2, ..., Xn) của ĐLNN X, khi đó

thống kê n 22

i

i =1

1S X X

n 1

đƣợc gọi là phương sai mẫu điều

chỉnh.

Với mẫu cụ thể, thống kê 2

S có giá trị là n 22

i

i =1

1s x x

n 1

.

Ta có thể tính 2

s theo công thức: 2

2ns s .

n 1

Thống kê 2S = S gọi là độ lệch tiêu chuẩn mẫu.

Thống kê 2

S S gọi là độ lệch tiêu chuẩn mẫu điều chỉnh .

Ví dụ 1. Số xe hơi bán đƣợc trong 1 tuần ở mỗi đại lý trong 45 đại

lý, cho bởi bảng sau:

Số xe hơi bán đƣợc trong tuần (xi) 1 2 3 4 5 6

Số đại lý bán (ni) 15 12 9 5 3 1

Gọi X là số xe hơi bán đƣợc trong 1 tuần. Tính số xe hơi bán đƣợc

trung bình mẫu và phƣơng sai mẫu.

Giải: Ta có 6

i

i 1

n n 45.

Số xe hơi bán đƣợc trung bình trong tuần là:

93

6

i i

i 1

1x n x

n

1

1.15 2.12 3.9 4.5 5.3 6.1 2,378.45

Phƣơng sai mẫu là:

6

22 2

i i

i 1

1s n x x

n

2 2 2 2 2 2 2115.1 12.2 9.3 5.4 3.5 1.6 2,38 1,791.

45

Ví dụ 2. Xét kết quả điều tra Glucoza trong máu ở 100 ngƣời ở ví

dụ 2, mục 6.5. Gọi X là lƣợng Glocoza trong máu. Tính lƣợng

Glucoza trung bình mẫu và bình phƣơng độ lệch mẫu.

xi ni xini 2

i ix n

72,5 16 1160.00 84100.00

87,5 34 2975.00 260312.50

102,5 33 3382.50 346706.25

117,5 9 1057.50 124256.25

132,5 8 1060.00 140450.00

Tổng 100 9635.00 955825.00

Giải: Trung bình mẫu là: 5

i i

i 1

1 9635x n x 96,35

n 100

.

Phƣơng sai mẫu là: 5

22 2 2

i i

i 1

1 955825s n x x (96,35) 274,928.

n 100

6.7. LUẬT PHÂN PHỐI CỦA CÁC ĐẶC TRƢNG MẪU

Trên tổng thể , cho ĐLNN gốc X có kỳ vọng E(X) = và

phƣơng sai D(X) = 2. Cho mẫu ngẫu nhiên (X1, X2, ..., Xn), dựa vào

kỳ vọng và phƣơng sai của các đặc trƣng mẫu, dựa vào các tính chất

của phân phối chuẩn, phân phối khi bình phƣơng, phân phối Student

và dựa vào các định lý giới hạn, ta có thể suy ra phân phối của các đặc

trƣng mẫu sau đây:

6.7.1. Phân phối của phƣơng sai mẫu điều chỉnh

94

Định lý. Nếu ĐLNN X có phân phối chuẩn N(, 2) và

(X1, X2, ..., Xn) là một mẫu ngẫu nhiên thì: n

2 2

i2i 1

1(X ) (n)

và 2 2

2

nS (n 1)

.

6.7.2. Phân phối của trung bình mẫu

Vì quy luật phân phối xác suất của X phụ thuộc vào kích thƣớc

mẫu n của mẫu ngẫu nhiên (X1, X2, ..., Xn) và phƣơng sai của tổng thể

D(X) = 2 đã biết hay chƣa biết nên ta chia thành các trƣờng hợp sau:

6.7.2.1. Trường hợp n > 30, phương sai 2 đã biết

Theo kết quả của định lý giới hạn trung tâm, khi kích thƣớc mẫu

n > 30, trung bình mẫu X có thể xấp xỉ phân phối chuẩn 2

N( , )n

.

Do đó ta có:

XZ n N(0,1)

.

6.7.2.2. Trường hợp n 30, X N(, 2), phương sai 2

đã biết

Vì X N(, 2) nên các ĐLNN của mẫu ngẫu nhiên

(X1, X2, ..., Xn) cũng có phân phối chuẩn, có nghĩa là Xi N(, 2),

i 1,n . Do đó:

2

X N( , )n

hay

XZ n N(0,1)

.

6.7.2.3. Trường hợp n > 30, phương sai 2 chưa biết

Khi n > 30, ta có thể xấp xỉ S , do đó:

X XZ n n 1 N(0,1)

SS

.

6.7.2.4. Trường hợp n 30, X N(, 2), phương sai 2

chưa biết

Nếu X N(, 2) thì ĐLNN

XZ n 1 T(n 1)

S

có phân

phối Student với n – 1 bậc tự do.

95


Bài 6.1. Hãy tính trung bình mẫu, phƣơng sai mẫu, độ lệch chuẩn

mẫu của các mẫu cụ thể chi ở bảng dƣới đây:

a.

xi - 2 1 2 3 4 5

ni 2 1 2 2 2 1

b.

xi 4 7 8 12

ni 5 2 3 10

c.

xi 12 13 15 17 18 20

ni 2 5 8 4 4 2

d.

xi 21 24 25 26 28 32 34

ni 10 20 30 15 10 10 5

e.

xi 3,0 3,5 3,8 4,4 4,5

ni 2 6 9 7 1

f.

xi 18,6 19,0 19,4 19,8 20,2 20,6

ni 4 6 30 40 18 2

g.

xi 65 70 75 80 85

ni 2 5 25 15 3

Đ/s: a. x = 2; s2 = 5,2; s = 2,404.

b. x = 8,9; s2 = 11,29; s = 3,447.

c. x = 15,56; s2 = 5,286; s = 2,347.

d. x = 26; s2 = 10,8; s = 3,303.

e. x = 3,86; s2 = 0,19; s = 0,444.

f. x = 19,672; s2 = 0,169; s = 0,413.

96

g. x = 76,2; s2 = 18,56; s = 4,352.

Bài 6.2. Cho 8 kết quả đo đạc về một ĐLNN X bởi cùng một máy

không có sai số hệ thống: 396, 378, 315, 420, 385, 401, 372, 383. Tính

trung bình mẫu, phƣơng sai mẫu và độ lệch tiêu chuẩn điều chỉnh.

Đ/s: x = 381,25; s2 = 826,438; s = 30,733.

Bài 6.3. Đo chiều cao của 100 sinh viên ở cùng một trƣờng đại học

ngƣời ta thu đƣợc bảng số liệu sau:

Chiều cao (cm) Số sinh viên

154-158 10

158-162 14

162-166 26

166-170 28

170-174 8

174-178 2

178-182 12

Tính chiều cao trung bình và độ lệch tiêu chuẩn điều chỉnh của

chiều cao qua mẫu nói trên.

Đ/s: x = 166,56; s = 6,763.

Bài 6.4. Các kết quả về việc đo độ bền các sợi chỉ ta thu đƣợc

bảng số liệu sau dƣới đây:

Độ bền của sợi chỉ Số sợi chỉ

120-140 1

140-160 4

160-180 10

180-200 14

200-220 12

220-240 6

240-260 2

260-280 1

97

Tính độ bền trung bình mẫu, phƣơng sai mẫu và độ lệch chuẩn

mẫu của mẫu nói trên.

Đ/s: x = 195,2; s2 = 812,96 ; s = 28,513.

Bài 6.5. Để xác định độ chính xác của một chiếc cân tạ không

có sai số hệ thống, ngƣời ta tiến hành cân 5 lần cân độc lập (cùng

một vật), kết quả nhƣ sau: 94,1; 94,8; 96,0; 95,4; 95,2 (kg). Xác

định trung bình mẫu, phƣơng sai mẫu và độ lệch chuẩn mẫu của

mẫu trên.

Bài 6.6. Lấy ngẫu nhiên 100 thanh niên ở một tỉnh đem đo

chiều cao ta thu đƣợc các số liệu sau:

Chiều cao (cm) Số thanh niên (ni)

154-158 10

158-162 14

162-166 26

166-170 28

170-174 12

174-178 8

178-182 2

Gọi X là chiều cao thanh niên. Hãy xác định trung bình mẫu,

phƣơng sai mẫu.

Bài 6.7. Để điều tra năng suất lúa của một huyện nào đó, ta

gặt ngẫu nhiên 365 điểm trồng lúa của huyện thu đƣợc các kết quả

sau:

Năng suất

(tạ/ha) 25 30 33 34 35 36 37 39 40

Điểm gặt (ni) 6 13 38 74 106 85 30 10 3

Gọi X là năng suất lúa trên một ha canh tác. Hãy xác định

năng suất trung bình, độ phân tán của năng suất.

Bài 6.8. Theo dõi doanh thu của 25 của hàng bán lẻ cùng một

mặt hàng thu đƣợc kết quả sau:

98

Doanh thu (triệu đồng/ngày) Số cửa hàng

10 – 12 2

12 – 14 5

14 – 16 8

16 – 18 7

18 – 20 3

Hãy xác định trung bình mẫu và độ lệch tiêu chuẩn mẫu điều

chỉnh.

Bài 6.9. Để nghiên cứu tuổi thọ của một loại bóng đèn, ngƣời ta

thắp thử 100 bóng và có số liệu sau:

Tuổi thọ (giờ) Số bóng tƣơng ứng

1010 – 1030 2

1030 – 1050 3

1050 – 1070 8

1070 – 1090 13

1090 – 1110 25

1110 – 1130 20

1130 – 1150 12

1150 – 1170 10

1170 – 1190 6

1190 – 1210 1

Sau khi cải tiến kỹ thuật ngƣời ta thắp thử 100 bóng, kết quả thu

đƣợc nhƣ sau:

Tuổi thọ

(giờ) 1150 1160 1170 1180 1190 1200

Số bóng

tƣơng ứng 10 15 20 30 15 10

So sánh trung bình và độ lệch tiêu chuẩn mẫu điều chỉnh của tuổi

thọ loại bóng đèn nói trên trƣớc và sau cải tiến kỷ thuật qua hai mẫu

cụ thể nói trên.

99

Chƣơng 7

BÀI TOÁN ƢỚC LƢỢNG THAM SỐ

7.1. KHÁI NIỆM ƢỚC LƢỢNG. Khi nghiên cứu đặc tính X ở

mỗi phần tử của tổng thể, nếu xác định đƣợc quy luật xác suất của X

thì việc đƣa ra đánh giá cũng nhƣ dự báo về sự biến động của tổng thể

liên quan đến đặc tính này sẽ chính xác và khách quan. Tuy nhiên,

không phải lúc nào chúng ta cũng có thể xác định đƣợc quy luật xác

suất của X. Trong một số trƣờng hợp, chúng ta chỉ biết đƣợc dạng

toán học của hàm phân phối hoặc hàm mật độ của ĐLNN X mà chƣa

biết các tham số có mặt trong chúng. Vì vậy, để xác định quy luật xác

suất của X, trƣớc hết ta phải đánh giá về các tham số này.

Trên thực tế, các tham số của tổng thể nhƣ: kỳ vọng = E(X),

phƣơng sai 2 = D(X), độ lêch chuẩn (X), tỷ lệ xác suất p ... là không

biết, vì ta không thể đi khảo sát hết tất cả các phần tử của tổng thể.

Tuy nhiên, nhiều bài toán chúng ta cần phải ƣớc lƣợng chúng. Việc

ƣớc lƣợng các tham số đó dựa vào một mẫu thống kê (X1, X2, ..., Xn)

đƣợc gọi là Bài toán ước lượng tham số.

Giả sử là một tham số nào đó của tổng thể ( có thể là kỳ vọng

= E(X), phƣơng sai 2 = D(X), độ lêch chuẩn (X), tỷ lệ xác suất

p...). Khi đó căn cứ trên mẫu (X1, X2, ..., Xn) ta cần xác định một đại

lƣợng gần đúng của , hay chỉ ra khoảng (a, b) nào đó mà

P(a b) , là một xác suất cho trƣớc gọi là độ tin cậy,

đủ lớn ( 1).

Nếu chỉ ƣớc lƣợng một giá trị gần đúng của thì gọi là ƣớc

lƣợng điểm của , còn nếu tìm một khoảng (a, b) để P(a b) ,

thì (a, b) đƣợc gọi là ƣớc lƣợng khoảng tin cậy của với độ tin cậy .

7.2. HÀM ƢỚC LƢỢNG VÀ PHƢƠNG PHÁP ƢỚC LƢỢNG ĐIỂM

Do đƣợc tính dựa vào mẫu (X1, X2, ..., Xn) nên nó phải là một

giá trị của thống kê G(X1, X2, ..., Xn), thống kê này đƣợc gọi là hàm

ước lượng, khi đó

100

= G(X1, X2, ..., Xn) sẽ đƣợc dùng để ƣớc lƣợng . Tất nhiên ƣớc

lƣợng của cần phải thỏa mãn một số tiêu chuẩn nào đó.

Có nhiều hàm ƣớc lƣợng = G(X1, X2, ..., Xn) của tham số khác

nhau. Tuy nhiên một hàm ƣớc lƣợng đƣợc coi là tốt nhất nếu nó thỏa

mãn các tiêu chuẩn đƣợc định nghĩa sau đây.

7.2.1. Ƣớc lƣợng không chệch

Thống kê 1 2 nG(X ,X ,...,X ) đƣợc gọi là một ước lượng không

chệch của tham số nếu E( ) .

Thống kê 1 2 nG(X ,X ,...,X ) đƣợc gọi là một ước lượng chệch

của tham số nếu E( ) .

Ví dụ 1. Giả sử dấu hiệu X ở tổng thể là một ĐLNN có kỳ vọng

E(X) = , phƣơng sai D(X) = 2 và 1 2 n(X ,X ,...,X ) là một mẫu ngẫu

nhiên. Khi đó ta có:

i) Thống kê n

i

i 1

1X X

n

là một ƣớc lƣợng không chệch của .

ii) Thống kê n 2

2

i

i =1

1S X -X

n là một ƣớc lƣợng chệch của

2.

iii) Thống kê n 22

i

i =1

1S X X

n 1

là một ƣớc lƣợng không

chệch của 2.

Giải. i) n n n

i i

i 1 i 1 i 1

1 1 1E(X) E X E(X )

n n n

. Vậy X là

một ƣớc lƣợng không chệch của .

ii) Ta có: n n2 2

2

i i

i =1 i =1

1 1S X X (X μ) (X μ)

n n

n n n

22 2

i i

i =1 i =1 i =1

1S X μ 2(X μ) X μ (X μ)

n

n n n

22 2

i i

i =1 i =1 i =1

1 1 1S X μ 2. (X μ) X μ (X μ)

n n n

101

n n n

22 2

i i

i =1 i =1 i =1

1 1 1 1S X μ 2(X μ) X μ .n(X μ)

n n n n

n

22 2

i

i =1

1 1 1S X μ 2(X μ) X .nμ .n(X μ)

n n n

n

22 2

i

i =1

1S X μ (X μ)

n .

Dođó:

n n

2 22 2 2

i i

i =1 i =1

1 1E(S ) E X μ (X μ) E X μ E(X μ)

n n

n n n

i 2i =1 i =1 i =1

1 1 1D(X ) D(X) D(X) D(X)

n n n

n

2 2

i

i =1

1 D(X) n 1D(X ) D(X) D(X) σ σ

n n n

.

Vậy S2 là ƣớc lƣợng chệch của .

iii) Vì 2 2

2 2 2 2n n nS S E(S ) E S E(S )

n 1 n 1 n 1

.

Vậy 2

S là ƣớc lƣợng không chệch của .

7.2.2. Ƣớc lƣợng vững

Thống kê 1 2 nG(X ,X ,...,X ) đƣợc gọi là một ƣớc lƣợng vững

của tham số nếu với mọi > 0 cho trƣớc, ta có:

nlim P 1

.

Ví dụ 2. 1) Giả sử dấu hiệu X ở tổng thể là một ĐLNN có kỳ vọng

E(X) = , phƣơng sai D(X) = 2 và 1 2 n(X ,X ,...,X ) là một mẫu ngẫu

nhiên. Khi đó ta có, thống kê n

i

i 1

1X X

n

là một ƣớc lƣợng vững của .

Giải. Với mọi > 0, áp dụng bất đẳng thức Trê-bƣ-sép với biến

X , ta có:

102

2

2P X 1

n

mà

2

2nlim 1 0

n

nên

nlimP X 1

.

Vậy n

i

i 1

1X X

n

là một ƣớc lƣợng vững của .

2) Xét một dãy n phép thử độc lập, xác suất xuất hiện biến cố A ở

mỗi phép thử là p = P(A). Gọi nA là số lần xuất hiện A trong n phép

thử, tần suất fn(A) = An

nlà ƣớc lƣợng vững của p = p(A). Khẳng định

này đƣợc suy ra từ Định lý Bernoulli.

7.3. PHƢƠNG PHÁP ƢỚC LƢỢNG KHOẢNG

7.3.1. Mở đầu

Ƣớc lƣợng điểm dù tốt nhất cũng chỉ cho ta một giá trị trong tập

vô hạn nên ta không biết đƣợc độ chính xác cũng nhƣ độ tin cậy của

ƣớc lƣợng, do đó không đánh giá đƣợc mức độ sai lầm khi dùng

thay thế cho .

Để khắc phục các hạn chế đó ngƣời ta đƣa ra khái niệm ƣớc lƣợng

khoảng tin cậy cho tham số , theo nghĩa dựa vào một thống kê

1 2 nG(X ,X ,...,X ) và một xác suất cho trƣớc , tìm khoảng (a, b)

sao cho:

P(a b)

trong đó:

+ Xác suất gọi là độ tin cậy của ước lượng.

+ Xác suất = 1- gọi là mức ý nghĩa, nó đánh giá mức độ sai

lầm khi ƣớc lƣợng.

+ Khoảng (a, b) gọi là khoảng tin cậy (khoảng ước lượng).

+ b – a = 2 gọi là độ dài khoảng tin cậy.

+ gọi là độ chính xác của ước lượng.

Bây giờ ta xét cụ thể các bài toán tìm khoảng tin cậy cho tham số

nhƣ sau:

103

7.3.2. Ƣớc lƣợng khoảng tin cậy cho tỷ lệ của tổng thể

Tiến hành một dãy n phép thử độc lập có tần suất xuất hiện biến cố

A là fn = fn(A) = m

n. Với độ tin cậy đã cho, hãy tìm khoảng tin cậy

đối xứng (p1, p2) của p = P(A) chƣa biết sao cho: 1 2P(p p p ) .

Khi n đủ lớn thì thống kê n

p(1 p)f N p,

n

hay

nf pZ n N(0,1)

p(1 p)

.

Vì p chƣa biết (chúng ta đang cố gắng ƣớc lƣợng nó) nên độ lệch

chuẩn p(1 p)

n

ta không biết đƣợc. Tuy nhiên với một số điều

kiện (thƣờng là n 100) ta có thể xấp xỉ p bởi fn. Do đó:

n

n n

f pZ n N(0,1)

f (1 f )

.

Do đó ta luôn tìm đƣợc giá trị phân vị 2

U sao cho:

n n

2 2n n n n

f p f pP n U P n U 1

f (1 f ) f (1 f )

n

2 2n n

f pP U n U

f (1 f )

n n n nn n

2 2

f (1 f ) f (1 f )P f U p f U

n n

Do đó n n n nn n

2 2

f (1 f ) f (1 f )f U p f U

n n

là khoảng

tin cậy đối xứng cho tỷ lệ tổng thể p.

Ví dụ 1. 1) Trong đợt bầu cử tổng thống, ngƣời ta phỏng vấn ngẫu

nhiên 1600 cử tri thì đƣợc biết có 960 ngƣời sẽ bầu cho ứng viên A.

Với độ tin cậy 99% hãy tìm khoảng tin cậy cho tỷ lệ cử tri sẽ đi bỏ

phiếu cho ứng viên A.

104

Giải. Gọi B là biến cố cử tri sẽ đi bỏ phiếu cho ứng viên A;

p = p(B) là tỷ lệ cử tri sẽ đi bỏ phiếu cho ứng viên A.

Trong mẫu cụ thể 1600 cử tri có 960 ngƣời bỏ phiếu cho ứng viên

A nên tỷ lệ mẫu là: f1600(B) = f = 960

0,61600

.

Với độ tin cậy = 99% = 0,99 0,005

2

U U 2,57 .

Độ chính xác của ƣớc lƣợng 0,6.0,4

2,57 0,0321600

.

Vậy với độ tin cậy 99%, khoảng tin cậy cho tỷ lệ p của phiếu bầu

cho ứng viên A là:

(0,6 – 0,032; 0,6 + 0,032) = (0,568; 0,632).

2) Để ƣớc lƣợng số hải cẩu trên một hòn đảo ngƣời ta đánh dấu

cho 2000 con. Sau một thời gian bắt lại 400 con thấy có 80 con có

đánh dấu. Hãy ƣớc lƣợng số hải cẩu có trên đảo với độ tin cậy 95%.

Giải. Gọi p là tỷ lệ hải cẩu có đánh dấu trên đảo.

Tỷ lệ mẫu f = 80/400 = 0,2.

Với độ tin cậy = 95%, ta có 0,025

2

U U 1,96 .

Độ chính xác của ƣớc lƣợng 0,2.0,8

1,96. 0,039400

.

Khoảng tin cậy cho tỷ lệ số hải cẩu có đánh dấu trên hòn đảo là:

(0,2 – 0,039; 0,2 + 0,039) = (0,161; 0,239).

Gọi số hải cẩu có trên đảo là N, khi đó p = 2000

N, nên ta có:

2000 2000 20000,161 0,239 N 8368 N 12422

N 0,239 0,161

7.3.3. Ƣớc lƣợng khoảng tin cậy cho kỳ vọng (trung bình) của

tổng thể

Giả sử trong tổng thể ĐLNN X có tham số kỳ vọng = E(X) chƣa

biết, phƣơng sai của tổng thể 2 = D(X) có thể đã biết hoặc chƣa biết.

Từ tổng thể ta lập mẫu ngẫu nhiên kích thƣớc n (X1, X2, ..., Xn) và độ

105

tin cậy = 1 - cho trƣớc, hãy tìm khoảng tin cậy đối xứng (1, 2)

sao cho: 1 2P( ) .

Để ƣớc lƣợng trung bình tổng thể chúng ta cần biết quy luật

phân phối của trung bình mẫu X , mà quy luật phân phối của X lại

phụ thuộc vào kích thƣớc mẫu n và phƣơng sai của tổng thể 2, nên ta

xét các trƣờng hợp sau:

7.3.3.1. Kích thước mẫu n > 30, 2 đã biết

Nhƣ ta đã biết, vì X

Z n N(0,1)

, nên với độ tin cậy

= 1 - , ta tìm đƣợc phân vị 2

U sao cho:

2

XP n U 1

2 2

P X U X U 1n n

.

Với mẫu cụ thể (x1, x2, ..., xn) thì khoảng tin cậy cho kỳ vọng với

độ tin cậy γ = 1 - là: α α

2 2

σ σx U . ;x + U .

n n

.

Ví dụ 2. Khảo sát về thu nhập của 100 nhân viên làm việc trong

một công ty thu đƣợc kết quả sau:

Thu nhập (triệu đồng/tháng 1 2 3 4 5 6 7 8

Số ngƣời 2 5 8 12 17 16 24 16

Biết rằng thu nhập của các nhân viên là ĐLNN có độ lệch chuẩn

= 200 nghìn đồng. Hãy ƣớc lƣợng thu nhập trung bình của một nhân

viên làm việc ở công ty này với độ tin cậy 95%.

Giải. Gọi là thu nhập trung bình của một nhân viên.

+ Trung bình mẫu:

1x (1.2 2.5 3.8 4.12 5.17 6.16 7.24 8.16) 5,61

100 .

106

+ Với độ tin cậy γ = 1 – α = 95%, ta suy ra α

2

U = U0,025 = 1,96.

+ Độ chính xác của ƣớc lƣợng: 2

0,2U . 1,96. 0,039

n 100

.

+ Khoảng tin cậy thu nhập trung bình của mỗi nhân viên trong

công ty là: (5,61 – 0,039; 5,61 + 0,039) = (5,571; 5,649).

Ví dụ 3. Để xác định chiều cao trung bình của cây bạch đàn trong

khu rừng, ta tiến hành đo ngẫu nhiên 350 cây. Kết quả thu đƣợc nhƣ sau:

Khoảng

chiều cao

(m)

6,5-7,0 7,0-7,5 7,5-8,0 8,0-8,5 8,5-9,0 9,0-9,5

Số cây 20 40 100 110 50 30

Với độ tin cậy 95%, ta có thể nói chiều cao trung bình của cây

bạch đàn thuộc khu rừng trên nằm trong khoảng nào? Giả sử độ lệch

chuẩn của ĐLNN chiều cao cây bạch đàn là 0,64.

Giải: Gọi là chiều cao trung bình của cây bạch đàn trong khu

rừng.

Ta có: n = 35; = 0,64; x 8,064 ; γ 0,95 ; 0,025U 1,96 .

Do đó khoảng ƣớc lƣợng chiều cao trung bình của cây bạch đàn

với độ tin cậy 95% là:

α α

2 2

σ σx U . ;x + U . 7,997 ; 8,131

n n

.

7.3.3.2. Kích thước mẫu n 30, 2 đã biết, X có phân phối chuẩn

Trƣờng hợp này tƣơng tự nhƣ trƣờng hợp 7.3.3.1. Vì

XZ n N(0,1)

, do đó khoảng tin cậy cho kỳ vọng với độ

tin cậy γ = 1 - là:

α α

2 2

σ σx U . ;x + U .

n n

.

7.3.3.3. Kích thước mẫu n > 30, 2 chưa biết

107

Vì n > 30 khá lớn nên ta có thể xấp xỉ S , trƣờng hợp này ta

chỉ thay bởi S . Khi đó khoảng tin cậy của là:

α α

2 2

S SX U . ; X + U .

n n

hayα α

2 2

S SX U . ; X + U .

n-1 n-1

.

Với mẫu cụ thể (x1, x2, ..., xn) thì khoảng tin cậy cho kỳ vọng với

độ tin cậy γ = 1 - là: α α

2 2

s sx U . ;x + U .

n n

hay α α

2 2

s sx U . ;x + U .

n-1 n-1

.

7.3.3.4. Kích thước mẫu n 30, 2 chưa biết, X có phân phối chuẩn

Vì X có phân phối chuẩn nên X X

Z n n 1 T(n 1)SS

.

Do đó, với độ tin cậy = 1 - , sẽ tìm đƣợc giá trị phân vị 2

t (n 1)

sao cho:

2

XP n 1 t (n 1) 1

S

2 2

S SP X t (n 1) X t (n 1) 1

n 1 n 1

Vậy với mẫu cụ thể (x1, x2, ..., xn) thì khoảng tin cậy của kỳ vọng

= E(X) với độ tin cậy γ = 1 - là:

2 2

s sx t (n 1). ;x t (n 1).

n 1 n 1

hoặc 2 2

s sx t (n 1). ;x t (n 1).

n n

.

108

trong đó: 2

t (n 1) đƣợc xác định từ bảng giá trị phân vị của hàm phân

phối Student với n – 1 bậc tự do.

Ví dụ 4. Xét ví dụ 3, với giả thiết độ lệch tiêu chuẩn chƣa biết,

X có phân phối chuẩn. Tìm khoảng ƣớc lƣợng chiều cao trung bình

của cây bạch đàn với độ tin cậy 95%.

Giải: Ta có: x = 8,064; s2

= 0,401; s = 0,633; n = 350.

γ 0,95 1 α α 1 0,95 0,05 .

0,025

1 0,05U 0,475

2

, tra bảng hàm La – pla – ce ta đƣợc

0,025U 1,96 .

Vì n = 350 > 30, D(X) chƣa biết và X có phân phối chuẩn nên áp

dụng trƣờng hợp 7.3.3.3 ta có:

Khoảng ƣớc lƣợng chiều cao trung bình của cây bạch đàn với độ

tin cậy 95% là: α α

2 2

s sx U . ;x + U .

n 1 n 1

0,633 0,633

8,061 1,96. ; 8,061 1,96. 7,998 ; 8,131349 349

Ví dụ 5. Số liệu thống kê doanh số bán của một siêu thị trong một

số ngày cho ở bảng sau:

Doanh số

(triệu đồng/ngày) 24 30 36 42 48 54 60 65 70

Số ngày 5 12 25 35 24 15 12 10 6

a) Ƣớc lƣợng doanh số bán trung bình trong một ngày của siêu thị

này với độ tin cậy 98%.

b) Những ngày có doanh số bán từ 60 triệu đồng trở lên là những

ngày bán đắt hàng. Hãy ƣớc lƣợng doanh số bán trung bình của một

ngày "bán đắt hàng" ở siêu thị này với độ tin cậy 95% (giả thiết doanh

số bán của những ngày bán đắt hàng là ĐLNN có phân phối chuẩn).

Giải.

a) Gọi là doanh số bán trung bình trong một ngày của siêu thị.

109

Từ mẫu ta tính đƣợc: x 45,847 ; s 11,534 .

Với độ tin cậy 98%, ta có: 0,01

2

U U 2,33

Do đó khoảng tin cậy của với độ tin cậy 98% là:

α α

2 2

s sx U . ;x + U .

n n

11,534 11,53445,847 2,33. ;45,847 2,33. (43,607;48,087)

144 144

b) Gọi c là doanh số bán trung bình của một ngày bán đắt hàng

của siêu thị.

Doanh số (triệu đồng/ngày) 60 65 70

Số ngày 12 10 6

Từ bảng này ta tính đƣợc: c

1790x 63,929,

28 cs 3,934 .

Với độ tin cậy 95% thì ta có 0,25

2

t (n 1) t (27) 2,052.

Vì n = 28 < 30, X là ĐLNN có phân phối chuẩn nên, khoảng tin

cậy doanh số bán trung bình của một ngày bán đắt hàng ở siêu thị này

là:

c cc c

2 2c c

s sx t (n 1). ;x t (n 1).

n n

3,934 3,93463,929 2,052. ;63,929 2,052. (62,424;65,435)

28 28

.

7.3.4. Ƣớc lƣợng phƣơng sai

Trên tổng thể , cho ĐLNN X có phân phối chuẩn N(, 2), với

phƣơng sai của tổng thể D(X) = 2 chƣa biết, kỳ vọng của tổng thể

E(X) = có thể đã biết hoặc chƣa biết. Từ mẫu kích thƣớc n

(X1, X2, ..., Xn) và độ tin cậy γ = 1 – α cho trƣớc, tìm khoảng tin cậy

đối xứng 2 2

1 2; sao cho:

2 2 2

1 2P .

110

Để giải bài toán trên, ta xét hai trƣờng hợp sau:

7.3.4.1. Trường hợp đã biết trung bình tổng thể = 0

Giả sử (X1, X2, ..., Xn) là mẫu ngẫu nhiên, khi đó ta có: n

2 2 2

i2i 1

1(X ) (n)

Với độ tin cậy = 1 - cho trƣớc, ta tìm đƣợc các giá trị phân vị 2

2

(n); 2

12

(n)

sao cho:

n2 2 2

i21

i 12 2

1P (n) (X ) (n) 1 1

2 2

.

2 22 2 2 2

2 2 21

2 21

2 2

1 nS nSP (n) nS (n) P

(n) (n)

.

Vậy khoảng tin cậy của 2 với độ tin cậy = 1 - là:

2 22

2 2

12 2

nS nS

(n) (n)

.

trong đó: S2 là phƣơng sai mẫu.

2 2

12 2

(n); (n)

tra từ bảng phân phối 2 với n bậc tự do.

7.3.4.2. Trường hợp chưa biết trung bình tổng thể = 0

Tƣơng tự nhƣ trên, ta có thống kê 2 2 2

2

nS (n 1)

. Do đó

với độ tin cậy = 1 - cho trƣớc, ta tìm đƣợc các giá trị phân vị 2

2

(n 1), 2

12

(n 1)

sao cho:

22 2

21

2 2

nSP (n 1) (n 1) 1 1

2 2

111

2 22

2 2

12 2

nS nSP

(n 1) (n 1)

.

Vậy khoảng tin cậy của 2 với độ tin cậy = 1 - là:

2 22

2 2

12 2

nS nS

(n 1) (n 1)

.

trong đó: S2 là phƣơng sai mẫu.

2 2

12 2

(n 1); (n 1)

tra từ bảng phân phối 2 với n bậc tự do.

Ví dụ 6. Để khảo sát chỉ tiêu X của một loại sản phẩm, ngƣời ta

quan sát một mẫu và có kết quả sau:

X (cm) 11-15) 15-19 19-23 23-27 27-31 31-35 35-39

Số sp ni 8 9 20 16 16 13 18

Giả sử X có phân phối chuẩn. Hãy ƣớc lƣợng phƣơng sai của X

với độ tin cậy γ = 90%.

Giải: Ta có n – 1 = 99 100; X = 26,36 (cm); s2 = 55,4304 (cm

2).

Tra bảng phân phối khi bình phƣơng 2 2 2 2(n 1) (99) (100) bậc tự do, ta đƣợc:

2 2 2 2

0,05 0,951

2 2

(n 1) (100) 124,324; (n 1) (100) 77,93

.

Vậy khoảng ƣớc lƣợng của phƣơng sai là:

2 2

2 2

12 2

n.s n.s ;

(n 1) (n 1)

100 55,4304 100 55,4304

; 44,585 ; 71,128 .124,324 77,93

112


Bài 7.1. Hãy ƣớc lƣợng tỷ lệ chính phẩm của một nhà máy bằng

khoảng tin cậy đối xứng với độ tin cậy 0,95 biết rằng kiểm tra 100 sản

phẩm của nhà máy thì thấy có 10 phế phẩm.

Đ/s: (0,841; 0,959).

Bài 7.2. Bằng khoảng tin cậy đối xứng hãy ƣớc lƣợng tỷ lệ hạt nảy

mầm với độ tin cậy 95% trên cơ sở kết quả thực nghiệm: gieo 1000

hạt, có 860 hạt nảy mầm.

Đ/s: (0,86; 0,882).

Bài 7.3. Mở thử 200 hộp của một kho đồ hộp, ngƣời ta thấy có 8

hộp bị biến chất. Với độ tin cậy 0,97 hãy ƣớc lƣợng khoảng tỷ lệ đồ

hộp bị biến chất ở kho đó.

Đ/s: (0,009; 0,07).

Bài 7.4. Trƣớc ngày bầu cử khối trƣởng của một khối dân cƣ, một

cuộc thăm dò dƣ luận đã đƣợc tiến hành. Ngƣời ta chọn ngẫu nhiên

100 ngƣời để hỏi ý kiến thì có 60 ngƣời nói rằng họ sẽ bỏ phiếu cho

ông A. Tìm khoảng tin cậy cho tỷ lệ ngƣời bỏ phiếu cho ông A với độ

tin cậy 90%.

Đ/s: (0,52; 0,68).

Bài 7.5. Trong một mẫu ngẫu nhiên gồm 200 ngƣời dùng xe máy,

có 162 ngƣời dùng xe máy 100 phân khối trở lên. Tìm khoảng tin cậy

với mức tin cậy 95% cho tỷ lệ những ngƣời dùng xe lớn hơn 100

phân phối.

Đ/s: (75,5%; 86,5%).

Bài 7.6. Điều tra năng suất lúa trên diện tích 100 ha trồng lúa của

một vùng, ngƣời ta thu đƣợc bảng số liệu sau:

Năng suất (tạ/ha) 41 44 45 46 48 52 54

Diện tích 10 20 30 15 10 10 5

a. Tìm ƣớc lƣợng không chệch của năng suất lúa trung bình của

vùng đó.

b. Tìm khoảng ƣớc lƣợng của năng suất lúa trung bình ở vùng đó

với độ tin cậy 95%.

113

Đ/s: a. 246 s 10,8x ; b. (45,35; 46,69).

Bài 7.7. Đo chiều dài của 25 chi tiết máy do một máy sản xuất,

với phƣơng sai 2 = 100 cm

2, 100 x cm . Giả sử chiều dài tuân

theo quy luật phân phối chuẩn. Hãy tìm khoảng tin cậy của chiều

dài của loại chi tiết đó với độ tin cậy 99%.

Đ/s: (94,86; 105,14).

Bài 7.8. Để xác định trọng lƣợng trung bình của các bao bột

trong kho, ngƣời ta đem cân ngẫu nhiên 15 bao của kho đó và tìm

đƣợc239,8 ; s 0,414x kg . Hãy tìm khoảng ƣớc lƣợng của

trọng lƣợng trung bình của các bao bột trong kho với độ tin cậy là

99%. Giả thiết rằng trọng lƣợng đóng bao của các bao bột là

ĐLNN có phân phối chuẩn.

Đ/s: (39,288; 40,312).

Bài 7.9. Cân thử 25 bao gạo, ngƣời ta tính đƣợc trọng lƣợng

trung bình của một bao gạo là 40 kgx , độ lệch tiêu chuẩn điều

chỉnh mẫu s = 5 kg . Với độ tin cậy 95%, hãy tìm ƣớc lƣợng

khoảng cho trọng lƣợng trung bình của bao gạo, biết rằng trọng

lƣợng của bao gạo là ĐLNN tuân theo quy luật phân phối chuẩn.

Bài 7.10. Điểm trung bình môn XSTK của sinh viên trƣờng

Đại học A là biến ngẫu nhiên có độ lệch chuẩn 0,26 điểm. Khảo

sát ngẫu nhiên 100 sinh viên trƣờng này thấy điểm trung bình môn

XSTK là 5,12 điểm. Hãy ƣớc lƣợng khoảng điểm trung bình môn

XSTK của sinh viên trƣờng A với độ tin cậy 98%?

Đ/s: (5,06 ; 5,18).

Bài 7.11. Để ƣớc lƣợng chiều dài trung bình của các tấm vật

liệu do một nhà máy sản xuất, ngƣời ta tiến hành đo 5 tấm và thu

đƣợc kết quả sau: 2,015; 2,025; 2,015; 2,020; 2,015 (mm). Hãy

ƣớc lƣợng chiều dày trung bình của các tấm vật liệu do nhà máy

sản xuất với độ tin cậy 95%. Biết rằng chiều dày của các tấm vật

liệu là một ĐLNN tuân theo quy luật phân phối chuẩn.

Đ/s: (2,012; 2,024).

114

Bài 7.12. Đo đƣờng kính của 20 chi tiết do một máy tiện sản xuất

ra, ta có số liệu nhƣ sau:

Đƣờng kính (mm) Số chi tiết máy

247 1

248 2

249 3

250 5

251 1

252 1

253 2

255 1

256 1

257 1

258 1

259 1

Giả sử đƣờng kính là một đại lƣợng ngẫu nhiên tuân theo quy luật

phân phối chuẩn. Hãy xác định khoảng ƣớc lƣợng đƣờng kính trung

bình với độ tin cậy 95%.

Đ/s: Khoảng ƣớc lƣợng là (250,036; 253,363).

Bài 7.13. Để định mức thời gian gia công một chi tiết máy, ngƣời

ta theo dõi ngẫu nhiên quá trình gia công ngẫu nhiên 25 chi tiết và thu

đƣợc số liệu sau:

Thời gian gia công (phút) Số chi tiết tƣơng ứng

15 – 17 1

17 – 19 3

19 – 21 4

21 – 23 12

23 – 25 3

25 – 27 2

Hãy ƣớc lƣợng thời gian trung bình để gia công một chi tiết máy

với độ tin cậy 95%. Giả sử thời gian gia công chi tiết là ĐLNN tuân

theo quy luật phân phối chuẩn.

115

Bài 7.14. Để xác định giá trị trung bình của một loại hàng hóa

trên thị trƣờng, ngƣời ta điều tra ngẫu nhiên trên 100 cửa hàng trên

địa bàn thành phố và thu đƣợc các số liệu sau đây:

Giá (ngàn đồng) 83 85 87 89 91 93 95 97 99 101

Số cửa hàng 6 7 12 15 30 10 8 6 4 2

Với độ tin cậy 95% hãy ƣớc lƣợng khoảng giá trị trung bình

của loại hàng hóa đó.

Đ/s: (89,903; 91,537).

Bài 7.15. Trọng lƣợng của một loại sản phẩm là biến ngẫu

nhiên phân phối theo quy luật chuẩn với độ lệch chuẩn là 1 gam.

Cân thử 25 sản phẩm này ta thu đƣợc kết quả sau:

Trọng lƣợng (gam) 18 19 20 21

Số sản phẩm 3 5 15 2

Với độ tin cậy 97% hãy tìm khoảng ƣớc lƣợng trọng lƣợng

trung bình của loại sản phẩm nói trên.

Đ/s: (19,206; 20,074).

Bài 7.16. Để xác định kích thƣớc trung bình của chi tiết do một

nhà máy sản xuất ngƣời ta lấy ngẫu nhiên 200 chi tiết để đo kích

thƣớc và thu đƣợc bảng sau:

Kích thƣớc chi tiết (cm) Số chi tiết tƣơng ứng

54,795 – 54,805 6

54,805 – 54,815 14

54,815 – 54,825 33

54,825 – 54,835 47

54,835 – 54,845 45

54,845 – 54,855 33

54,855 – 54,865 15

54,865 – 54,875 7

Với độ tin cậy 95% hãy ƣớc lƣợng khoảng kích thƣớc trung

bình của chi tiết do máy đó sản xuất. Giả thiết rằng kích thƣớc chi

tiết là ĐLNN có phân phối chuẩn.

116

Đ/s: (54,833; 54,837).

Bài 7.17. Đo đƣờng kính của 100 trục máy do 1 nhà máy sản xuất

thì đƣợc bảng số liệu:

Đƣờng kính (cm) 9,75 9,8 9,85 9,9

Số trục máy 5 37 42 16

Hãy ƣớc lƣợng khoảng giá trị trung bình đƣờng kính của trục máy

với độ tin cậy 97%?

Đ/s: (9,826; 9,843).

Bài 7.18. Giả sử chiều dài của 1 loại sản phẩm là biến ngẫu nhiên

có phân phối chuẩn. Đo ngẫu nhiên 10 sản phẩm này thì đƣợc chiều

dài trung bình 10,02m và độ lệch chuẩn của mẫu chƣa hiệu chỉnh là

0,04m. Tìm khoảng ƣớc lƣợng trung bình chiều dài của loại sản phẩm

này với độ tin cậy 95%?

Đ/s: (9,99;10,050).

Bài 7.19. Năng suất lúa trong vùng A là biến ngẫu nhiên. Gặt ngẫu

nhiên 115 ha lúa của vùng này ta có số liệu:

Năng suất

(tạ/ha) 40–42 42–44 44–46 46–48 48–50 50–52

Diện tích (ha) 7 13 25 35 30 5

Hãy tìm khoảng ƣớc lƣợng trung bình cho năng suất lúa ở vùng A

với độ tin cậy 95%?

Đ/s: (45,983; 46,904).

Bài 7.20. Để nghiên cứu nhu cầu về loại hàng X ở phƣờng A

ngƣời ta tiến hành khảo sát 400 gia đình. Kết quả khảo sát là:

Nhu cầu

(kg/tháng) 0–1 1–2 2–3 3–4 4–5 5–6 6–7 7–8

Số gia đình 10 35 86 132 78 31 18 10

Hãy ƣớc lƣợng khoảng cho trung bình nhu cầu về loại hàng X của

các gia đình ở phƣờng A với độ tin cậy 95%?

Đ/s: (3,478; 3,762).

117

Bài 7.21. Một nhân viên chọn ngẫu nhiên một mẫu n = 12 hóa

đơn trong số các hóa đơn bán hàng của công ty và thu đƣợc giá trị

sau (đơn vị: ngàn đồng): 875, 1231, 453, 522, 2130, 1550, 309,

760, 498, 999, 1320, 1021. Hãy ƣớc lƣợng của giá trị trung bình

của các hóa đơn bán hàng và ƣớc lƣợng của phƣơng sai của các

giá trị của hóa đơn bán hàng.

Bài 7.22. Kiểm tra ngẫu nhiên 16 viên thuốc từ một lô thuốc

mới nhập về tìm đƣợc phƣơng sai mẫu điều chỉnh của thành phần

chính trong mỗi viên thuốc là s2 = 0,078 gam

2. Với độ tin cậy

95% hãy ƣớc lƣợng độ phân tán của thành phần chính trong mỗi

viên thuốc của cả lô thuốc đó. Biết trọng lƣợng là thành phần

chính trong mỗi viên thuốc có phân phối chuẩn.

Đ/s: (0,176; 0,431).

Bài 7.23. Cho biết trọng lƣợng X của một sản phẩm do nhà

máy A sản xuất có phân phối chuẩn 2N( , ) . Chọn ngẫu nhiên

20 sản phẩm đƣợc sản xuất từ nhà máy đó và cân 20 sản phẩm đó

ta có kết quả cho theo bảng sau:

Trọng lƣợng X (kg) 19,3 19,8 20 20,3

Số sản phẩm 5 6 8 1

Hãy tìm khoảng tin cậy của phƣơng sai D(X) = 2 với độ tin

cậy 95% trong hai trƣờng hợp

a. Cho biết kỳ vọng bằng 20.

b. Không biết kỳ vọng.

Đ/s: a. (0,081; 0,29); b. (0,055; 0,204).

118

Chƣơng 8

BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT

8.1. KHÁI NIỆM CHUNG

8.1.1. Giả thuyết thống kê

Giả thuyết về quy luật phân phối xác suất của ĐLNN, về tham số

đặc trƣng của ĐLNN hoặc về tính độc lập của các ĐLNN đƣợc gọi là

giả thuyết thống kê, ký hiệu là H0.

Một giả thuyết trái với giả thuyết H0 đƣợc gọi là đối thuyết, ký

hiệu là H1. H0 và H1 thành lập một cặp giả thuyết thống kê. Khi giả

thuyết H0 bị bác bỏ thì thừa nhận giả thuyết H1 và ngƣợc lại.

Ví dụ 1. 1) Khi nghiên cứu về chiều cao trung bình của một loại

cây A ở trong một khu rừng với chiều cao X của loại cây A đó có

phân phối chuẩn N(, 2), ta có thể đƣa ra giả thuyết sau:

Giả thuyết H0: "Chiều cao trung bình của loại cây A là = 20m".

Khi đó các đối thuyết của H0 có thể là:

Đối thuyết H1: "Chiều cao trung bình 20m".

Đối thuyết H1: "Chiều cao trung bình > 20m".

Đối thuyết H1: "Chiều cao trung bình < 20m".

2) Khi tìm hiểu tuổi thọ của một loại bóng đèn do nhà máy Điện

Quang sản xuất, ta có thể đƣa ra giả thuyết H0 nhƣ sau:

Giả thuyết H0: "Tuổi thọ của một loại bóng đèn đó có phân phối

chuẩn".

Đối thuyết H1: "Tuổi thọ của một loại bóng đèn đó không có phân

phối chuẩn".

Vì các giả thuyết có thể đúng hoặc có thể sai nên cần kiểm định,

tức tìm ra kết luận về thừa nhận hay không thừa nhận đƣợc của giả

thuyết đó. Việc kiểm định này gọi là kiểm định thống kê và nó phải

dựa vào thông tin thực nghiệm của mẫu để kết luận.

8.1.2. Tiêu chuẩn kiểm định

Để kiểm định cặp giả thuyết thống kê H0, H1, từ tổng thể ta chọn ra

mẫu ngẫu nhiên kích thƣớc n là W = (X1, X2, ..., Xn). Dựa vào mẫu

này ta xây dựng thống kê:

119

G = f(X1, X2, ..., Xn, 0).

trong đó 0 là tham số liên quan đến giả thuyết H0, sao cho nếu H0

đúng thì quy luật phân phối xác suất của G hoàn toàn xác định. Khi đó

thống kê G đƣợc gọi là tiêu chuẩn kiểm định.

8.1.3. Miền bác bỏ

Để xây dựng miền bác bỏ, ta sử dụng nguyên lý xác suất nhỏ: Nếu

một biến cố có xác suất khá bé ta có thể coi nó không xảy ra trong

một lần thực hiện phép thử.

Vì quy luật phân phối xác suất của G đã biết nên với một xác suất

khá bé cho trƣớc, ta có thể tìm đƣợc miền W tƣơng ứng sao cho

nếu giả thuyết H0 đúng thì xác suất để G nhận giá trị thuộc miền W

bằng :

0P(G W / H )

Vì khá bé, theo nguyên lý xác suất nhỏ ta có thể coi biến cố

(G W/H0) không xảy ra trong một lần thực hiện phép thử.

Giá trị đƣợc gọi là mức ý nghĩa của kiểm định và miền W đƣợc

gọi là miền bác bỏ giả thuyết H0 với mức ý nghĩa .

Ký hiệu W là miền bù của W, đƣợc gọi là miền chấp nhận giả

thuyết H0.

8.1.4. Giá trị quan sát của tiêu chuẩn kiểm định

Thực hiện một phép thử đối với mẫu ngẫu nhiên

W = (X1, X2, ..., Xn) thu đƣợc một mẫu cụ thể w = (x1, x2, ..., xn) và

qua đó ta tìm đƣợc giá trị thực nghiệm của thống kê G là

g = f(x1, x2, ..., xn, 0) giá trị này gọi là giá trị quan sát của tiêu chuẩn

kiểm định.

8.1.5. Quy tắc kiểm định giả thuyết thống kê

Sau khi tính đƣợc giá trị quan sát g của tiêu chuẩn kiểm định, ta so

sánh giá trị này với miền bác bỏ W và kết luận theo nguyên tắc sau:

i) Nếu g W thì ta có cơ sở để bác bỏ H0 và thừa nhận H1.

ii) Nếu g W thì ta chƣa có đủ cơ sở để kết luận H0 đúng mà chỉ

có thể nghĩa là qua mẫu cụ thể này chƣa khẳng định đƣợc H0 sai. Do

120

đó ta chỉ có thể nói: Qua mẫu cụ thể này chƣa có cơ sở để bác bỏ H0

(trên thực tế là vẫn thừa nhận H0).

8.1.6. Các sai lầm mắc phải khi thực hiện một bài toán kiểm định

Trong kiểm định giả thuyết, ta không thể biết đƣợc chắc chắn giả

thuyết H0 đúng hay sai, vì mẫu chỉ là một phần của tổng thể. Do vậy,

ta có thể mắc phải một trong hai loại sai lầm sau đây:

Sai lầm loại 1: Trên thực tế giả thuyết H0 đúng nhƣng qua kiểm

định, ta lại kết luận giả thuyết H0 sai. Ngƣời ta ký hiệu khả năng mắc

sai lầm loại này là , và đƣợc gọi là mức ý nghĩa.

P(G W/H0 đúng) =

Sai lầm loại 2: Trên thực tế giả thuyết H0 sai nhƣng qua kiểm

định, ta lại kết luận giả thuyết H0 đúng. Ngƣời ta ký hiệu khả năng

mắc sai lầm loại này là .

P(G W /H0 đúng) =

Ta mong muốn chọn W sao cho cả hai khả năng mắc sai lầm đã

nêu trên là thấp nhất. Nhƣng ta biết rằng khi giảm sai lầm loại 1 thì

khả năng sai lầm loại 2 tăng lên và ngƣợc lại. Khi kiểm định giả thiết,

ngƣời ta có thể ấn định trƣớc mức ý nghĩa rồi tìm miền W sao cho

sai lầm loại 1 không vƣợt quá và sai lầm loại 2 là cực tiểu.

8.1.7. Quy tắc chung khi kiểm định giả thuyết thống kê

Bước 1. Thiết lập giả thuyết H0 và đối thuyết H1

Ta có 3 loại bài toán sau:

Bài toán 1 Bài toán 2 Bài toán 3

Giả thiết H: = 0

Đối thiết K: 0


Đối thiết K: > 0


Đối thiết K: < 0

Với là tham số chƣa biết nào đó của ĐLNN X, 0 là một giá trị

cụ thể nào đó đƣợc biết trƣớc.

Bước 2. Lập mẫu ngẫu nhiên của X là (X1, X2, ..., Xn); chọn tiêu

chuẩn kiểm định G = f(X1, X2, ..., Xn, 0) và xác định quy luật phân

phối của nó với điều kiện giả thuyết H0 đúng.

Bước 3. Với mức ý nghĩa , xác định miền bác bỏ giả thuyết H0 là W.

Bước 4. Với mẫu cụ thể (x1, x2, ..., xn), ta có giá trị của tiêu chuẩn

kiểm định g = f(x1, x2, ..., xn, 0).

121

Bước 5. Nếu g W thì ta có cơ sở để bác bỏ H0 và thừa nhận H1

với mức ý nghĩa .

Nếu g W thì ta chƣa có đủ cơ sở để bác bỏ kết luận H0, tạm

thời chấp nhận H0 đúng với mức ý nghĩa .

8.2. KIỂM ĐỊNH THAM SỐ

8.2.1. Kiểm định về kỳ vọng của ĐLNN có phân phối chuẩn

8.2.1.1. Trường hợp phương sai 2 đã biết

Giả sử ĐLNN X trong tổng thể có phân phối chuẩn N(, 2) với

phƣơng sai 2 đã biết nhƣng chƣa biết kỳ vọng . Nếu có cơ sở để giả

thiết rằng giá trị của nó bằng 0, ta đƣa ra giả thuyết thống kê

H0: = 0.

Từ mẫu ngẫu nhiên W = (X1, X2, ..., Xn) ta chọn thống kê:

0(X )G n

Nếu giả thuyết H0 đúng, thì G N(0,1) .

Với mức ý nghĩa thì tùy thuộc vào dạng của đối thuyết H1, ta xét

các trƣờng hợp sau:

a) Bài toán 1. Giả thuyết H0: = 0

Đối thuyết H1: 0

Vì G N(0,1) nên với mức ý nghĩa [0, 1], ta có thể tìm đƣợc

giá trị phân vị

2

Usao cho:

2

P( G U ) .

Mặt khác theo nguyên lý xác suất nhỏ, nếu H0 đúng, ta tìm đƣợc

W sao cho: 0P(G W / H ) .

Do đó:

00

2 2

(X )P(G W / H ) P( G U ) P n U

.

Hay miền bác bỏ của H0 là 0

2

(X )W n U

.

Vậy với mẫu cụ thể w = (x1, x2, ..., xn) ta thực hiện bài toán kiểm

định theo các bƣớc sau:

122

+ Tính x và 0μ n

g = σ

x .

+ Với mức ý nghĩa , suy ra α

2

U .

+ So sánh g và α

2

U :

Nếu α

2

g > U ta bác bỏ H0, chấp nhận H1.

Nếu α

2

g U ta chấp nhận H0, bác bỏ H1.

Ví dụ 1. Giám đốc một xí nghiệp cho biết lƣơng trung bình của

một công nhân thuộc xí nghiệp hiện nay là 6 triệu/tháng. Chọn ngẫu

nhiên 36 công nhân thấy lƣơng trung bình là 5,2 triệu/đồng. Lời báo

cáo của giám đốc có tin cậy đƣợc không với mức ý nghĩa bằng

α = 5%, biết rằng tiền lƣơng của công nhân là ĐLNN phân phối chuẩn

với độ lệch chuẩn 0,4.

Giải: Gọi X là tiền lƣơng của công nhân, là tiền lƣơng trung

bình thực sự của công nhân hiện nay. X là ĐLNN có phân phối chuẩn.

D(X) = (0,4)2 đã biết.

Theo yêu cầu của đề bài, ta có bài toán kiểm định giả thuyết:

Giả thuyết H0: μ = 6

Đối thuyết H1: μ 6

Với n = 36; x = 5,2; = 0,4

0( μ ) n (5,2 6) 36g 12.

σ 0,4

x

Với α = 5%, tra bảng hàm La-pla-ce ta đƣợc: α

2

U = 0,025U 1,96.

Đối chiếu g và α

2

U , ta thấy α

2

g > U nên bác bỏ H0, chấp nhận

H1; nghĩa là với mức ý nghĩa 5% thì lời nói của giám đốc là sai.

b) Bài toán 2. Giả thuyết H0: = 0

Đối thuyết H1: > 0

123

Tƣơng tự nhƣ trên với mức ý nghĩa [0, 1], ta có thể tìm đƣợc

giá trị phân vị U sao cho:

00

(X )P(G W / H ) P(G U ) P n U

.

Hay miền bác bỏ của H0 là 0(X )W n U

.

Với mẫu cụ thể w = (x1, x2, ..., xn) ta thực hiện bài toán kiểm định

theo các bƣớc sau:

+ Tính x và 0μ n

g = σ

x .

+ Với mức ý nghĩa , suy ra U .

+ So sánh g và U

Nếu g > U ta bác bỏ H0, chấp nhận H1.

Nếu g U ta chấp nhận H0, bác bỏ H1.

Ví dụ 2. Một vƣờn cây con phi lao có chiều cao trung bình chƣa

xác định. Theo hợp đồng đã ký giữa ngƣời sản xuất cây con và lâm

trƣờng trồng cây thì chỉ khi nào chiều cao của cây đạt trên 1m mới

đem ra trồng để đảm bảo sống cao.

Ngƣời ta điều tra ngẫu nhiên 50 cây trong vƣờn và tính đƣợc chiều

cao trung bình x = 1,1 m. Hỏi vƣờn cây phi lao nói trên đã đƣa ra

trồng đƣợc chƣa? Cho biết chiều cao của cây phi lao là ĐLNN có

phân phối chuẩn và sự biến động về chiều cao của cây phi lao trong

giai đoạn vƣờn ƣơm ở trong những điều kiện tƣơng tự là = 0,1 m;

= 0,05.

Giải: Gọi X là chiều cao của cây con phi lao trong vƣờn ƣơm.

là chiều cao trung bình của cây con phi lao trong vƣờn ƣơm.

X là ĐLNN có phân phối chuẩn; kích thƣớc mẫu n = 50 > 30.

Phƣơng sai D(X) = 2 = (0,1)

2 đã biết.

Theo yêu cầu của đề bài ta có bài toán:

Giả thuyết H0: = 1

124


Ta có: n = 50; = 0,05; x = 1,1; 0 = 1.

0x μ n 1,1 1 50

g = 7,071σ 0,1

.

Với α = 0,05 tra bảng hàm La-pla-ce ta đƣợc: 0,05U 1,64

Ta có 0,05g > U nên bác bỏ H, chấp nhận K; nghĩa là có thể đƣa

cây phi lao trên ra trồng đƣợc.

c) Bài toán 3. Giả thuyết H0: = 0

Đối thuyết H1: < 0

Tƣơng tự nhƣ trên với mức ý nghĩa [0, 1], ta có thể tìm đƣợc

giá trị phân vị U sao cho:

00

(X )P(G W / H ) P(G U ) P n U

.

Hay miền bác bỏ của H0 là 0(X )W n U

.



+ Tính x và 0μ n

g = σ

x .

+ Với mức ý nghĩa , suy ra α U .

+ So sánh g và α U .

Nếu g > U ta bác bỏ H0, chấp nhận H1.

Nếu g U ta chấp nhận H0, bác bỏ H1.

Ví dụ 3. Trọng lƣợng X gói mì ăn liền tuân theo qui luật chuẩn

N(, 25). Từ mẫu 25 gói mì ăn liền ta tìm đƣợc trung bình mẫu

x 82g . Với mức ý nghĩa = 0,05 hãy kiểm định giả thuyết:

Giả thuyết H0: = 85


125

Giải. Ta có 0μ n (82 85) 25

g = 3σ 5

x ; 0,05U 1,64 .

Vì g > U , nên ta bác bỏ H0.

8.2.1.2. Trường hợp phương sai 2 chưa biết

Giả sử ĐLNN X trong tổng thể có phân phối chuẩn N(, 2) với

phƣơng sai 2 và kỳ vọng chƣa biết. Nếu có cơ sở để giả thiết rằng

giá trị của nó bằng 0, ta đƣa ra giả thuyết thống kê H0: = 0.

Từ mẫu ngẫu nhiên W = (X1, X2, ..., Xn) ta chọn thống kê:

0(X )G n 1

S

Nếu giả thuyết H0 đúng, thì G T(n 1) .

Với mức ý nghĩa thì tùy thuộc vào dạng của đối thuyết H1, ta xét

các trƣờng hợp sau:

a) Bài toán 1. Giả thuyết H0: = 0


Vì G T(n 1) nên với mức ý nghĩa [0, 1], ta có thể tìm đƣợc

giá trị phân vị 2

t (n 1) sao cho:2

P( G t (n 1)) .

Mặt khác theo nguyên lý xác suất nhỏ, nếu H0 đúng, ta tìm đƣợc

W sao cho: 0P(G W / H ) .

Do đó: 0

2

P(G W / H ) P( G t (n 1))

0

2

(X )P n 1 t (n 1)

S

.

Hay miền bác bỏ của H0 là 0

2

(X )W n 1 t (n 1)

S

.



+ Tính x và 0x μ n 1

g = s

.

126

+ Tra bảng phân phối Student tìm α

2

t (n 1) .

+ So sánh g và α

2

t (n 1) .

Nếu α

2

g > t (n 1) ta bác bỏ H0, chấp nhận H1.

Nếu α

2

g t (n 1) ta chấp nhận H0, bác bỏ H1.

Ví dụ 4. Năng suất lúa là một ĐLNN có phân phối chuẩn N(, 2).

Điều tra năng suất giống lúa trên ở 200 ha ta thu đƣợc bảng số liệu

sau:

Năng suất (tạ/ha) 46 48 49 50 51 53 54 58

Diện tích (ha) 17 18 35 45 42 23 10 10

Với mức ý nghĩa 5%, hãy kiểm tra ý kiến sau đúng hay sai: năng

suất lúa trung bình của giống lúa đó là 52 tạ/ha.

Giải. Gọi X là năng suất của giống lúa, là năng suất lúa trung

bình của giống lúa.

X là ĐLNN có phân phối chuẩn. D(X) = 2 chƣa biết. n = 200,

0 = 52 tạ.

Ta có bài toán: Giả thuyết H0: = 52


Từ mẫu ta tính đƣợc x 50,16 ; 2s 37,114 s 6,092 .

Ta có 0x μ n 1 50,16 52 199

g = 4,261s 6,092

.

Với mức ý nghĩa = 5% 0,025 0,025t (199) = U 1,96 .

Vì α

2

g > t (n 1) nên ta bác bỏ H0, nghĩa là ý kiến đó sai.

b) Bài toán 2. Giả thuyết H0: = 0


Tƣơng tự mục 8.2.1.2 a) từ thống kê 0(X )G n 1

S

có phân

phối T(n–1), ta có miền bác bỏ của H0 nhƣ sau:

127

0(X )W n 1 t (n 1)

S




g = s

.

+ Tra bảng phân phối Student tìm αt (n 1) .

+ So sánh g và αt (n 1) :

Nếu αg > t (n 1) ta bác bỏ H0, chấp nhận H1.

Nếu αg t (n 1) ta chấp nhận H0, bác bỏ H1.

Ví dụ 5. Trong điều kiện chăn nuôi bình thƣờng, lƣợng sữa trung

bình của một con bò 14kg/ngày. Cải tiến chế độ chăn nuôi đã cho

lƣợng sữa nhiều lên. Để có thông tin ngƣời ta đã điều tra ngẫu nhiên

40 con bò và tính đƣợc lƣợng sữa trung bình/ngày của 1 con bò x là

18kg và độ lệch tiêu chuẩn s = 2,5 kg. Với mức ý nghĩa = 0,1 thử

xem lƣợng sữa trung bình của bò có tăng thực sự hay không? Cho biết

lƣợng sữa/ngày của một con bò là ĐLNN có phân phối chuẩn.

Giải: Gọi X là lƣợng sữa 1 ngày của một con bò. X là ĐLNN có

phân phối chuẩn. D(X) = 2 chƣa biết.

Theo yêu cầu của bài toán, ta có bài toán kiểm định giả thuyết:

Giả thuyết H0: µ = 14

Đối thuyết H1: µ > 14

Ta có: n = 40; s = 2,5; x = 18.

0X μ n 1 (18 14) 39g 9,992.

s 2,5

Vì = 0,1 tra bảng phân phối Student ta đƣợc 0,1 0,1t (39) = U 1,27.

Vì U > 0,1 0,1t (39) = U 1,27 nên bác bỏ H, chấp nhận K; lƣợng sữa

đã tăng lên thực sự.

c) Bài toán 3. Giả thuyết H0: = 0


128

Tƣơng tự mục 8.2.1.2 a) từ thống kê 0(X )G n 1

S

có

phân phối T(n–1), ta có miền bác bỏ của H0 nhƣ sau:

0(X )W n 1 t (n 1)

S

Vậy với mẫu cụ thể w = (x1, x2, ..., xn) ta thực hiện bài toán

kiểm định theo các bƣớc sau:


g = s

.

+ Tra bảng phân phối Student tìm αt (n 1) .

+ So sánh – g và αt (n 1) :

Nếu αg > t (n 1) ta bác bỏ H0, chấp nhận H1.

Nếu αg t (n 1) ta chấp nhận H0, bác bỏ H1.

Ví dụ 6. Trọng lƣợng đóng bao của các bao gạo trong kho là

ĐLNN có phân phối chuẩn với trọng lƣợng trung bình theo quy định

là 50 kg.

Nghi ngờ gạo bị đóng thiếu, ngƣời ta đem cân ngẫu nhiên 25 bao

và thu đƣợc các số liệu nhƣ sau:

Trọng lƣợng (kg) 48-48,5 48,5-49 49-49,5 49,5-50 50-50,5

Số bao 2 5 10 6 2

Với mức ý nghĩa α = 0,01 hãy kết luận về điều nghi ngờ nói trên.

Giải. Gọi X là trọng lƣợng đóng bao của bao gạo. X là ĐLNN có

phân phối chuẩn; D(X) chƣa biết.

Trọng lƣợng đóng bao trung bình theo quy định là tham số µ0 = 50 (kg).

Đây là bài toán kiểm định tham số µ của phân phối chuẩn N(µ, 2)

khi chƣa biết 2. Theo yêu cầu của bài toán, ta có bài toán kiểm định

giả thuyết:

Giả thiết H0: µ = 50

Đối thiết H1: µ < 50

Từ bảng ta tính đƣợc: x = 49,27; s = 0,519.

129

0x μ n 1 (49,27 50) 24

g = 6,891.s 0,519

Tra bảng phân phối Student ta tìm đƣợc α 0,01t (n 1) t (24) 2,49.

Đối chiếu ta thấy 0,01 g = 6,891 t (24) 2,49 nên bác bỏ H,

chấp nhận K; tức là qua mẫu cụ thể này thừa nhận gạo bị đóng thiếu

với mức ý nghĩa 0,01.

Chú ý. Nếu mẫu ngẫu nhiên có phân phối bất kỳ và kích thước

mẫu n 30 thì các trường hợp 8.2.1.1. và 8.2.1.2 vẫn áp dụng được.

8.2.2. Kiểm định về phƣơng sai của ĐLNN có phân phối chuẩn

Giả sử nghiên cứu dấu hiệu X trong tổng thể, X là một ĐLNN có

phân phối chuẩn N(, 2) với phƣơng sai

2 chƣa biết, song có cơ sở

để giả thiết rằng giá trị của nó là 2

0 . Ta đƣa ra giả thuyết thống kê H0:

2 = 2

0 .

8.2.2.1.Trường hợp kỳ vọng E(X) = đã biết

Để kiểm định giả thuyết trên từ mẫu ta rút ra mẫu ngẫu nhiên có

kích thƣớc n là W = (X1, X2, ..., Xn) và chọn tiêu chuẩn kiểm định là

thống kê:

22

2

2 2

nS (n 1)SG

Nếu giả thuyết H0 đúng thì thống kê

22 2

2

0

nSG (n)

, do đó

với mức ý nghĩa cho trƣớc và tùy thuộc vào dạng của đối thuyết H1

ta xây dựng đƣợc miền bác bỏ W của H0 theo các trƣờng hợp sau

đây:

Trường hợp 1. Giả thuyết H0: 2 = 2

0

Đối thuyết H1: 2 2

0

Miền bác bỏ của H0 là 2 2

2 2

2 21

0 02 2

nS nSW (n) (n)

.


0

Đối thuyết H1: 2 > 2

0

130

Miền bác bỏ của H0 là 2

2

2

0

nSW G (n)

.


0

Đối thuyết H1: 2 < 2

0


2

12

0

nSW G (n)

.



+ Tính s và

2

2

0

n.sg

.

+ Tra bảng phân phối khi bình phƣơng tìm α (n) hoặc

α

2

(n) .

+ Nếu g W thì ta bác bỏ H0, chấp nhận H1.

Nếu g W thì ta chấp nhận H0, bác bỏ H1.

Ví dụ 7. Một máy đóng gói tự động đƣợc coi là hoạt động bình

thƣờng nếu phƣơng sai về trọng lƣợng của các gói hàng do máy đóng

không vƣợt quá 100 (gam)2. Cân ngẫu nhiên 15 gói hàng do máy đóng

và tính đƣợc phƣơng sai mẫu điều chỉnh là 180 (gam)2. Với mức ý

nghĩa 5% có thể nói máy vẫn hoạt động bình thƣờng hay không? Biết

trọng lƣợng của các gói hàng do máy đóng là ĐLNN phân phối chuẩn

N(5600, 2).

Giải: Gọi X là trọng lƣợng của các gói hàng do máy đóng. X là

ĐLNN có phân phối chuẩn; E(X) = = 5600; = 0,05; n = 15.

Ta có bài toán kiểm định:

Giả thuyết H0: 2 = 100


Theo giả thiết bài toán, ta có:

2 22 n 1 14

s 180 s s .180 168.n 15

131

2

2

0

n.s 15.168g 15,5.

100

Tra bảng phân phối khi bình phƣơng ta đƣợc

1 α 0,95(n) = (15) = 7,261.

Vì

2

1 0,952

0

n.sg 15,5 (n) (15) 7,261

nên bác bỏ H1,

nghĩa là máy hoạt động không bình thƣờng.

8.2.2.2.Trường hợp kỳ vọng E(X) = chưa biết

Để kiểm định giả thuyết trên từ mẫu ta rút ra mẫu ngẫu nhiên có

kích thƣớc n là W = (X1, X2, ..., Xn) và chọn tiêu chuẩn kiểm định là

thống kê: 2

22

2 2

nS (n 1)SG

Nếu giả thuyết H0 đúng thì thống kê

22 2

2

0

nSG (n 1)

, do

đó với mức ý nghĩa cho trƣớc và tùy thuộc vào dạng của đối thuyết

H1 ta xây dựng đƣợc miền bác bỏ W của H0 theo các trƣờng hợp sau

đây:


0

Đối thuyết H1: 2 2

0

Miền bác bỏ của H0 là:

2 22 2

2 21

0 02 2

nS nSW (n 1) (n 1)

.


0

Đối thuyết H1: 2 > 2

0


2

2

0

nSW G (n 1)

.


0


0

132


2

12

0

nSW G (n 1)

.



+ Tính s và 2

2

0

nSg

.

+ Tra bảng phân phối khi bình phƣơng tìm α (n-1) hoặc

α

2

(n-1) .

+ Nếu g W thì ta bác bỏ H0, chấp nhận H1.

Nếu g W thì ta chấp nhận H0, bác bỏ H1.

Ví dụ 8. Một máy sản xuất các tấm chất dẻo đƣợc thƣờng xuyên

theo dõi về độ dày của sản phẩm. Biết độ dày X của các tấm chất dẻo

là ĐLNN có phân phối chuẩn. Nếu độ lệch chuẩn vƣợt quá 0,3 mm thì

chất lƣợng sản phẩm không đƣợc đảm bảo về kỹ thuật. Ngƣời ta chọn

ngẫu nhiên 10 tấm chất dẻo rồi đo độ dày của mỗi tấm và đƣợc kết

quả sau (đơn vị đo mm): 22; 22,6; 23,2; 22,7; 22,5; 22,8; 22,5; 22,8;

22,9; 23. Từ yêu cầu của thực tế với mức ý nghĩa 5% hãy lập cặp giả

thuyết và đối thuyết thích hợp đánh giá tình trạng làm việc của máy

sản xuất các tấm chất dẻo trên.

Giải. Ta có E(X) = chƣa biết.

Độ lệch chuẩn ở mức cho phép không vƣợt quá 0,3 mm tƣơng ứng

với phƣơng sai 2 không vƣợt quá 0,09 mm

2. Ta có bài toán kiểm định

giả thuyết:

Giả thuyết H0: 2 = 0,09

Đối thuyết H1: 2 > 0,09

Với mẫu đã cho ta có: x 22,7 ; s2 = 0,098 s = 0,313.

Ta có 2

2

0

nS 10.0,098g 10,889.

0,09

Với mức ý nghĩa = 0,05 ta có: 2 2

0,05(n 1) (9) 16,919 .

Miền bác bỏ của H0 là W 16,919; .

133

Vì g = 10,889 W nên chấp nhận H0, nghĩa là máy sản xuất tấm

dẻo vẫn hoạt động bình thƣờng.

8.2.3. Kiểm định về tỷ lệ xác suất

Giả sử trong dãy n phép thử Bernoulli biến cố A xuất hiện m lần.

Gọi p là xác suất để biến cố A xuất hiện trong mỗi phép thử (p chƣa

biết). Từ một cơ sở nào đó ngƣời ta tìm đƣợc p = p0, nhƣng nghi ngờ

về điều này. Với mức ý nghĩa α cần kiểm định giả thuyết H0: p = p0.

Với mức ý nghĩa , ta xây dựng quy tắc kiểm định của cặp giả

thuyết, đối thuyết sau:

Giả thuyết H0: p = p0

Đối thuyết H1: p p0

Xét thống kê m np

Gnp(1 p)

, thống kê này theo định lý giới hạn

trung tâm có phân phối xấp xỉ chuẩn tắc N(0,1). Nếu H0 đúng thì

0

0 0

m npG N(0,1)

np (1 p )

.

Tƣơng tự nhƣ bài toán kiểm định kỳ vọng của ĐLNN có phân phối

chuẩn, ta có quy tắc kiểm định bài toán trên là:

+ Nếu 0

20 0

m npG U

np (1 p )

thì ta bác bỏ H0.

+ Nếu 0

20 0

m npG U

np (1 p )

thì ta chấp nhận H0.

Ví dụ 9. Gieo 300 hạt giống đậu tƣơng. Ta thấy có 261 hạt nảy

mầm. Ngƣời ta nói rằng tỉ lệ nảy mầm của hạt đậu tƣơng là p = 0,9.

Điều đó có đúng hay không? Tại sao? Cho mức ý nghĩa α = 5%.

Giải. Ta xem việc gieo 300 hạt giống đậu tƣơng nhƣ là tiến hành

300 phép thử Bernoulli. Xác suất nảy mầm của hạt đậu tƣơng là p.

Bài toán kiểm định giả thuyết:

Giả thuyết H0: p = 0,9

Đối thuyết H1: p 0,9.

Ở đây n = 300, p0 = 0,9, m = 261 nên

134

0

0 0

m np 261 300.0,9g = 1,73.

np (1 p ) 300.0,9.(1 0,9)

Tra bảng hàm La–pla–ce, tìm 0,025 0,025 U 0,475 U 1,96 .

Vì 2

g < U nên ta chấp nhận H, bác bỏ K; nghĩa là tỉ lệ nảy mầm

của hạt đậu tƣơng p = 0,9 là đúng.

Chú ý 1. Với cặp giả thuyết, đối thuyết

Giả thiết H: p = p0

Đối thiết K: p > p0

Ta có quy tắc kiểm định bài toán trên là:

+ Nếu 0

0 0

m npU

np (1 p )


+ Nếu 0

0 0

m npU

np (1 p )


Chú ý 2. Với cặp giả thuyết, đối thuyết

Giả thuyết H0: p = p0

Đối thuyết H1: p < p0

Ta có quy tắc kiểm định bài toán trên là:

+ Nếu 0

0 0

m npU

np (1 p )


+ Nếu 0

0 0

m npU

np (1 p )


Ví dụ 10. Một kho hạt giống có tỉ lệ nảy mầm xác định p0 = 0,9.

Ngẫu nhiên có một thiết bị bị hỏng làm thay đổi điều kiện bên trong

của kho. Hỏi tỉ lệ nảy mầm của kho hạt giống có còn giữ nguyên hay

không với mức ý nghĩa = 0,05? Để có thông tin về tỷ lệ nảy mầm

mới của kho ta làm thí nghiệm 200 hạt thấy có 140 hạt nảy mầm.

Giải: Bài toán kiểm định giả thuyết

Giả thuyết H0: p = 0,9

Đối thuyết H1: p < 0,9.

135

Ta có:

0

0 0

m np 140 200.0,9g = 9,428 U 1,64

np (1 p ) 200.0,9(1 0,9)

.

Nên ta bác bỏ H0, chấp nhận H1; tức tỷ lệ nảy mầm của kho đã bị

giảm đi.

136


Bài 8.1. Trong nhà máy bánh kẹo A, một máy tự động sản xuất ra

các thanh chocolate với trọng lƣợng quy định là 250gram và độ lệch

chuẩn là 5gram. Trong một ngày, bộ phận kiểm tra kỹ thuật chọn một

mẫu ngẫu nhiên gồm 32 thanh chocolate và tính đƣợc trọng lƣợng

trung bình của chúng là 248gram. Hãy kiểm định giả thuyết H: “Trọng

lƣợng các thanh chocolate do máy tự động sản xuất ra đúng quy

định”, với mức ý nghĩa α = 0,05?

Đ/s: Bác bỏ giả thuyết “Trọng lƣợng các thanh chocolate do máy

tự động sản xuất ra đúng quy định”.

Bài 8.2. Trọng lƣợng sản phẩm một nhà máy sản xuất (X) là một

ĐLNN phân phối theo quy luật chuẩn với độ lệch chuẩn 2 kg và trọng

lƣợng trung bình 20 kg. Nghi ngờ máy hoạt động không bình thƣờng

làm thay đổi trọng lƣợng trung bình của sản phẩm, ngƣời ta cân thử

100 sản phẩm và thu đƣợc kết quả sau:

Trọng lƣợng sản phẩm (kg) 19 20 21 22 23

Số sản phẩm tƣơng ứng 10 60 20 5 5

Với mức ý nghĩa hãy kết luận về điều nghi ngờ trên với mức ý

nghĩa 97%.

Bài 8.3. Trọng lƣợng quy định một loại chi tiết là 250 (gam). Giả

sử trọng lƣợng tuân theo quy luật phân phối chuẩn N(µ, 25). Ngƣời ta

lấy mẫu gồm 16 chi tiết và tính đƣợc trọng lƣợng trung bình là 244

gam. Hãy kiểm định giả thiết H: µ = 250 với đối thiết K: µ < 250, với

mức ý nghĩa 5%.

Bài 8.4. Trọng lƣợng một loại gà ở trại chăn nuôi A khi xuất

chuồng là 3,62 kg/con. Biết trọng lƣợng gà là biến ngẫu nhiên có

phân phối chuẩn N(µ; 0,01). Sau một thời gian ngƣời ta cho gà ăn

thức ăn mới và cân thử 15 con khi xuất chuồng thấy trọng lƣợng trung

bình của gà là 3,69 kg/con. Với mức ý nghĩa 2%, hãy cho ý kiến về

kết luận: "Loại thức ăn mới này tốt hơn so với loại thức ăn trƣớc đây",

đúng hay sai?

137

Bài 8.5. Trọng lƣợng trung bình khi xuất chuồng một trại chăn

nuôi gà công nghiệp năm trƣớc là 3,3 kg/con. Năm nay ngƣời ta sử

dụng loại thức ăn mới. Cân thử 15 con xuất chuồng, ta đƣợc số

liệu sau (kg): 3,25; 2,5; 4,0; 3,8; 3,9; 4,02; 3,6; 3,8; 3,2; 3,82; 3,4;

3,75; 4,0; 3,5; 3,75. Giả sử trọng lƣợng của gà là ĐLNN phân phối

theo quy luật chuẩn. Với mức ý nghĩa 5% hãy kết luận về tác dụng

của loại thức ăn này có thực sự làm tăng trọng lƣợng trung bình

của gà lên hay không.

Bài 8.6. Chiều cao cây giống X (m) trong một vƣờm ƣơm là

ĐLNN có phân phối chuẩn. Ngƣời ta đo ngẫu nhiên 25 cây giống

này và có bảng số liệu:

X (m) 0,8 0,9 1,0 1,1 1,2 1,3

Số cây 1 2 9 7 4 2

Theo quy định của vƣờn ƣơm khi nào cây cao hơn 1 m thì đem

ra trồng. Với mức ý nghĩa 5%, hỏi cây của vƣờn ƣơm đã đem ra

trồng đƣợc chƣa?

Bài 8.7. Trong điều kiện nuôi bình thƣờng, lƣợng sữa trung bình

của một con bò là 14 kg/ngày. Nghi ngờ điều kiện chăn nuôi bò kém

đi làm cho lƣợng sữa giảm xuống. Ngƣời ta điều tra ngẫu nhiên 25

con bò và tính đƣợc lƣợng sữa trung bình của mỗi con trong một ngày

là 12,5 kg và độ lệch chuẩn mẫu điều chỉnh 2,5 kg. Với mức ý nghĩa

0,05 hãy kết luận về điều nghi ngờ nói trên. Giả thiết lƣợng sữa bò là

đại lƣợng ngẫu nhiên có phân phối chuẩn.

Đ/s: Lƣợng sữa bò có xu hƣớng giảm.

Bài 8.8. Năng suất trung bình của một giống lúa là 47 tạ/ha. Sau

một thời gian canh tác, ngƣời ta nghi ngờ giống lúa đó bị thoái hóa,

năng suất giảm. Dựa vào mẫu kích thƣớc n = 25, năng suất trung bình

mẫu là 45,5 tạ/ha và độ lệch mẫu điều chỉnh 4 tạ/ha. Hãy kết luận về

điều nghi ngờ nói trên với mức ý nghĩa 3%. Cho biết năng suất của

giống lúa đó là ĐLNN tuân theo quy luật chuẩn.

Đ/s: Giống lúa đó bị thoái hóa.

Bài 8.9. Mức hao phí xăng (X) cho một loại xe ô tô chạy trên đoạn

đƣờng AB là ĐLNN phân phối chuẩn có kỳ vọng toán là 50 lít. Do

138

đƣờng đƣợc tu sửa lại, ngƣời ta cho rằng mức hao phí xăng trung bình

đã giảm xuống. Quan sát 30 chuyến xe chạy trên đƣờng AB ta thu

đƣợc bảng số liệu sau:

Mức xăng

hao phí (lít) 48,5-49,0 49,0-49,5 49,5-50,0 50,0-50,5 50,5-51,0

Số chuyến xe 5 10 10 3 2

Với mức ý nghĩa 5% hãy kết luận về ý kiến nêu trên.

Đ/s: Có cơ sở để kết luận mức xăng hao phí trung bình giảm

xuống.

Bài 8.10. Để kiểm tra độ chính xác của một máy ngƣời ta đo ngẫu

nhiên kích thƣớc của 15 chi tiết máy do máy đó sản xuất và tính đƣợc

s2 = 14,6. Với mức ý nghĩa 1% hãy kết luận máy móc có hoạt động

bình thƣờng không, biết rằng kích thƣớc chi tiết là ĐLNN phân phối

chuẩn có dung sai theo thiết kế là 2 = 12.

Đ/s: Máy móc vẫn hoạt động bình thƣờng.

Bài 8.11. Từ một mẫu kích thƣớc n = 15 rút ra từ tổng thể phân

phối chuẩn ngƣời ta tìm đƣợc s2 = 144. Với mức ý nghĩa 1% hãy kiểm

định cặp giả thuyết: H0: 2 = 138; H1:

2 > 138.

Bài 8.12. Trọng lƣợng của con gà lúc mới nở là ĐLNN có phân

phối chuẩn. Nghi ngờ độ đồng đều trọng lƣợng gà con bị giảm sút

ngƣời ta cân thử 12 con và tìm đƣợc s2 = 11,41 gram

2. Với mức ý

nghĩa 5% hãy kết luận về điều nghi ngờ trên, biết rằng bình thƣờng độ

phân tán của trọng lƣợng gà con là 2 = 10 gram

2.

Đ/s: Chƣa có cơ sở để nghi ngờ rằng độ đồng đều về trọng lƣợng

gà con giảm sút.

Bài 8.13. Lô hàng đủ tiêu chuẩn xuất khẩu nếu tỷ lệ phế phẩm

không vƣợt quá 3%. Kiểm tra ngẫu nhiên 400 sản phẩm của lô hàng

này thấy có 14 phế phẩm. Với mức ý nghĩa 5% có cho phép lô hàng

xuất khẩu đƣợc không?

Đ/s: Lô hàng đủ tiêu chuẩn xuất khẩu.

Bài 8.14. Tỷ lệ bệnh nhân khỏi bệnh T khi điều trị bằng thuốc A là

85%. Thí nghiệm dùng loại thuốc B để chữa bệnh thì trong số 900

ngƣời mắc bệnh T có 810 ngƣời đƣợc chữa khỏi bệnh. Nhƣ vậy có thể

139

kết luận thuốc B hiệu quả hơn thuốc A hay không? Yêu cầu kết luận ở

mức ý nghĩa 5%.

Đ/s: Có thể kết luận thuốc B hiệu quả hơn thuốc A.

Bài 8.15. Tỷ lệ phế phẩm của một nhà máy trƣớc đây là 5%. Năm

nay nhà máy áp dụng một biện pháp kỹ thuật mới. Để nghiên cứu tác

dụng của biện pháp kỹ thuật mới có làm giảm tỷ lệ phế phẩm hay

không ngƣời ta lấy một mẫu gồm 800 sản phẩm để kiểm tra và thấy có

24 phế phẩm trong mẫu này. Với mức ý nghĩa 5% hãy kết luận xem

biện pháp kỹ thuật mới này có thực sự làm giảm tỷ lệ phế phẩm của

toàn nhà máy không?

Đ/s: Biện pháp kỹ thuật mới thực sự có tác dụng làm giảm tỷ lệ

phế phẩm của nhà máy.

Bài 8.16. Tỷ lệ phế phẩm do một nhà máy tự động sản xuất là

5%. Kiểm tra ngẫu nhiên 300 sản phẩm thấy có 24 sản phẩm là

phế phẩm. Từ đó ý kiến cho rằng tỷ lệ phế phẩm do máy đó sản

xuất có chiều hƣớng tăng lên. Hãy kết luận về ý kiến trên với mức

ý nghĩa là 5%.

Bài 8.17. Nếu áp dụng phƣơng pháp công nghệ thứ nhất thì tỷ

lệ phế phẩm là 6%, còn nếu áp dụng phƣơng pháp công nghệ thứ

hai thì trong 100 sản phẩm có 5 phế phẩm. Vì vậy có thể kết luận

áp dụng phƣơng pháp công nghệ thứ hai thì tỷ lệ phế phẩm thấp

hơn tỷ lệ phế phẩm của phƣơng pháp công nghệ thứ nhất không?

với mức ý nghĩa 5%.

Bài 8.18. Để kiểm tra một loại súng thể thao, ngƣời ta cho bắn

1000 viên đạn vào 1 tấm bia thấy có 670 viên trúng mục tiêu. Sau

đó, bằng cải tiến kỹ thuật ngƣời ta nâng đƣợc tỉ lệ trúng của súng

này lên 70%. Hãy cho kết luận về việc cải tiến trên với mức ý

nghĩa 1%.

Bài 8.19. Tỷ lệ học sinh tốt nghiệp phổ thông năm ngoái của

tỉnh A là 94%. Trong kỳ thi năm nay trong 100 em đƣợc chọn

ngẫu nhiên có 87 em thi đỗ. Với mức ý nghĩa 5% có thể kết luận

rằng tỷ lệ học sinh thi đỗ của tỉnh A năm nay thấp hơn năm ngoái

không?

140

Bảng 1. Giá trị của hàm tích phân La-pla-ce

2

2

0

1( )

2

tu

u e dt

U 0,00 1 2 3 4 5 6 7 8 9

0.00 .0000 .0039 .0079 .0197 .0159 .0199 .0239 .0279 .0319 .0359

0.10 .0398 .0438 .0477 .0517 .0557 .0596 .0636 .0675 .0714 .0753

0.20 .0793 .0832 .0871 .0909 .0948 .0987 .1026 .1064 .1103 .1141

0.30 .1179 .1217 .1255 .1293 .1331 .1368 .1406 .1443 .1480 .1517

0.40 .1554 .1591 .1628 .1664 .1700 .1736 .1772 .1808 .1844 .1879

0.50 .1915 .1950 .1985 .2019 .2054 .2088 .2123 .2157 .2190 .2224

0.60 .2257 .2291 .2324 .2357 .2389 .2422 .2454 .2486 .2517 .2549

0.70 .2580 .2611 .2642 .2673 .2704 .2734 .2764 .2794 .2823 .2852

0.80 .2881 .2910 .2939 .2967 .2995 .3023 .3051 .3078 .3016 .3133

0.90 .3159 .3186 .3212 .3238 .3264 .3289 .3315 .3340 .3365 .3389

1.00 .3413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .3621

1.10 .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3779 .3810 .3730

1.20 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .4015

1.30 .4032 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .4177

1.40 .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319

1.50 .4332 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4429 .4441

1.60 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .4545

1.70 .4554 .4564 .4573 .4582 .4591 .4599 .4608 .4616 .4625 .4633

1.80 .4641 .4649 .4656 .4664 .4671 .4678 .4686 .4693 .4699 .4706

1.90 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767

2.00 .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .4812 .4817

2.10 .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .4857

2.20 .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 4890

2.30 .4893 .4896 .4898 .4901 .4904 .4906 .4909 .4911 .4913 .4916

2.40 .4918 .4920 .4922 .4925 .4927 .4929 .4931 .4932 .4934 .4936

2.50 .4938 .4940 .4941 .4943 .4945 .4946 4948 .4949 .4951 .4952

2.60 .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .4963 .4964

2.70 .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .4974

2.80 .4974 .4975 .4976 .4977 .4977 .4978 .4979 .7979 .7980 .7981

2.90 .4981 .4982 .4982 .4983 .4984 .4984 .4985 .4985 .4986 .4986

3.00 .4987 .4987 .4987 .4988 .4988 .4989 .4989 .4989 .4990 .499

141

Bảng 2. Giá trị phân vị Student ( )t n

Bậc

tự

do n

Mức ý nghĩa

0,1 0,05 0,025 0,01 0,005 0,001 0,0005

1 3,078 6,314 12,706 31,821 63,657 318,309 636,620

2 1,886 2,920 4,303 6,965 9,925 22,327 31,060

3 1,638 2,353 3,182 4,541 5,841 10,215 12,920

4 1,533 2,132 2,776 3,747 4,604 7,713 8,610

5 1,476 2,015 2,571 3,365 4,032 5,893 6,870

6 1,440 1,943 2,447 3,143 3,707 5,208 5,960

7 1,415 1,895 2,365 3,998 3,499 4,785 5,410

8 1,397 1,860 2,306 2,896 3,355 4,501 5,040

9 1,383 1,833 2,262 2,821 3,250 4,397 4,780

10 1,372 1,812 2,228 2,764 3,169 4,144 4,590

11 1,363 1,796 2,201 2,718 3,106 4,025 4,440

12 1,356 1,782 2,179 2,681 3,055 3,930 4,320

13 1,350 1,771 2,160 2,650 3,012 3,852 4,220

14 1,345 1,761 2,145 2,624 2,977 3,787 4,110

15 1,341 1,753 2,131 2,602 2,947 3,733 4,070

16 1,337 1,746 2,120 2,583 2,921 3,686 4,010

17 1,333 1,740 2,110 2,567 2,898 3,646 3,960

18 1,330 1,734 2,101 2,552 2,878 3,610 3,920

19 1,328 1,729 2,093 2,539 2,861 3,579 3,880

20 1,325 1,725 2,086 2,528 2,845 3,552 3,850

21 1,323 1,721 2,080 2,518 2,831 3,527 3,820

22 1,321 1,717 2,074 2,508 2,819 3,505 3,790

23 1,319 1,714 2,069 2,500 2,807 3,485 3,770

24 1,318 1,711 2,064 2,492 2,797 3,467 3,740

25 1,316 1,708 2,060 2,485 2,787 3,450 3,720

26 1,315 1,706 2,056 2,479 2,779 3,435 3,710

27 1,314 1,703 2,052 2,473 2,771 3,421 3,690

28 1,313 1,701 2,048 2,467 2,763 3,408 3,660

29 1,311 1,699 2,045 2,462 2,756 3,396 3,660

30 1,310 1,697 2,042 2,457 2,750 3,385 3,650

40 1,303 1,684 2,021 2,423 2,704 3,307 3,550

60 1,296 1,671 2,000 2,390 2,660 3,232 3,460

120 1,289 1,658 1,980 2,358 2,617 3,160 3,370

+ 1,282 1,645 1,960 2,326 2,576 3,090 3,290

Nếu n 30 thì ( ) .t n U

142

Bảng 3a. Giá trị phân vị 2 ( )n của phân phối 2

N 0,995 0,99 0,975 0,95 0,90 0,750

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

40

50

60

70

80

90

100+

392704.10-10

0,010025

0,072

0,207

0,412

0,676

0,989

1,344

1,735

2,155

2,603

3,074

3,565

4,074

4,601

5,142

5,697

6,265

6,844

7,434

8,034

8,643

9,260

9,886

10,519

11,160

11,807

12,461

13,121

13,787

20,707

27,991

35,534

43,275

51,172

59,196

67,328

0,15708.10-3

0,0201007

0,115

0,297

0,554

0,872

1,239

1,646

2,087

2,558

3,033

3,570

4,106

4,660

5,229

5,812

6,408

7,015

7,633

8,260

8,897

9,542

10,196

10,856

11,524

12,198

12,879

13,565

14,256

14,954

22,164

29,707

37,485

45,442

53,540

61,754

70,065

0,982.10-3

0,0506

0,216

0,484

0,831

1,237

1,689

2,179

2,700

3,246

3,815

4,404

5,008

5,628

6,262

6,907

7,564

8,231

8,906

9,591

10,283

10,982

11,688

12,401

13,119

13,844

14,573

15,308

16,047

16,791

24,433

32,357

40,482

48,757

57,153

65,647

74,222

0,393.10-2

0,103

0,352

0,711

1,145

1,635

2,167

2,733

3,325

3,940

4,575

5,226

5,892

6,571

7,261

7,962

8,672

9,390

10,117

10,851

11,591

12,338

13,091

13,848

14,611

15,379

16,151

16,928

17,708

18,493

26,509

34,764

43,188

51,739

60,392

69,126

77,930

0.157908

0,207

0,584

1,063

1,610

2,204

2,833

3,489

4,168

4,865

5,579

6,304

7,042

7,790

8,547

9,312

10,085

10,865

11,651

12,443

13,239

14,041

14,848

15,659

16,475

17,292

18,114

18,939

19,768

20,599

29,050

37,688

46,459

55,329

64,278

73,291

82,358

0,1015308

0,575

1,212

1,923

2,675

3,455

4,255

5,071

5,899

6,737

7,584

8,438

9,299

10,165

11,036

11,912

12,792

13,675

14,562

15,452

16,344

17,239

18,137

19,037

19,939

20,843

21,749

22,657

23,566

24,477

33,660

42,942

52,294

61,698

71,144

80,625

90,133

143

Bảng 3b. Giá trị phân vị 2 ( )n của phân phối 2

n 0,50 0,25 0,10 0,05 0,025 0,01 0,005

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

40

50

60

70

80

90

100+

0,455

1,386

2,366

3,356

4,351

5,348

6,346

7,344

8,342

9,342

10,341

11,340

12,339

13,339

14,339

15,338

16,338

17,338

18,338

19,337

20,337

21,337

22,337

23,337

24,337

25,337

26,337

27,337

28,337

29,337

39,337

49,335

59,335

69,334

79,334

89,334

99,334

1,323

2,772

4,108

5,385

6,625

7,840

9,037

10,218

11,388

12,549

13,701

14,845

15,984

17,117

18,245

19,368

20,488

21,605

22,712

23,828

24,934

26,039

27,141

28,241

29,339

30,435

31,528

32,621

33,711

34,799

45,616

56,333

66,981

77,576

88,130

98,649

109,141

2,705

4,605

6,251

7,779

9,236

10,644

12,011

13,362

14,684

15,987

17,275

18,549

19,812

21,064

22,307

23,542

24,769

25,989

27,204

28,412

29,615

30,813

32,006

33,196

34,382

35,563

36,741

37,916

39,087

40,356

51,805

63,167

74,397

85,527

96,578

107,565

118,498

3,841

5,991

7,814

9,487

11,071

12,592

14,067

15,507

16,919

18,307

19,675

21,026

22,362

23,685

25,996

26,296

27,587

28,869

30,143

31,410

32,671

33,924

35,173

36,415

37,653

38,885

40,113

41,338

42,557

43,772

55,758

67,505

79,092

90,531

101,879

113,145

124,324

5,023

7,377

9,348

11,143

12,832

14,449

16,012

17,534

19,022

20,483

21,920

23,336

24,735

26,119

27,488

28,845

30,191

31,526

32,852

34,169

35,478

36,780

38,075

39,364

40,646

41,923

43,194

44,460

45,722

46,979

59,341

71,420

38,297

95,023

106,629

118,136

129,561

6,634

9,210

11,344

13,276

15,086

16,811

18,475

20,090

21,666

23,209

24,725

26,217

27,688

29,141

30,577

31,999

33,408

34,805

36,190

37,566

38,932

40,289

41,638

42,979

44,314

45,641

46,963

48,278

49,587

50,892

63,690

76,153

88,379

100,425

112,329

124,116

135,807

7,979

10,596

12,838

14,860

16,749

18,547

20,277

21,950

23,589

25,188

26,756

28,299

29,819

31,319

32,801

34,267

35,718

37,156

38,582

39,996

41,401

42,795

44,181

45,558

46,927

48,289

49,644

50,993

52,335

53,672

66,765

79,490

91,951

104,215

116,321

128,299

140,169

144

TÀI LIỆU THAM KHẢO

1. Đặng Ngọc Dục, Nguyễn Ngọc Siêng (2010), Lý thuyết xác

suất và thống kê toán, Nxb Đà Nẵng.

2. Trần Doãn Phú, Nguyễn Thọ Liễn (2010), Xác suất và thống

kê toán, Nxb thống kê.

3. Trần Bá Nhẫn, Đinh Thái Hoàng (2006), Thống kê ứng dụng

trong quản trị, kinh doanh và nghiên cứu kinh tế, Nxb Thống kê.

4. Hoàng Ngọc Nhậm (2005), Bài tập xác suất thống kê, Đại học

kinh tế Tp. Hồ Chí Minh.

5. Đào Hữu Hồ (1996), Xác suất thống kê, Nxb Đại học quốc gia

Hà Nội.

6. Nguyễn Ngọc Siêng (2007), Xác suất và thống kê toán, Nxb Đà

Nẵng.

7. Nguyễn Cao Văn (2012), Giáo trình lý thuyết xác suất và thống

kê toán, Nxb Đại học kinh tế quốc dân.

8. Lê Đức Vĩnh (2014), Xác suất thống kê, Nxb Đại học Nông

Nghiệp.

9. Tống Đình Quỳ (1999), Giáo trình xác suất thống kê, Nxb Giáo

dục.

145

MỤC LỤC

CHƢƠNG 1. BIẾN CỐ NGẪU NHIÊN VÀ XÁC SUẤT ............. 4

1.1. BIẾN CỐ NGẪU NHIÊN ........................................................... 4

1.1.1. Phép thử ngẫu nhiên và các loại biến cố ngẫu nhiên ............... 4

1.1.2. Quan hệ giữa các biến cố .......................................................... 5

1.1.3. Các phép toán về biến cố .......................................................... 7

1.1.4. Các tính chất phép toán về biến cố ........................................... 8

1.2. XÁC SUẤT CỦA BIẾN CỐ ....................................................... 9

1.2.1. Định nghĩa cổ điển về xác suất ................................................. 9

1.2.2. Định nghĩa thống kê về xác suất ............................................. 11

1.3. CÁC ĐỊNH LÝ VỀ XÁC SUẤT .............................................. 12

1.3.1. Định lý cộng ........................................................................... 12

1.3.2. Định lý nhân ........................................................................... 15

1.3.3. Tính độc lập của các biến cố .................................................. 18

1.4. CÁC HỆ QUẢ CỦA ĐỊNH LÝ CỘNG, ĐỊNH LÝ NHÂN XÁC

SUẤT ................................................................................................ 20

1.4.1. Công thức xác suất từng phần (đầy đủ) ................................. 20

1.4.2. Định lý Bayes ......................................................................... 22

1.4.3. Công thức Bernoulli ............................................................... 23

BÀI TẬP CHƢƠNG 1 ..................................................................... 25

CHƢƠNG 2. ĐẠI LƢỢNG NGẪU NHIÊN VÀ QUY LUẬT

PHÂN PHỐI XÁC SUẤT .............................................................. 29

2.1. ĐỊNH NGHĨA VÀ PHÂN LOẠI ĐẠI LƢỢNG NGẪU NHIÊN

.......................................................................................................... 29

2.1.1. Định nghĩa.. ........................................................................... 29

2.1.2. Phân loại đại lƣợng ngẫu nhiên .............................................. 30

2.2. QUY LUẬT PHÂN PHỐI XÁC SUẤT .................................... 31

2.2.1. Bảng phân phối xác suất ......................................................... 31

2.2.2. Hàm phân phối xác suất .......................................................... 33

146

2.2.3. Hàm mật độ phân phối xác suất.............................................. 37

2.3. CÁC THAM SỐ ĐẶC TRƢNG CỦA ĐẠI LƢỢNG NGẪU

NHIÊN .............................................................................................. 39

2.3.1. Kỳ vọng .................................................................................. 39

2.3.2. Phƣơng sai .............................................................................. 42

2.3.3. Độ lệch chuẩn. ....................................................................... 45

2.3.4. Trung vị .................................................................................. 45

BÀI TẬP CHƢƠNG 2 ..................................................................... 48

CHƢƠNG 3. MỘT SỐ QUY LUẬT PHÂN PHỐI XÁC SUẤT

THƢỜNG GẶP ............................................................................... 53

3.1. MỘT SỐ QUY LUẬT PHÂN PHỐI XÁC SUẤT RỜI RẠC .. 53

3.1.1. Qui luật phân phối xác suất Không – Một .............................. 53

3.1.2. Quy luật phân phối xác suất nhị thức ..................................... 54

3.1.3. Quy luật phân phối xác suất Poisson ...................................... 55

3.2. MỘT SỐ QUY LUẬT PHÂN PHỐI XÁC SUẤT LIÊN TỤC 56

3.2.1. Quy luật phân phối đều U[a, b] ............................................. 56

3.2.1. Quy luật phân phối chuẩn ...................................................... 58

3.2.2. Quy luật phân phối – bình phƣơng ...................................... 62

3.2.3. Quy luật phân phối Student – T(n) ........................................ 63

BÀI TẬP CHƢƠNG 3 .................................................................... 63

CHƢƠNG 4. ĐẠI LƢỢNG NGẪU NHIÊN HAI CHIỀU .......... 66

4.1. ĐỊNH NGHĨA.. ........................................................................ 66

4.2. HÀM PHÂN PHỐI XÁC SUẤT CỦA ĐLNN HAI CHIỀU .... 66

4.2.1. Định nghĩa. ............................................................................. 66

4.2.2. Tính chất ................................................................................. 66

4.3. PHÂN PHỐI XÁC SUẤT CỦA ĐLNN HAI CHIỀU .............. 67

4.3.1. Bảng phân phối xác suất của ĐLNN hai chiều rời rạc ........... 67

4.3.2. Hàm mật độ phân phối xác suất của ĐLNN hai chiều liên tục ..

.......................................................................................................... 69

147

4.4. PHÂN PHỐI XÁC SUẤT CÓ ĐIỀU KIỆN CỦA ĐLNN HAI

CHIỀU .............................................................................................. 71

4.4.1. Phân phối có điều kiện của ĐLNN hai chiều rời rạc .............. 71

4.4.2. Phân phối có điều kiện của ĐLNN hai chiều liên tục ............ 73

4.5. KỲ VỌNG CÓ ĐIỀU KIỆN ..................................................... 74

4.5.1. Kỳ vọng có điều kiện của ĐLNN hai chiều rời rạc ................ 74

4.5.2. Kỳ vọng có điều kiện của ĐLNN hai chiều liên tục ............... 75

BÀI TẬP CHƢƠNG 4 ..................................................................... 76

CHƢƠNG 5. CÁC ĐỊNH LÝ GIỚI HẠN .................................... 78

5.1. ĐỊNH NGHĨA ........................................................................... 78

5.2. BẤT ĐẲNG THỨC TRÊ-BƢ-SÉP. .......................................... 78

5.3. ĐỊNH LÝ TRÊ-BƢ-SÉP ........................................................... 79

5.3.1. Định lý. .................................................................................. 79

5.3.2. Hệ quả. ................................................................................... 80

5.4. ĐỊNH LÝ BERNOULLI ........................................................... 80

5.5. ĐỊNH LÝ GIỚI HẠN TRUNG TÂM ....................................... 81

BÀI TẬP CHƢƠNG 5 ..................................................................... 83

CHƢƠNG 6. LÝ THUYẾT MẪU ................................................. 84

6.1. KHÁI NIỆM VỀ PHƢƠNG PHÁP MẪU ................................ 84

6.2. TỔNG THỂ VÀ MẪU .............................................................. 85

6.3. CÁC PHƢƠNG PHÁP CHỌN MẪU ....................................... 86

6.3.1. Phƣơng pháp chọn mẫu có lặp. .............................................. 86

6.3.2. Phƣơng pháp chọn mẫu không lặp. ....................................... 86

6.4. MẪU NGẪU NHIÊN VÀ MẪU CỤ THỂ ............................... 87

6.4.1. Định nghĩa.. ........................................................................... 87

6.4.2. Các ví dụ ................................................................................. 87

6.5. CÁC PHƢƠNG PHÁP SẮP XẾP MẪU CỤ THỂ ................... 88

6.5.1. Sắp xếp theo bộ số tăng dần hoặc giảm dần ........................... 88

6.5.2. Sắp xếp theo bảng phân phối tần số, tần suất thực nghiệm .... 88

6.6. CÁC ĐẶC TRƢNG MẪU ........................................................ 90

148

6.6.1. Hàm mẫu (thống kê). ............................................................. 90

6.6.2. Trung bình mẫu, phƣơng sai mẫu, phƣơng sai mẫu điều chỉnh .

.......................................................................................................... 90

6.7. LUẬT PHÂN PHỐI CỦA CÁC ĐẶC TRƢNG MẪU ............. 93

6.7.1. Phân phối của phƣơng sai mẫu hiệu chỉnh ............................. 93

6.7.2. Phân phối của trung bình mẫu ................................................ 94

BÀI TẬP CHƢƠNG 6 ..................................................................... 95

CHƢƠNG 7. BÀI TOÁN ƢỚC LƢỢNG THAM SỐ ................. 99

7.1. KHÁI NIỆM ƢỚC LƢỢNG.. .................................................. 99

7.2. HÀM ƢỚC LƢỢNG VÀ PHƢƠNG PHÁP ƢỚC LƢỢNG ĐIỂM

.......................................................................................................... 99

7.2.1. Ƣớc lƣợng không chệch ....................................................... 100

7.2.2. Ƣớc lƣợng vững .................................................................... 101

7.3. PHƢƠNG PHÁP ƢỚC LƢỢNG KHOẢNG .......................... 102

7.3.1. Mở đầu .................................................................................. 102

7.3.2. Ƣớc lƣợng khoảng tin cậy cho tỷ lệ của tổng thể ................. 103

7.3.3. Ƣớc lƣợng khoảng tin cậy cho kỳ vọng (trung bình) của tổng

thể ................................................................................................... 104

7.3.4. Ƣớc lƣợng phƣơng sai .......................................................... 109

BÀI TẬP CHƢƠNG 7 ................................................................... 112

CHƢƠNG 8. BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT ........... 118

8.1. KHÁI NIỆM CHUNG ............................................................. 118

8.1.1. Giả thuyết thống kê ............................................................... 118

8.1.2. Tiêu chuẩn kiểm định ........................................................... 118

8.1.3. Miền bác bỏ .......................................................................... 119

8.1.4. Giá trị quan sát của tiêu chuẩn kiểm định ............................ 119

8.1.5. Quy tắc kiểm định giả thuyết thống kê ................................. 119

8.1.6. Các sai lầm mắc phải khi thực hiện một bài toán kiểm định ......

........................................................................................................ 120

8.1.7. Quy tắc chung khi kiểm định giả thuyết thống kê ................ 120

149

8.2. KIỂM ĐỊNH THAM SỐ ......................................................... 121

8.2.1. Kiểm định về kỳ vọng của ĐLNN có phân phối chuẩn ....... 121

8.2.2. Kiểm định về phƣơng sai của ĐLNN có phân phối chuẩn ... 129

8.2.3. Kiểm định về tỷ lệ xác suất .................................................. 133

BÀI TẬP CHƢƠNG 8 ................................................................... 136

Bảng 1. Giá trị của hàm tích phân La-pla-ce

2

2

0

1( )

2

tu

u e dt

.... 140

Bảng 2. Giá trị phân vị Student ( )t n ........................................... 141

Bảng 3a. Giá trị phân vị 2 ( )n của phân phối 2 ..........................................

142

Bảng 3b. Giá trị phân vị 2 ( )n của phân phối 2 .........................................

143

TÀI LIỆU THAM KHẢO ............................................................ 144

MỤC LỤC ..................................................................................... 145

GIÁO TRÌNH LÝ THUYẾT XÁC SUẤT VÀ THỒNG KÊ TOÁN

Documents

Transcript of GIÁO TRÌNH LÝ THUYẾT XÁC SUẤT VÀ THỒNG KÊ TOÁN