Bài giảng Lý thuyết xác suất & thống kê - Nguyễn Đức Tuấn, 2015
GIÁO TRÌNH LÝ THUYẾT XÁC SUẤT VÀ THỒNG KÊ TOÁN
Transcript of GIÁO TRÌNH LÝ THUYẾT XÁC SUẤT VÀ THỒNG KÊ TOÁN
1
ỦY BAN NHÂN DÂN TỈNH NGHỆ AN
TRƢỜNG ĐẠI HỌC KINH TẾ NGHỆ AN
Th.S Bùi Đình Thắng
GIÁO TRÌNH
LÝ THUYẾT XÁC SUẤT
VÀ THỒNG KÊ TOÁN
Lƣu hành nội bộ
Nghệ An, tháng 5 năm 2015
2
LỜI NÓI ĐẦU
Lý thuyết xác suất và thống kê toán học là một ngành toán học ra
đời khoảng thế kỷ XVII, đối tƣợng nghiên cứu của nó là các hiện
tƣợng ngẫu nhiên, các quy luật ngẫu nhiên thƣờng gặp trong thực tế.
Lý thuyết xác suất và thống kê phát triển mạnh mẽ trong thế kỷ XX,
xác suất thống kê đƣợc áp dụng rộng rãi trong nhiều lĩnh vực, trong đó
có kinh tế, xã hội, điều khiển học, y học .... Do đó, ngày nay lý thuyết
Xác suất và thống kê toán đã đƣợc đƣa vào giảng dạy ở hầu hết các
ngành đào tạo trong các trƣờng Đại học và Cao đẳng trong nƣớc và
trên thế giới.
Để kịp thời phục vụ việc học tập của sinh viên, Khoa cơ sở -
Trƣờng Đại học Kinh tế Nghệ An đã tổ chức biên soạn cuốn giáo trình
Lý thuyết xác suất và thống kê toán. Đây là giáo trình dùng chung cho
hệ Cao đẳng và hệ Đại học, dựa vào chƣơng trình giảng dạy bộ môn
Khoa học tự nhiên – Khoa cơ sở có thể lựa chọn nội dung giảng dạy
phù hợp với trình độ của mỗi hệ đào tạo.
Trong giáo trình này chúng tôi không đi sâu vào việc chứng minh
những lý thuyết toán học phức tạp mà trình bày các kiến thức cơ bản
về xác suất và thống kê toán nhằm đảm bảo phần cơ sở toán học cho
quá trình thu thập và xử lý thông tin kinh tế - xã hội sẽ đƣợc tiếp tục
nghiên cứu trong các môn học khác.
Giáo trình đƣợc trình bày gồm 8 chƣơng:
Chương 1. Biến cố ngẫu nhiên và xác suất
Chương 2. Đại lượng ngẫu nhiên và quy luật phân phối xác suất
Chương 3. Một số quy luật phân phối xác suất thường gặp
Chương 4. Đại lượng ngẫu nhiên hai chiều
Chương 5. Các định lý giới hạn
Chương 6. Lý thuyết mẫu
Chương 7. Bài toán ước lượng tham số
Chương 8. Bài toán kiểm định giả thuyết
3
Giáo trình "Lý thuyết xác suất và thống kê toán" đƣợc biên soạn
lần đầu và trong thời gian ngắn nên chắc chắn giáo trình không tránh
khỏi những thiếu sót. Tác giả rất mong nhận đƣợc sự góp ý của bạn
đọc để giáo trình ngày càng đƣợc hoàn thiện.
Tác giả
4
Chƣơng 1
BIẾN CỐ NGẪU NHIÊN VÀ XÁC SUẤT
1.1. BIẾN CỐ NGẪU NHIÊN
1.1.1. Phép thử ngẫu nhiên và các loại biến cố ngẫu nhiên
Phép thử ngẫu nhiên là một thuật ngữ để chỉ một phép thử hay một
thực nghiệm hay một quan sát ... mà kết quả là ngẫu nhiên, không biết
trƣớc một cách chắc chắn. Các kết quả có thể (ký hiệu là ) của phép
thử ngẫu nhiên gọi là các biến cố ngẫu nhiên sơ cấp (biến cố sơ cấp).
1.1.1.1. Định nghĩa. Tập hợp tất cả các biến cố ngẫu nhiên sơ cấp
gọi là không gian mẫu của phép thử, ký hiệu là: Ω.
Số các biến cố sơ cấp của Ω ta ký hiệu là Card(Ω).
Ví dụ 1. 1) Gieo một đồng xu là thực hiện một phép thử ngẫu
nhiên. Các kết quả S = "Xuất hiện mặt sấp", N = "Xuất hiện mặt ngửa" là
các biến cố sơ cấp. Không gian mẫu là = {S, N}. Card() = 2.
2) Gieo ngẫu nhiên một con xúc xắc 6 mặt là thực hiện một phép
thử ngẫu nhiên. Các kết quả Mi: “Xúc xắc xuất hiện mặt i chấm”
(i = 1, 2, ..., 6) là các biến cố sơ cấp. Không gian mẫu là Ω = {M1, M2,
M3, M4, M5, M6}. Card(Ω) = 6.
3) Từ một hộp có 13 viên bi khác nhau ta lấy ra ngẫu nhiên 4 bi,
thì hành động đó là thực hiện một phép thử ngẫu nhiên. Mỗi kết quả
lấy ra đƣợc 4 viên bi trong 13 viên bi là một biến cố sơ cấp. Do đó
không gian mẫu Ω là tập hợp các tổ hợp chập 4 của 13 phần tử.
Card(Ω) = 4
13C = 715.
1.1.1.2. Định nghĩa
Một tập hợp con A đƣợc gọi là một biến cố ngẫu nhiên (biến
cố). Các biến cố ngẫu nhiên sơ cấp A đƣợc gọi là biến cố ngẫu
nhiên sơ cấp thuận lợi cho A. Biến cố A đƣợc gọi là xảy ra khi và chỉ
khi xảy ra một biến cố ngẫu nhiên sơ cấp A. Nhƣ vậy A có thể
có, có thể không xảy ra khi thực hiện phép thử.
Biến cố không bao giờ xảy ra khi thực hiện phép thử đƣợc gọi là
biến cố không thể, ký hiệu là .
5
Biến cố nhất định xảy ra khi thực hiện phép thử đƣợc gọi là biến
cố chắc chắn.
Ví dụ 2. 1) Xét phép thử gieo ngẫu nhiên một con xúc xắc 6 mặt.
Các kết quả:
Ac: “Xúc xắc xuất hiện mặt có số chấm chẵn”;
Al: “Xúc xắc xuất hiện mặt có số chấm lẻ”;
Ant: “Xúc xắc xuất hiện mặt có số chấm là số nguyên tố”;
B: "Xúc xắc xuất hiện mặt có số chấm lớn hơn 4";
C: "Xúc xắc xuất hiện mặt có số chấm bé thua 5"
là các biến cố ngẫu nhiên.
Biến cố "Xúc xắc xuất hiện có số chấm lớn hơn 0" là biến cố chắc
chắn.
Biến cố “Xúc xắc xuất hiện mặt có số chấm lớn hơn 6” là biến cố
không thể.
2) Một hộp có 13 viên bi trong đó có 5 viên bi xanh, 8 viên viên
đỏ. Xét phép thử lấy 5 viên bi. Các kết quả: A = "Lấy ra đƣợc 3 bi
xanh, 2 bi đỏ"; B = "Lấy ra đƣợc 4 bi xanh, 1 bi đỏ"; C = "Lấy ra đƣợc
ít nhất một bi đỏ"; D = "Lấy ra đƣợc nhiều nhất 3 bi xanh" ... là các
biến cố ngẫu nhiên. Biến cố "Lấy ra đƣợc 4 viên bi màu vàng" là biến
cố không thể.
1.1.2. Quan hệ giữa các biến cố
Giả sử A, B là hai biến cố của cùng một phép thử.
1.1.2.1. Quan hệ kéo theo. Ta nói rằng biến cố A kéo theo (hay
thuận lợi) biến cố B nếu biến cố A xảy ra thì biến cố B cũng xảy ra.
Ký hiệu là A ⊂ B.
Ví dụ 3. 1) Xét phép thử gieo một con xúc xắc, ta có: M1⊂ Al,
M4 ⊂ Ac.
2) Chọn ngẫu nhiên một con bài trong bộ bài tú-lơ-khơ gồm 52
quân bài. Gọi A là biến cố chọn đƣợc con bài chất rô; B là biến cố
chọn đƣợc con bài màu đỏ. Khi đó A ⊂ B.
3) Chọn ngẫu nhiên 3 sản phẩm trong một kho hàng có hai loại sản
phẩm loại 1 và loại 2. Gọi A là biến cố chọn đƣợc 3 sản phẩm cùng
loại; B là biến cố chọn đƣợc 3 sản phẩm loại 1. Khi đó B ⊂ A.
6
1.1.2.2. Quan hệ đồng nhất. Ta nói rằng biến cố A đồng nhất (hay
tương đương) với biến cố B nếu trong phép thử đó biến cố A xảy ra
khi và chỉ khi biến cố B xảy ra.
Ký hiệu: A = B.
Ví dụ 4. 1) Xét phép thử gieo một con xúc xắc. Gọi B là biến cố "con
xúc xắc xuất hiện mặt có số chấm là bội của 2 và 3”, thì khi đó B = M6.
2) Thầy giáo chấm bài của 1 sinh viên và cho điểm theo thang
điểm 10. Gọi A là biến cố sinh viên đó đạt điểm nhỏ thua 5; B là biến
cố sinh viên đó không đạt yêu cầu. Khi đó ta có: A = B.
1.1.2.3. Quan hệ xung khắc. Hai biến cố A và B đƣợc gọi là xung
khắc nếu chúng không thể đồng thời xảy ra khi thực hiện phép thử đó.
Trƣờng hợp ngƣợc lại, nếu hai biến cố có thể cùng xảy ra trong
một phép thử thì đƣợc gọi là không xung khắc.
Dãy các biến cố A1, A2, …, An là dãy các biến cố xung khắc từng
đôi nếu Ai, Aj (i j, i, j) xung khắc.
Ví dụ 5. 1) Xét phép thử gieo một con xúc xắc. Các cặp biến cố Mi
và Mj (i ≠ j), M1 và Ant, Ac và Al là xung khắc với nhau.
2) Hai ngƣời cùng bắn vào một mục tiêu. Gọi A là biến cố "ngƣời
thứ nhất bắn trúng"; B là biến cố "ngƣời thứ hai bắn trúng". Khi đó A,
B là hai biến cố không xung khắc, vì khi thực hiện phép thử là cho hai
ngƣời cùng bắn vào mục tiêu thì ngƣời thứ nhất và ngƣời thứ hai có
thể cùng bắn trúng nên A, B có thể đồng thời xảy ra.
3) Chọn ngẫu nhiên 2 viên bi trong một hộp có 3 bi xanh, 4 bi
vàng, 5 bi đỏ.
Gọi A1 là biến cố chọn đƣợc 2 bi xanh; A2 là biến cố chọn đƣợc 2
bi vàng; A3 là biến cố chọn đƣợc 2 bi khác màu. Khi đó A1; A2; A3
xung khắc từng đôi một.
1.1.2.4. Quan hệ đối lập. Hai biến cố A, B đƣợc gọi là đối lập với
nhau nếu trong phép thử đó A xảy ra khi và chỉ khi B không xảy ra.
Ký hiệu biến cố đối lập của biến cố A là A .
Ví dụ 6. 1) Xét phép thử gieo một con xúc xắc. Al = cA .
7
2) Bắn một viên đạn vào mục tiêu. Gọi A là biến cố: "bắn trúng
mục tiêu", A là biến cố "bắn trƣợt mục tiêu". A và A là hai biến cố
đối lập với nhau.
3) Chọn ngẫu nhiên hai viên bi trong một hộp có 3 viên bi xanh, 4
viên bi vàng và 5 viên bi đỏ. Gọi A là biến cố 2 viên bi đƣợc chọn ra
có ít nhất 1 viên bi màu xanh. Gọi A là biến cố 2 viên bi chọn ra
không có viên bi màu xanh.
1.1.3. Các phép toán về biến cố
Giả sử A, B là hai biến cố của cùng một phép thử.
1.1.3.1. Tổng, tích của hai biến cố
Tổng (Hợp) của hai biến cố A và B là một biến cố, ký hiệu là A + B
(hoặc A B ), biến cố A + B xảy ra khi và chỉ khi có ít nhất một trong
hai biến cố A, B xảy ra.
Tích (Giao) của hai biến cố A và B là một biến cố, ký hiệu là
AB (hoặc A B ), biến cố AB xảy ra khi và chỉ khi cả hai biến cố A
và B đồng thời xảy ra.
Ví dụ 7. 1) Xét phép thử gieo một con xúc xắc, ta có:
M2 = AcAnt; = Ac + Al; = MiMj (i j; 1 i, j 6)
2) Bắn hai viên đạn vào một mục tiêu. Gọi A là biến cố "viên thứ
nhất trúng mục tiêu", B là biến cố "viên thứ hai trúng mục tiêu". Khi
đó A + B là biến cố "mục tiêu trúng đạn". AB là biến cố "cả 2 viên
đạn trúng mục tiêu".
3) Một sinh viên chọn ngẫu nhiên một câu hỏi. Gọi A là biến cố
"đƣợc câu lý thuyết", B là biến cố "đƣợc câu khó". Khi đó AB là biến
cố "đƣợc câu lý thuyết khó".
1.1.3.2. Hiệu của 2 biến cố. Hiệu của biến cố A với biến cố B là
một biến cố, ký hiệu là A\B, biến cố A\B xảy ra khi và chỉ khi biến cố
A xảy ra nhƣng biến cố B không xảy ra.
Ví dụ 8. 1) Xét phép thử gieo một con xúc xắc, ta có: M2 = Ant\Al,
Ant\Ac = M5 + M3, Ac\Ant = M4 + M6.
2) Chọn ngẫu nhiên 2 viên bi trong một hộp có 3 viên bi màu
xanh, 4 viên bi màu vàng, 5 viên bi màu đỏ. Gọi A là biến cố chọn
đƣợc ít nhất 1 viên màu xanh; B là biến cố chọn đƣợc 2 viên bi khác
8
màu. A\B là biến cố chọn đƣợc 2 viên bi màu xanh. B\A là biến cố
không thể.
1.1.3.3. Hệ đầy đủ. Các biến cố , ,...,1 2 n
A A A đƣợc gọi là hệ đầy
đủ nếu thỏa mãn:
i) ... ; 1 2 n
A A A
ii) , ,...,1 2 n
A A A đôi một xung khắc.
Ví dụ 9. 1) Xét phép thử gieo một con xúc xắc, ta có: Hệ {Ac, Al},
{M1, M2, …, M6} và {Al, Ant, M4, M6} là các hệ đầy đủ.
2) Cho A là một biến cố bất kỳ. Khi đó {A, Ā} là hệ đầy đủ.
3) Gieo 2 hạt giống, gọi Ai là biến cố có số i hạt nảy mầm
(i = 0, 1, 2). Ta có {A0, A1, A2} là một hệ đầy đủ.
1.1.4. Các tính chất phép toán về biến cố
Các phép toán biến cố A + B, AB, A tƣơng ứng với các phép toán
tập hợp nên chúng có tính chất tƣơng tự.
i) Giao hoán: A + B = B + A; AB = BA;
ii) Kết hợp: A + (B + C) = (A + B) + C; A(BC) = (AB)C = ABC;
iii) Phân phối: A(B + C) = AB + AC;
iv) Lũy đẳng: A + A = A, AA = A;
v) A ; A A; A A;A ;
vi) A = A ;
vii) Luật đối ngẫu De Morgan: . ; A B = A B; AB = A B
viii) A\B = AB. Đặc biệt nếu A và B là hai biến cố xung khắc thì
A\B = A và B\A = B.
9
1.2. XÁC SUẤT CỦA BIẾN CỐ
Xác suất của biến cố là một khái niệm cơ bản trong lý thuyết xác
suất, là đại lƣợng xác định (về số lƣợng) đƣợc dùng để biểu thị cho
khả năng xảy ra của một biến cố trong một phép thử. Biến cố nào có
khả năng xảy ra nhiều hơn thì gán cho giá trị lớn hơn, khả năng xảy ra
nhƣ nhau thì gán cho giá trị bằng nhau.
Qua quá trình phát triển của lý thuyết xác suất và tùy theo đặc
điểm của từng phép thử, chúng ta có những định nghĩa về xác suất
nhƣ sau:
1.2.1. Định nghĩa cổ điển về xác suất
1.2.1.1. Định nghĩa. Xét một phép thử, không gian mẫu
1 2 n, ,... là hữu hạn (gồm một số hữu hạn các biến cố sơ cấp).
Giả sử các biến cố sơ cấp 1, 2, ..., n có đồng khả năng xảy ra
(khả năng xảy ra của các biến cố đó khi thực hiện phép thử là nhƣ nhau).
A là một biến cố ngẫu nhiên bất kỳ, m = Card(A) là số biến cố sơ
cấp thuận lợi cho biến cố A xảy ra.
Khi đó xác suất để biến cố A xảy ra là: m Card(A)
P(A) = .n Card( )
1.2.1.2. Tính chất của xác suất
Từ định nghĩa cổ điển về xác suất ta có thể suy ra các tính chất sau
đây:
i) 0 P(A) 1;
ii) P( ) = 0; P( ) = 1.
Chứng minh:
i) Vì Card(A)
0 Card(A) n 0 1 0 P(A) 1.n
ii) Vì Card() = 0 và Card() = n P( ) 0, P() = 1.
Ví dụ 1. 1) Gieo một con xúc xắc cân đối và đồng chất. Tìm xác
suất của các biến cố:
A là biến cố "xúc xắc xuất hiện mặt có số chấm là số chẵn";
B là biến cố "xúc xắc xuất hiện mặt có số chấm nhỏ thua 3".
Giải. Gọi Mi là biến cố xuất hiện mặt có số chấm là i (i = 1, 2, …, 6).
10
Khi đó không gian các biến cố sơ cấp đồng khả năng có 6 phần tử:
= {A1, A2, A3, A4, A5, A6}
Số biến cố sơ cấp thuận lợi cho biến cố A là 3 gồm {A2, A4, A6}.
Do đó xác suất để biến cố A xảy ra là: 3 1
P(A) 0,5.6 2
Số biến cố sơ cấp thuận lợi cho biến cố B là 2 gồm {A1, A2}. Do
đó xác suất để biến cố B xảy ra là P(B) = 2/6 = 1/3 0,333.
2) Một lô hàng gồm 15 sản phẩm trong đó có 12 sản phẩm tốt và 3
sản phẩm xấu. Lấy ngẫu nhiên 2 sản phẩm. Tính xác suất trong các
trƣờng hợp sau:
a) Một sản phẩm tốt và một sản phẩm xấu;
b) Cả hai sản phẩm xấu.
Giải. Số biến cố sơ cấp đồng khả năng là : 2
15C 105.
a) Gọi A là biến cố hai sản phẩm lấy ra có 1 sản phẩm tốt và 1 sản
phẩm xấu.
Số biến cố sơ cấp thuận lợi cho biến cố A là : 1 1
13 2C C 36.
Vậy xác suất để biến cố A xảy ra là: P(A) 36
0,343.105
b) Gọi B là biến cố có hai sản phẩm tốt đƣợc lấy ra.
Số biến cố sơ cấp thuận lợi cho biến cố B là 2
12C 66.
Vậy xác suất để biến cố B xảy ra là: P(B) 66
0,629105
.
1.2.1.3. Ưu điểm và hạn chế của định nghĩa cổ điển về xác suất
Ƣu điểm: Khi tìm xác suất của biến cố ta không cần phải tiến
hành thực nghiệm (phép thử chỉ tiến hành một cách giả định); kết quả
xác suất tìm ra chính xác khi đáp ứng đƣợc các yêu cầu của định
nghĩa.
Nhƣợc điểm: Chỉ áp dụng đƣợc cho các phép thử có số biến cố
sơ cấp hữu hạn và các biến cố đó đồng khả năng xảy ra; trong thực tế
nhiều khi không biểu diễn đƣợc các kết quả của phép thử dƣới dạng
các biến cố sơ cấp đồng khả năng (Ví dụ: Khi tung con xúc xắc ta giả
11
thiết rằng nó cân đối và đồng chất, tuy nhiên trong thực tế hiếm khi có
một con xúc xắc cân đối, đồng chất).
1.2.2. Định nghĩa thống kê về xác suất
1.2.2.1. Tần suất. Xét một phép thử và A là một biến cố nào đó
liên quan đến phép thử. Ta thực hiện phép thử đó n lần (một cách độc
lập) trong những điều kiện giống nhau, nếu trong n lần đó có m
(0 m n) lần biến cố A xảy ra thì tỷ số n
mf (A)
n đƣợc gọi là tần
suất xảy ra biến cố A trong n phép thử.
Ví dụ 2. 1) Một xạ thủ bắn 1000 viên đạn vào mục tiêu và có 800
lần bắn trúng mục tiêu. Gọi A là biến cố xạ thủ bắn trúng mục tiêu.
Khi đó tần suất xảy ra biến cố A là f1000(A) = 800/1000 = 0,8.
2) Để nghiên cứu khả năng xuất hiện mặt sấp khi thực hiện phép
thử tung một đồng xu. Ngƣời ta tiến hành tung một đồng xu nhiều lần
và thu đƣợc kết quả sau đây:
Ngƣời làm
thí nghiệm Số lần tung
Số lần mặt sấp
xuất hiện Tần suất
Buffon 4040 2048 0,5069
Pearson 12000 6019 0,5016
Pearson 24000 12012 0,5005
Qua ví dụ trên nhận thấy, khi số phép thử tăng lên thì tần suất xuất
hiện mặt sấp sẽ giao động ngày càng ít hơn xung quanh giá trị không
đổi 0,5. Điều đó cho phép hy vọng rằng khi số phép thử tăng lên vô
hạn thì tần suất hội tụ về giá trị 0,5.
1.2.2.2. Định nghĩa. Khi số phép thử n càng lớn thì tần suất nf (A)
sẽ dao động xung quanh một hằng số p với biên độ giảm dần tới 0.
Hằng số p đó đƣợc gọi là xác suất của biến cố A, ký hiệu là P(A) = p.
Nhƣ vậy nf (A) P(A) khi n .
1.2.2.3. Ưu điểm và hạn chế của định nghĩa thống kê về xác suất
Ƣu điểm: Khi xác định xác suất bằng thống kê ngƣời ta không đòi
hỏi điều kiện áp dụng nhƣ đối với định nghĩa cổ điển, nó hoàn toàn
dựa trên các quan sát thực tế để làm cơ sở kết luận.
12
Nhƣợc điểm: Theo định nghĩa thống kê của xác suất, ta không thể
xác định chính xác xác suất của một biến cố vì không thực hiện phép
thử vô hạn lần đƣợc.
1.3. CÁC ĐỊNH LÝ VỀ XÁC SUẤT
1.3.1. Định lý cộng
1.3.1.1. Định lý. i) Nếu A, B là hai biến cố xung khắc với nhau thì:
P(A + B) = P(A) + P(B); ii) Nếu A1, A2, …, An là dãy các biến cố xung khắc với nhau từng
đôi một thì: 1 2 1 2P(A A ... A ) P(A ) P(A ) ... P(A ).n n
Chứng minh: i) Vì A, B là hai biến cố xung khắc nên không có
biến cố sơ cấp nào thuận lợi cho cả A và B. Số biến cố sơ cấp thuận
lợi cho A + B là m = mA + mB, trong đó mA là số biến cố sơ cấp thuận
lợi cho A và mB là biến cố sơ cấp thuận lợi cho B. Từ đó suy ra:
A B A Bm m m mP(A B) P(A) P(B).
n n n
ii) Ta chứng minh theo phƣơng pháp quy nạp toán học:
+ Với n = 2: Theo i) ta có 1 2 1 2P(A A ) P(A ) P(A ) nên ii) đúng
với n = 2.
+ Giả sử ii) đúng với n = k, tức là:
1 2 1 2P(A A ... A ) P(A ) P(A ) ... P(A ).k k
+ Với n = k + 1, ta có:
1 2 k k 1 1 2 k k 1P(A A ... A A ) P(A A ... A ) P(A ) (theo i))
1 2 1(P(A ) P(A ) ... P(A )) P(A ).k k
(theo giả thiết quy nạp) ii) đúng với n = k + 1.
Vậy theo phƣơng pháp chứng minh quy nạp toán học ta có: Nếu
A1, A2, …, An là dãy các biến cố xung khắc với nhau từng đôi một thì:
1 2 1 2P(A A ... A ) P(A ) P(A ) ... P(A ), , 2.n n n n
Ví dụ 1. Một hộp 6 bi đỏ và 4 bi xanh hoàn toàn giống nhau về
kích thƣớc và trọng lƣợng. Ta lấy ngẫu nhiên 2 bi. Tìm xác suất để 2
bi lấy ra cùng màu.
Giải. Gọi A là biến cố 2 bi lấy ra đều màu xanh.
B là biến cố 2 bi lấy ra đều màu đỏ.
13
C là biến cố 2 bi lấy ra đều cùng màu.
Khi đó: C = A + B và A, B xung khắc nên:
P(C) = P(A + B) = P(A) + P(B)
Ta có: 2
4
2
10
C 2P(A) 0,133
C 15 ;
2
6
2
10
C 5P(B) 0,333.
C 15
Vậy xác suất để lấy ra 2 bi cùng màu là:
2 5 7P(C) 0,467.
15 15 15
1.3.1.2. Hệ quả. i) Nếu A là biến cố đối lập của biến cố A thì xác
suất của biến cố A là P(A) 1 P(A);
ii) Nếu A1, A2, …, An là hệ đầy đủ các biến cố thì:
P(A1) + P(A2) + ... + P(An) = 1.
Chứng minh: i) Vì A và A đối lập nên A và A xung khắc do đó
theo Định lý 1.3.1.1 ta có:
P( ) P(A A) P(A) P(A) 1 P(A) P(A) P(A) 1 P(A).
ii) Nếu A1, A2, …, An là hệ đầy đủ các biến cố thì A1, A2, …, An
dãy các biến cố đôi một xung khắc và A1 + A2 + …+ An = .
Do đó:
1 2 n 1 2 n1 P( ) P(A A ... A ) P(A ) P(A ) ... P(A ).
Ví dụ 2. Một hộp có 50 sản phẩm loại I và 15 sản phẩm loại II.
Lấy ngẫu nhiên 10 sản phẩm để kiểm tra. Tính xác suất để có ít nhất 1
sản phẩm loại II trong 10 sản phẩm đƣợc kiểm tra.
Giải. Gọi A là biến cố "có ít nhất 1 sản phẩm loại II trong 10 sản
phẩm đƣợc kiểm tra". Khi đó A là biến cố không có sản phẩm loại II
nào trong 10 sản phẩm đƣợc kiểm tra.
Ta có: 10 10
50 50
10 10
65 65
C CP(A) P(A) 1 0,943.
C C
1.3.1.3. Định lý cộng mở rộng
i) Nếu A, B là 2 biến cố bất kỳ thì P(A + B) = P(A) + P(B) –
P(AB);
14
ii) Nếu A, B, C là 3 biến cố bất kỳ thì P(A + B + C) = P(A) + P(B)
+ P(C) – P(AB) – P(BC) – P(CA) + P(ABC);
iii) Nếu A1, A2, …, An là dãy các biến cố bất kỳ thì n n
i i i j i j k
i 1 i 1 1 i j n 1 i j k n
P A P(A ) P(A A ) P(A A A ) ...
n 1
1 2 n( 1) P(A A ...A ).
Chứng minh: i) Ta có A B A BA ; A và BA xung khắc với nhau.
Khi đó, P(A B) P(A) P(BA) .
Mặt khác, B B(A A) BA BA nên P(B) P(BA) P(BA)
P(BA) = P(B) – P(AB).
Từ đó, ta có: P(A + B) = P(A) + P(B) – P(AB).
ii) P(A + B + C) = P(A) + P(B + C) – P(A(B+C))
= P(A) + P(B) + P(C) – P(BC) – P(AB + AC)
= P(A) + P(B) + P(C) – P(BC) – P(AB + AC) –
{P(AB) + P(AC) – P(ABC)}.
P(A + B + C) = P(A) + P(B) + P(C) – P(BC) – P(AB + AC) –
{P(AB) + P(AC) – P(ABC)}.
iii) Chứng minh tƣơng tự ii.
Ví dụ 3. Một lớp có 20 sinh viên, trong đó có 10 sinh viên biết
tiếng Anh, 12 sinh viên biết tiếng Pháp, 7 sinh viên biết cả 2 thứ tiếng.
Gọi ngẫu nhiên 1 sinh viên. Tìm xác suất để:
a) Sinh viên đó biết ít nhất 1 ngoại ngữ;
b) Sinh viên đó không biết ngoại ngữ.
Giải: a) Gọi A là biến cố sinh viên đƣợc gọi biết tiếng Anh:
10P(A) 0,5.
20
B là biến cố sinh viên đƣợc gọi biết tiếng Pháp: 12
P(B) 0,6.20
AB là biến cố sinh viên biết cả 2 thứ tiếng 7
P(AB) 0,35.20
C là biến cố sinh viên đƣợc gọi biết ít nhất 1 ngoại ngữ: C = A + B
Khi đó: P(C) = P(A + B) = P(A) + P(B) P(AB)
15
10 12 7 15P(C) 0,75.
20 20 20 20
b) C là biến cố sinh viên đƣợc gọi biết ít nhất 1 ngoại ngữ, nên
C là biến cố sinh viên đƣợc gọi không biết ngoại ngữ:
P(C) = 1 P(C) 0,25.
1.3.2. Định lý nhân
1.3.2.1. Xác suất có điều kiện. Giả sử A, B là 2 biến cố, P(B) > 0.
Xác suất có điều kiện của biến cố A khi biến cố B đã xảy ra là một số
không âm, ký hiệu là P(A/B) , nó đặc trƣng cho khả năng xảy ra của
biến cố A trong tình huống biến cố B đã xảy ra.
Ví dụ 4. Một hộp có 4 bi đỏ và 3 bi xanh. Lấy ngẫu nhiên ra lần
lƣợt 2 viên bi, mỗi lần 1 viên (lấy không hoàn lại). Tìm xác suất để:
a) Bi lấy ra lần 2 là bi đỏ, biết rằng bi lấy ra lần 1 là bi đỏ.
b) Bi lấy ra lần 2 là bi xanh, biết rằng bi lấy ra lần 1 là bi xanh.
Giải. Gọi Ai là biến cố bi lấy ra lần thứ i là bi đỏ (i = 1, 2).
a) Khi bi lấy ra lần thứ nhất là bi xanh, trong hộp lúc này chỉ còn
lại 6 viên bi gồm 3 đỏ và 3 xanh. Do đó xác suất lấy ra lần 2 là bi đỏ
khi biết bi lấy ra lần 1 là bi đỏ là: 2 1
3P(A /A ) 0,5.
6
b) Khi bi lấy ra lần thứ nhất là bi xanh, trong hộp lúc này chỉ còn
lại 6 viên bi gồm 4 đỏ và 2 xanh. Do đó xác suất lấy ra lần 2 là bi xanh
khi biết bi lấy ra lần 1 là bi xanh là: 2 1
2P(A /A ) 0,333.
6
1.3.2.2. Định lý nhân. Giả sử A, B là 2 biến cố. Khi đó ta có:
P(AB) = P(B).P(A/B) nếu P(B) > 0
hoặc P(AB) = P(A).P(B/A) nếu P(A) > 0.
Chứng minh: Giả sử n là biến cố sơ cấp đồng khả năng xảy ra của
phép thử. mA, mB là số biến cố sơ cấp thuận lợi cho biến cố A, B; k là
số biến cố sơ cấp thuận lợi cho A và B.
Khi đó: Ak mP(AB) ;P(A)
n n .
Với điều kiện biến cố B đã xảy ra thì tổng số biến cố sơ cấp đồng
khả năng lúc này là mB trong đó có k biến cố thuận lợi cho A. Do đó:
16
B
kP(A / B)
m và P(B) > 0 (vì B đã xảy ra)
Nhƣ vậy:
BB
kk P(AB)nP(A / B) P(AB) P(B).P(A / B).
mm P(B)
n
Vì vai trò của A, B nhƣ nhau nên nếu P(A) > 0 thì
P(AB) = P(A).P(B/A).
Ví dụ 5. Trong một hộp có 5 chính phẩm và 3 phế phẩm. Lấy ngẫu
nhiên lần lƣợt hai sản phẩm. Tìm xác suất để cả hai sản phẩm lấy ra
đều là chính phẩm.
Giải. Gọi Ai là biến cố "sản phẩm lấy ra lần thứ i là chính phẩm"
(i = 1, 2). A là biến cố "cả hai sản phẩm lấy ra đều là chính phẩm".
Khi đó A = A1A2
P(A) = P(A1A2 ) = P(A1).P(A2/A1) = 5 4
. 0,357.8 7
1.3.2.3. Định lý nhân mở rộng. Giả sử A1, A2, …, An là các biến
cố của cùng 1 phép thử. Khi đó:
P(A1A2…An) = P(A1).P(A2/A1).P(A3/A1A2)…P(An/A1A2…An-1)
với điều kiện: P(A1A2…An-1) > 0.
Chứng minh: Ta chứng minh theo phƣơng pháp quy nạp toán học:
+ Với n = 2: Theo Định lý 1.3.2.2, ta có:
P(A1A2) = P(A1).P(A2/A1) Định lý đúng với n = 2.
+ Giả sử định lý đúng với n = k, tức là:
P(A1A2…Ak) = P(A1).P(A2/A1).P(A3/A1A2)…P(Ak/A1A2…Ak-1)
+ Ta chứng minh định lý đúng với n = k + 1.
Theo Định lý 1.3.2.2, ta có:
P(A1A2…Ak+1) = P(A1A2...Ak).P(Ak+1/A1A2…Ak
Theo giả thiết quy nạp, ta có:
P(A1A2…Ak+1) = P(A1).P(A2/A1).P(A3/A1A2)…P(Ak/A1A2…Ak-1).
P(Ak+1/A1A2…Ak)
với n = k + 1 định lý đúng.
17
Vậy theo phƣơng pháp quy nạp toán học ta suy ra Định lý 1.3.3.3
đúng với mọi n .
Ví dụ 6. Một hộp có 4 chính phẩm và 2 phế phẩm. Lấy ngẫu nhiên
lần lƣợt từng sản phẩm một (không hoàn lại) để kiểm tra cho tới khi
lấy ra đƣợc 2 phế phẩm thì thôi. Tìm xác suất các biến cố sau:
a) Việc kiểm tra dừng lại khi kiểm tra tới sản phẩm thứ 2.
b) Việc kiểm tra dừng lại khi kiểm tra tới sản phẩm thứ 3.
c) Giả sử việc kiểm tra dừng lại khi kiểm tra sản phẩm thứ 3. Tìm
xác suất để sản phẩm kiểm tra ở lần 1 là chính phẩm.
Giải.
a) Gọi Ai là biến cố sản phẩm lấy ra kiểm tra lần thứ i là phế phẩm
(i = 1, 2, 3).
iA là biến cố đối lập với biến cố Ai (i = 1, 2).
A là biến cố việc kiểm tra dừng lại khi kiểm tra sản phẩm thứ 2.
Khi đó: A = A1A2
P(A) = P(A1A2) = P(A1)P(A2/A1) = 2 1
. 0,067.6 5
b) Gọi B là biến cố việc kiểm tra dừng lại khi kiểm tra tới sản
phẩm thứ 3.
Khi đó: B = A1 2A A3 + 1A A2A3.
Ta có 2 biến cố A1 2A A3, 1A A2A3 xung khắc nên:
P(B) = P(A1 2A A3) + P(1A A2A3).
Mà P( 1A A2A3) = P(A1).P( 2A /A1).P(A3/A1 2A ).
trong đó: P(A1) = 2
6; P( 2A /A1) =
4
5; P(A3/A1 2A ) =
1.
4
P(A1 2A A3) = 2 4 1
. . 0,067.6 5 4
Lại có: P(1A A2A3) = P(
1A ).P(A2/ 1A ).P(A3/ 1A A2)
= 4 2 1 1
. . 0,067.6 5 4 15
18
Vậy P(B) = 2
0,133.15
c) Việc kiểm tra dừng lại khi kiểm tra sản phẩm thứ 3. Xác suất để
kiểm tra sản phẩm kiểm tra ở lần 1 là chính phẩm là:
P(1A /B) = 1P(A B)
.P(B)
Mà 1 1 2 3
1P(A B) = P(A A A ) 0,067.
15
do đó: P(1A /B) =
1115 0,5.
2 2
15
1.3.2.4. Tính chất của xác suất có điều kiện
i) P(/B) = 0; P(/B) = 1;
ii) P((A + C)/B) = P(A/B) + P(C/B) – P(AC/B);
Nếu A, C xung khắc thì P((A + C)/B) = P(A/B) + P(C/B)
iii) P(A/B) = 1 P(A/B).
1.3.3. Tính độc lập của các biến cố
1.3.3.1. Định nghĩa. Hai biến cố A và B của cùng một phép thử
đƣợc gọi là độc lập với nhau nếu sự xảy ra hay không xảy ra của biến
cố này không làm ảnh hƣởng đến xác suất của biến cố kia, tức là
P(A/B) = P(A), P(B/A) = P(B).
Trong lý thuyết và tính toán, ngƣời ta nhận biết tính độc lập bởi
công thức, còn trong thực tế ngƣời ta nhận biết tính độc lập của các
biến cố bằng trực giác.
Ví dụ 7. Hai xạ thủ cùng bắn vào một mục tiêu. Gọi A, B lần lƣợt
là biến cố ngƣời thứ nhất, ngƣời thứ hai bắn trúng mục tiêu. Vì việc hai
ngƣời bắn trúng hay trƣợt mục tiêu không ảnh hƣởng đến kết quả của
nhau nên A, B là hai biến cố độc lập.
Ví dụ 8. Gieo đồng thời hai con xúc xắc. Gọi A là biến cố con xúc
xắc thứ nhất xuất hiện mặt chấm chẵn, B là biến cố con xúc xắc thứ
hai xuất hiện mặt chấm lẻ. Vì việc xuất hiện mặt có số chấm chẵn hay
19
lẻ của mỗi con xúc xắc không làm ảnh hƣởng đến nhau nên A, B là
hai biến cố độc lập.
1.3.3.2. Định lý. Nếu A với B độc lập thì A với B , A với B, A
với B cũng độc lập.
Chứng minh: Vì A, B độc lập với nhau nên P(A/B) = P(A), P(B/A)
= P(B).
Ta có: P(B / A) 1 P(B / A) 1 P(B) P(B) do đó B,A độc lập
với nhau.
Vì vai trò của A, B nhƣ nhau nên A,B độc lập với nhau.
Lại có: P(B / A) 1 P(B / A) 1 P(B) P(B) do đó A với B
độc lập.
1.3.3.3. Hệ quả. Hai biến cố A và B với P(B) > 0 là độc lập khi và
chỉ khi P(AB) = P(A).P(B).
Chứng minh: +) Giả sử A, B độc lập với nhau. Khi đó
P(B/A) = P(B), do đó P(AB) = P(A).P(B).
+) Ngƣợc lại, giả sử P(AB) = P(A).P(B), mà P(AB) = P(A).P(B/A)
nên P(B/A) = P(B). Tƣơng tự P(A/B) = P(A). Vậy A và B độc lập với
nhau.
Ví dụ 9. Hai công ty hoạt động độc lập với nhau đƣợc mời tham
gia đấu thầu một dự án gồm nhiều gói thầu. Khả năng trúng thầu của
các công ty tƣơng ứng là 0,8 và 0,9. Tính xác suất để có ít nhất một
công ty trúng thầu.
Giải. Gọi A1, A2 lần lƣợt là biến cố công ty thứ nhất, thứ hai trúng
thầu.
A là biến cố có ít nhất một công ty trúng thầu.
Khi đó: A = A1 + A2 và A1, A2 độc lập nhƣng không xung khắc.
1 2 1 2 1 2P(A A ) P(A ) P(A ) P(A A )
1 2 1 2P(A ) P(A ) P(A ).P(A ) 0,8 0,9 0,8.0,9 0,98 .
1.3.3.4. Định nghĩa. Các biến cố A1, A2, …, An đƣợc gọi là độc
lập từng đôi một nếu mỗi cặp hai biến cố bất kỳ trong n biến cố độc
lập với nhau.
Khi đó ta có: P(AiAj) = P(Ai).P(Aj) với i ≠ j.
20
Ví dụ 10. Tung một đồng xu 3 lần, gọi Ai (i = 1, 2, 3) là biến cố
"mặt sấp xuất hiện ở lần tung thứ i". Khi đó A1, A2, A3 độc lập từng
đôi một.
1.3.3.5. Định nghĩa. Các biến cố A1, A2, …, An đƣợc gọi là độc
lập toàn phần nếu chúng độc lập từng đôi một và mỗi biến cố độc lập
với tích của một số tùy ý các biến cố còn lại.
Khi đó ta có: P(A1A2…An) = P(A1).P(A2)…P(An).
Chú ý. Các biến cố độc lập toàn phần thì độc lập với nhau từng đôi
một, điều ngƣợc lại không đúng.
Ví dụ 11. Hộp 1 có 3 bi đỏ và 4 bi xanh; Hộp 2 có 2 bi đỏ và 5 bi
xanh. Lấy ngẫu nhiên từ mỗi hộp ra 1 bi. Tìm xác suất các biến cố
sau:
a) 2 bi lấy ra đều màu đỏ;
b) 2 bi lấy ra cùng màu.
Giải. a) Gọi A là biến cố 2 bi lấy ra đều màu đỏ.
Ai là biến cố bi lấy ra từ hộp i là bi đỏ (i = 1, 2).
Khi đó A = A1A2.
Ta có 2 biến cố A1, A2 là độc lập nên P(A) = P(A1).P(A2) =
3 2. 0,123.
7 7
b) iA là biến cố đối lập của Ai (i = 1, 2). Gọi B là biến cố 2 bi lấy
ra đều màu xanh.
Khi đó: B = 1 2A .A ;
1A , 2A độc lập.
1 2 1 2
4 5P B = P A .A P A .P A . 0,408.
7 7
Gọi C là biến cố 2 bi lấy ra đều cùng màu; C = A + B; A, B xung
khắc.
26
P C = P A + B = P(A) + P(B) 0,531.49
1.4. CÁC HỆ QUẢ CỦA ĐỊNH LÝ CỘNG, ĐỊNH LÝ NHÂN
XÁC SUẤT
1.4.1. Công thức xác suất từng phần (đầy đủ)
21
Giả sử A1, A2, …, An là các biến cố tạo thành hệ đầy đủ và
P(Ai) > 0 (i = 1,n ). A là biến cố bất kỳ của phép thử đó. Khi đó ta có:
P(A) = P(A1).P(A/A1) + …+ P(An).P(A/An) = i i
1
P(A )P(A/A ).n
i
Chứng minh: Vì A1, A2, …, An là các biến cố tạo thành hệ đầy đủ
nên:
1 2 nA A ... A 1 2 nA A. AA AA ... AA .
Vì A1, A2, …, An đôi một xung khắc nên 1 2 nAA ,AA ,...,AA cũng đôi
một xung khắc.
Do đó: 1 2 nP(A) P(AA ) P(AA ) ... P(AA )
1 1 2 2 n nP(A) P(A )P(A / A ) P(A )P(A / A ) ... P(A )P(A / A )
n
i i
i 1
P(A )P(A / A ).
Ví dụ 1. Có 3 hộp hoàn toàn giống nhau về hình thức.
Hộp 1 có 4 chính phẩm, 2 phế phẩm.
Hộp 2 có 3 chính phẩm, 3 phế phẩm.
Hộp 3 có 5 chính phẩm, 1 phế phẩm.
Lấy ngẫu nhiên 1 hộp rồi từ đó lấy ra 1 sản phẩm. Tìm xác suất để
sản phẩm đó là chính phẩm.
Giải. Gọi Ai là biến cố hộp i đƣợc lấy ra (i = 1, 2, 3)
1 2 3
1P(A ) = P(A ) = P(A ) .
3
Ta có: {A1, A2, A3} là hệ đầy đủ.
Gọi A là biến cố lấy ra đƣợc chính phẩm. Áp dụng công thức xác
suất từng phần ta có:
P(A) = P(A1).P(A/A1) + P(A2).P(A/A2) + P(A3).P(A/A3).
trong đó: P(A/A1) = 4
6; P(A/A2) =
3
6; P(A/A3) =
5.
6
1 4 3 5 2P(A) .
3 6 6 6 3
22
1.4.2. Định lý Bayes
Giả sử A1, A2, …, An là các biến cố tạo thành hệ đầy đủ và
P(Ai) > 0 (i = 1,n ). A là biến cố bất kỳ của phép thử đó và P(A) > 0.
Khi đó ta có:
i ii
P(A ).P(A/A )P(A /A) = , i=1,n .
P(A)
Chứng minh: Theo Định lý 1.3.2.2, ta có:
i i i iP(AA ) P(A)P(A / A) P(A )P(A / A ), i 1,n .
Do đó: i ii
P(A )P(A / A )P(A / A) , i 1,n.
P(A)
Ví dụ 2. Một cửa hàng bán bóng đèn cùng loại do 3 cơ sở sản xuất
cung cấp. Cơ sở 1, cơ sở 2, cơ sở 3 cung cấp lƣợng hàng tƣơng ứng là
40%, 35%, 25%. Biết tỉ lệ bóng hỏng do cơ sở 1, cơ sở 2, cơ sở 3 sản
xuất tƣơng ứng là 2%, 2%, 3%. Ta mua ngẫu nhiên 1 bóng của cửa
hàng.
a) Tìm xác suất để bóng mua bị hỏng;
b) Giả sử bóng mua bị hỏng. Hỏi bóng mua do cơ sở nào sản xuất
là có khả năng xảy ra cao nhất.
Giải. a) Gọi Ai là biến cố bóng mua do cơ sở i sản xuất
(i = 1, 2, 3).
Gọi A là biến cố bóng mua bị hỏng.
P(A1) = 0,4; P(A2) = 0,35; P(A3) = 0,25.
Hệ {A1; A2; A3} tạo thành hệ đầy đủ. Do đó áp dụng công thức
xác suất từng phần ta có:
P(A) = P(A1).P(A/A1) + P(A2).P(A/A2) + P(A3).P(A/A3)
trong đó: P(A/A1) = 0,02; P(A/A2) = 0,02; P(A/A3) = 0,03.
Vậy P(A) = 0,023.
b) Bóng mua bị hỏng có thể là do cơ sở 1, hoặc cơ sở 2, hoặc cơ sở
3 sản xuất.
Xác suất để bóng hỏng mua do cơ sở 1 sản xuất là:
1 11
P(A ).P(A/A ) 0,4.0,02 80P(A /A) = = = .
P(A) 0,0225 225
23
Xác suất để bóng hỏng mua do cơ sở 2 sản xuất là:
2 22
P(A ).P(A/A ) 0,35.0,02 70P(A /A) = = = .
P(A) 0,0225 225
Xác suất để bóng hỏng mua do cơ sở 3 sản xuất là:
3 33
P(A ).P(A/A ) 0,25.0,03 75P(A /A) = = = .
P(A) 0,0225 225
Vậy bóng mua bị hỏng do cơ sở 1 sản xuất xảy ra nhiều nhất.
1.4.3. Công thức Bernoulli
1.4.3.1. Định nghĩa. Tiến hành n lần phép thử độc lập trong những
điều kiện nhƣ nhau. Giả sử ở mỗi phép thử, biến cố A xảy ra với xác
suất p không đổi. Khi đó xác suất để trong n phép thử biến cố A xảy ra
đúng k lần là:
k k n k
n nP (k) = C p (1 p) , k = 1, 2, ..., n
công thức trên đƣợc gọi là công thức Bernoulli.
1.4.3.2. Hệ quả. Với các giả thiết nhƣ trên ta có:
i) Xác suất để trong n phép thử biến cố A không xảy ra lần nào là:
(1 – p)n;
ii) Xác suất để trong n phép thử biến cố A luôn luôn xảy ra là: pn;
iii) Để trong n phép thử biến cố A xảy ra ít nhất k1 lần và nhiều
nhất k2 lần là: Pn(k1 ≤ k ≤ k2) = 2
1
kk k n k
n
k = k
C p (1 p) .
Ví dụ 3. Một xạ thủ bắn 1 phát vào bia một cách độc lập. Xác suất
trúng đích của mỗi phát bắn đều 0,8. Tìm xác suất để:
a) Trong 10 phát bắn có đúng 6 phát trúng.
b) Trong 10 phát bắn có ít nhất 8 phát trúng.
Giải. Xem mỗi phát bắn là một phép thử. Gọi A là biến cố bắn
trúng đích.
Do đó theo giả thiết bài toán, ta thực hiện 10 phép thử độc lập.
Trong mỗi phép thử biến cố A xảy ra với xác suất không đổi là
p = P(A) = 0,8.
a) Áp dụng công thức Bernoulli ta có, xác suất để trong 10 phát
bắn có đúng 6 phát trúng đích là:
24
6 6 4
10 10P (6) C (0,8) (1 0,8) .
b) Xác suất để trong 10 phát bắn có ít nhất 8 phát trúng là:
10 10 10P = P (8) + P (9) + P (10) 8 8 2 9 9 9 10 10 10
10 10 10P C (0,8) (1 0,8) C (0,8) (1 0,8) C (0,8) (1 0,8) .
25
BÀI TẬP CHƢƠNG 1
Bài 1.1. Gieo một con xúc xắc đối xứng và đồng chất. Tìm xác
suất để đƣợc:
a. Mặt sáu chấm xuất hiện.
b. Mặt có số chấm xuất hiện là mặt chấm chẵn lớn hơn 2.
Đ/s: a. 1/6; b. 1/3.
Bài 1.2. Có 100 tấm bìa hình vuông đƣợc đánh số từ 1 đến 100. Ta
lấy ngẫu nhiên một tấm bìa. Tìm xác suất:
a. Đƣợc một tấm bìa có số không có chữ số 5.
c. Đƣợc một tấm bìa có số chia hết cho 2 hoặc cho 5 hoặc cả cho 2
và cho 5.
Đ/s: a. 0,81; b. 0,6.
Bài 1.3. Một bộ bài Tú- lơ-khơ có 52 quân bài. Lấy ngẫu nhiên ra
2 quân bài. Tính xác suất:
a. Hai con bài lấy ra đều là con 2.
b. Hai con bài lấy ra có một con 2 và một con Át.
c. Hai con bài lấy ra ít nhất có một con Át.
Đ/s: a. 1
221; b. 8
663; c.
33
221.
Bài 1.4. Một hộp chứa 9 thẻ đánh số từ 1 đến 9. Chọn ngẫu nhiên
ra 3 thẻ. Tính xác suất để 3 thẻ lấy ra đều là số chẵn.
Đ/s: 1
21.
Bài 1.5. Một hộp có 10 sản phẩm trong đó có 4 phế phẩm, 6 chính
phẩm. Lấy ngẫu nhiên ra 3 sản phẩm. Tính xác suất:
a. 3 sản phẩm lấy ra đều là chính phẩm.
b. Có đúng 2 phế phẩm.
Đ/s: a. 1
6; b. 3
10.
Bài 1.6. Một lô hàng gồm 10 sản phẩm loại I, 4 sản phẩm loại II
và 3 phế phẩm. Lấy ngẫu nhiên ra 3 sản phẩm. Tìm xác suất để có:
a. Hai sản phẩm loại I.
26
b. Hai sản phẩm loại I và một sản phẩm loại II.
c. Cả 3 sản phẩm cùng loại.
Đ/s: a. 63
136; b. 9
34; c. 25
136.
Bài 1.7. Gieo ngẫu nhiên hai đồng xu cân đối và đồng chất. Tìm
xác suất để đƣợc:
a. Cả 2 đồng xu đều xuất hiện mặt sấp.
b. Một đồng xu xuất hiện mặt sấp.
c. Ít nhất một đồng xu xuất hiện mặt sấp.
Đ/s: a. 0,25; b. 0,5; c. 0,75.
Bài 1.8. Gieo ngẫu nhiên hai con xúc xắc cân đối và đồng chất.
Tìm xác suất của biến cố sau:
a. A là biến cố "Tổng số chấm xuất hiện ở mặt trên của cả hai con
xúc xắc bằng 7".
b. B là biến cố "Hiệu số chấm xuất hiện ở mặt trên của cả hai con
xúc xắc bằng 1".
c. C là biến cố "Tích số chấm xuất hiện ở mặt trên của cả hai con
xúc xắc bằng 12".
Đ/s: a. 1/6; b. 10/36; c. 1/9.
Bài 1.9. Một hộp có 6 quả cầu trắng, 4 quả cầu đỏ và 2 quả cầu
đen. Chọn ngẫu nhiên 6 quả cầu. Tìm xác suất để chọn đƣợc 3 quả cầu
trắng, 2 quả cầu đỏ và 1 quả cầu đen.
Đ/s: 20/77.
Bài 1.10. Một hộp có 15 quả cầu kích thƣớc nhƣ nhau, trong đó
có 5 quả cầu màu xanh, 10 quả cầu màu đỏ. Lấy ngẫu nhiên từ trong
hộp ra 3 quả. Tìm xác suất để:
a. Ba quả cầu lấy ra không cùng màu.
b. Trong ba quả cẩu lấy ra có ít nhất một quả màu xanh.
Đ/s: a. 65
91; b. 67
91.
Bài 1.11. Trong một hộp có 10 sản phẩm, trong đó có 2 sản phẩm
là phế phẩm. Lấy ngẫu nhiên ra 6 sản phẩm. Tìm xác suất để:
a. Có không quá một sản phẩm là phế phẩm.
b. Có ít nhất là một phế phẩm.
27
Đ/s: a.2 / 3 ; b.13 /15
Bài 1.12. Một nhóm có 30 nhà đầu tƣ các loại, trong đó có 13 nhà
đầu tƣ vàng, 17 nhà đầu tƣ chứng khoán, 10 nhà đầu tƣ cả vàng và
chứng khoán. Một đối tác gặp ngẫu nhiên một nhà đầu tƣ trong nhóm.
Tính xác suất để ngƣời đó gặp đƣợc nhà đầu tƣ ít nhất một trong 2 loại
vàng, chứng khoán.
Đ/s: 2/3.
Bài 1.13. Xác suất để một xạ thủ bắn bia trúng 10 điểm là 0,1;
trúng 9 điểm là 0,2; trúng 8 điểm là 0,25 và ít hơn 8 điểm là 0,45. Xạ
thủ ấy bắn một viên đạn. Tìm xác suất để xạ thủ đó bắn đƣợc ít nhất là
9 điểm. Đ/s: 0,3.
Bài 1.14. Trong một phân xƣởng có 10 máy hoạt động. Qua
theo dõi thấy xác suất để trong một ca có một máy phải sửa là 0,2;
xác suất để có hai máy phải sửa là 0,13 và xác suất để có nhiều
hơn hai máy phải sửa là 0,07. Tìm xác suất để trong một ca phân
xƣởng đó không phải sửa máy.
Đ/s: 0,6.
Bài 1.15. Có 2 hộp đựng chi tiết. Hộp thứ nhất đựng 10 cái ốc,
trong đó có 6 cái tốt. Hộp thứ hai đựng 15 cái vít, trong đó có 9 cái tốt.
Lấy ngẫu nhiên từ mỗi hộp một chi tiết. Tìm xác suất để lấy đƣợc một
bộ ốc vít tốt.
Đ/s: 9/15.
Bài 1.16. Một ngƣời có 4 bóng đèn trong đó có 2 bóng đèn bị
hỏng. Ngƣời đó thử lần lƣợt từng bóng đèn (không hoàn lại) cho đến
khi chọn đƣợc bóng tốt. Tính xác suất để ngƣời đó thử đến lần thứ 2.
Đ/s: 1/3.
Bài 1.17. Một lô hàng có 100 sản phẩm. Lấy ngẫu nhiên liên tiếp 5
sản phẩm để kiểm tra. Nếu có ít nhất một sản phẩm xấu thì không
nhận lô hàng. Tìm xác suất để nhận lô hàng. Biết rằng tỷ lệ phế phẩm
của lô hàng là 5%.
Đ/s: 0,77
Bài 1.18. Trong hộp có 8 quả cầu đỏ và 12 quả cầu trắng kích
thƣớc nhƣ nhau. Một ngƣời lấy ngẫu nhiên từ trong hộp ra mỗi lần
28
một quả cầu sau đó hoàn lại rồi lấy tiếp cho đến khi lấy đƣợc quả cầu
đỏ thì dừng lại. Tìm xác suất để lấy quả cầu thứ tƣ thì dừng lại.
Đ/s: 54/625.
Bài 1.19. Một hộp có 36 bóng đèn điện, trong đó có 4 loại bóng
đèn màu xanh. Ta lấy ngẫu nhiên lần lƣợt hai bóng đèn. Tìm xác suất
để lần thứ hai lấy đƣợc một loại bóng đèn màu xanh nếu lần thứ nhất
lấy đƣợc một bóng đèn màu xanh.
Đ/s: 3/35.
Bài 1.20. Trong một lô hàng có 50 sản phẩm, trong đó có 10 sản
phẩm loại I, 40 sản phẩm loại II. Lấy ngẫu nhiên lần lƣợt 3 sản phẩm
(lấy không hoàn lại). Tính xác suất để:
a. Cả ba sản phẩm đều cùng loại I.
b. Cả ba sản phẩm đều cùng loại.
Đ/s: a. 3/490; b. 25/49.
Bài 1.21. Có ba ngƣời bắn vào một mục tiêu. Xác suất ngƣời thứ
nhất bắn trúng là 0,7; ngƣời thứ hai bắn trúng là 0,8 và ngƣời thứ ba
bắn trúng là 0,5. Tìm xác suất để:
a. Có một ngƣời bắn trúng mục tiêu.
b. Có hai ngƣời bắn trúng mục tiêu.
c. Cả ba ngƣời đều bắn trật mục tiêu.
Đ/s: a. 0,22; b. 0,47; c. 0,03.
Bài 1.22. Có 3 sinh viên cùng làm bài thi. Xác suất làm đƣợc bài
của từng sinh viên lần lƣợt là: 0,8; 0,7; 0,6.
a. Tìm xác suất để có một sinh viên làm đƣợc bài thi.
b. Tìm xác suất để có hai sinh viên làm đƣợc bài thi.
c. Nếu có hai sinh viên làm đƣợc bài thi, tìm xác suất để sinh viên
thứ nhất không làm đƣợc bài thi.
Đ/s: a.0,188 ; b. 0,452; c. 21/113.
29
Chƣơng 2
ĐẠI LƢỢNG NGẪU NHIÊN
VÀ QUY LUẬT PHÂN PHỐI XÁC SUẤT
2.1. ĐỊNH NGHĨA VÀ PHÂN LOẠI ĐẠI LƢỢNG NGẪU
NHIÊN
2.1.1. Định nghĩa. Cho một phép thử ngẫu nhiên và là không
gian mẫu của phép thử đó. Một đại lƣợng mà ứng với mỗi kết quả
nhận một giá trị thực duy nhất nào đó đƣợc gọi là đại lượng
ngẫu nhiên một chiều liên kết với phép thử đã cho (gọi tắt là biến ngẫu
nhiên hay đại lƣợng ngẫu nhiên).
2.1.1.1. Các ký hiệu
Đại lƣợng ngẫu nhiên (ĐLNN) liên kết với một phép thử thƣờng
đƣợc ký hiệu bởi các chữ cái in hoa: X, Y, Z, ..., X1, X2, ...
Giá trị của ĐLNN X ứng với mỗi kết quả cụ thể của phép thử là
số thực thƣờng đƣợc ký hiệu là X() hay ký hiệu bởi các chữ in
thƣờng x, y, z, ..., x1, x2, ...
Tập hợp các giá trị thực mà ĐLNN X đƣợc ứng với tất cả các kết
quả đƣợc gọi là tập giá trị của ĐLNN X, ký hiệu là DX.
Ký hiệu: (X a) là biến cố / X( ) a
(X a) là biến cố / X( ) a
(X a) là biến cố / X( ) a
(a X b) là biến cố / a X( ) b ...
Chú ý: Nếu X, Y, .. là các ĐLNN liên kết với cùng một phép thử
ngẫu nhiên thì X, X + Y, XY, X/Y, ... cũng là một ĐLNN.
2.1.1.2. Các ví dụ
Ví dụ 1. Xét phép thử gieo một lần 2 đồng xu cân đối đồng chất,
mỗi đồng xu có 2 mặt là S và N, ta có = {SS, NN, SN, NS}.
ĐLNN X chỉ số mặt N xuất hiện khi gieo 2 đồng tiền, khi đó X là
ĐLNN với phép thử đã cho.
30
Ứng với = SS ta có X() = 0, với = NN ta có X() = 2, với
= SN ta có X() = 1, với = NS ta có X() = 1
Vậy tập giá trị của ĐLNN X là DX = {0, 1, 2}
Ví dụ 2. Một rổ cam có 10 quả trong đó có 4 quả hỏng. Lấy ngẫu
nhiên 5 quả. Đại lƣợng Y chỉ số quả hỏng có trong 5 quả lấy ra là 1
ĐLNN.
Ứng với kết quả = lấy ra đƣợc 5 quả tốt thì Y() = 0, với kết
quả lấy ra đƣợc 4 quả tốt 1 quả hỏng thì Y() = 1, ...
Tập giá trị của ĐLNN X là DY = {0, 1, 2, 3, 4}.
Ví dụ 3. Xét phép thử gieo đồng thời 2 con xúc xắc cân đối đồng
chất. Ta có không gian mẫu = { = (x, y)/ x, y {1, 2, 3, 4, 5, 6}}.
Card() = 36.
Đại lƣợng Z là tổng số chấm xuất hiện trên 2 con xúc xắc là
ĐLNN.
Ứng với mỗi = (x, y) ta có gía trị của Z là Z() = x + y.
Tập giá trị của ĐLNN Z là:
DZ = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}.
2.1.2. Phân loại đại lƣợng ngẫu nhiên
2.1.2.1. Đại lượng ngẫu nhiên rời rạc
ĐLNN X đƣợc gọi là ĐLNN rời rạc nếu tập giá trị có thể có của
nó là hữu hạn hoặc vô hạn đếm đƣợc.
Ví dụ 4. Tung một con xúc xắc cân đối, đồng chất. Gọi X là số
chấm xuất hiện. Khi đó X là một ĐLNN rời rạc, và nhận các giá trị có
thể có: 1, 2, 3, 4, 5, 6.
Ví dụ 5. Các ĐLNN trong các ví dụ 1, ví dụ 2, ví dụ 3 là các
ĐLNN rời rạc.
2.1.2.2. Đại lượng ngẫu nhiên liên tục
ĐLNN X đƣợc gọi là ĐLNN liên tục nếu tập giá trị có thể có của
nó lấp đầy một khoảng trên trục số.
Ví dụ 6. Xe buýt chạy với tần suất 15 phút một chuyến. Gọi X là
thời gian chờ xe của một ngƣời. Khi đó X là một ĐLNN liên tục, các
giá trị có thể có của X lấp đầy đoạn [0, 15].
31
Ví dụ 7. ĐLNN chỉ chiều cao của sinh viên trƣờng ĐH kinh tế
Nghệ An là một ĐLNN ngẫu nhiên liên tục.
2.2. QUY LUẬT PHÂN PHỐI XÁC SUẤT
Quy luật phân phối xác suất của ĐLNN là một hình thức cho phép
mô tả mối quan hệ giữa các giá trị có thể có của ĐLNN với xác suất
tƣơng ứng để ĐLNN nhận các giá trị có thể có đó.
Trong thực tế ngƣời ta thƣờng sử dụng 3 phƣơng pháp mô tả quy
luật phân phối xác suất của ĐLNN là: Bảng phân phối xác suất, hàm
phân phối xác suất và hàm mật độ phân phối xác suất.
2.2.1. Bảng phân phối xác suất
2.2.1.1. Định nghĩa. Cho X là ĐLNN rời rạc nhận có tập giá trị
DX = {x1, x2, …, xn} và có xác suất tƣơng ứng là pi = P(X = xi),
(i = 1, 2, …, n).
Bảng phân phối xác suất của X là bảng số có dạng:
1 2 n
1 2 n
X x x ... x
P p p ... p
2.2.1.2. Tính chất
i) 0 ≤ pi ≤ 1, (i =1, 2, …, n);
ii) i
i 1
p 1n
;
iii) i
i
x I
P X I P(X x )
, trong đó I .
Chứng minh: i) Dễ dàng suy ra từ tính chất của xác suất.
ii) Vì dãy các biến cố (X = x1), (X = x2), ..., (X = xn) lập thành một
hệ đầy đủ các biến cố nên: n n
i i
i 1 i 1
P(X x ) 1 p 1
.
iii) Biến cố (X I) = (X = x1) + (X = x2) + ... + (X = xk) trong đó:
ix I, i 1,k và (X = x1), (X = x2), ..., (X = xk) đôi một xung khắc.
Do đó i i
i i
x I x I
P X I P (X x ) P(X x ).
32
Ví dụ 1. Cho ĐLNN X có bảng phân phối xác suất
X -2 1 3
P 0,3 – m 0,2 + m 0,1 + 2m
a) Tìm m.
b) Tính P(0 < X 4).
Giải. a) Điều kiện:
0,3 m 0
0,2 m 0 (*)
0,1 2m 0
Theo tính chất ii, ta có: (0,3 – m) + (0,2 + m) + (0,1 + 2m) = 1
m = 0,2 (thỏa mãn điều kiện (*)). Vậy m = 0,2.
b) P(0 < X 4) = P(X = 1) + P(X = 3) = 0,4 + 0,5 = 0,9.
Ví dụ 2. Có 10 sinh viên, trong đó 2 sinh viên giỏi, 3 sinh viên
khá, 5 sinh viên trung bình. Chọn ngẫu nhiên 3 sinh viên. Gọi X là số
sinh viên giỏi đƣợc chọn. Lập bảng phân phối xác suất của X.
Giải. DX = {0, 1, 2}.
P(X = 0) = 0 3
2 8
3
10
7
15
C C
C ;
P(X = 1) = 1 2
2 8
3
10
7
15
C C
C ;
P(X = 2) = 2 1
2 8
3
10
2
15
C C
C .
Do đó bảng phân phối xác suất của X là:
X 0 1 2
P 7
15
7
15
1
15
Ví dụ 3. Hai ngƣời thi bắn súng, khả năng bắn trúng đích của mỗi
ngƣời là: 0,8; 0,9. Gọi X là số ngƣời bắn trúng đích. Lập bảng phân
phối của X.
Giải. DX = {0, 1, 2}.
Gọi Ai là biến cố ngƣời i bắn trúng đích (i = 1, 2).
33
(X = 0) = 1 2A .A P(X = 0) = P(
1 2A .A )
= P(1A ).P(
2A ) (Vì 1 2A ,A độc lập).
P(X = 0) = (1 – 0,8).(1 – 0,9) = 0,02.
(X = 1) = 1 2A .A +
1 2A .A và 1 2A .A ,
1 2A .A xung khắc.
P(X = 1) = P(1 2A .A ) + P(
1 2A .A )
= P(A1).P(2A ) + P(
1A ).P(A2) (Vì A1, 2A và 1A , A2
độc lập)
P(X = 1) = 0,8.(1 – 0,9) + (1 – 0,8).0,9 = 0,26.
(X = 2) = 1 2A .A P(X = 2) = P( 1 2A .A )
= P(A1).P(A2) (Vì A1, A2 độc lập)
= 0,8.0,9 = 0,72.
Vậy bảng phân phối xác suất của X là:
X 0 1 2
P 0,02 0,26 0,72
2.2.2. Hàm phân phối xác suất
2.2.2.1. Định nghĩa. Cho X là ĐLNN (rời rạc hoặc liên tục). Hàm
số ký hiệu và xác định nhƣ sau gọi là hàm phân phối xác suất của
ĐLNN X.
F(t) = P(X < t), với t .
Ví dụ 4. Lập hàm phân phối xác suất của ĐLNN chỉ số mặt ngửa (N)
xuất hiện khi gieo hai đồng xu cân đối đồng chất một cách ngẫu nhiên.
Giải. Ta có tập giá trị của ĐLNN X là DX = {0, 1, 2}.
+ Nếu t 0 ta có (X < t) = nên F(t) = P(X < t) = P() = 0.
+ Nếu 0 < t 1 ta có (X < t) = (X = 0) = {SS} nên F(t) = P(X < t)
= P({SS}) = 1/4.
+ Nếu 1 < t 2 ta có (X < t) = (X = 0) + (X = 1) = {SS, SN, NS}
nên F(t) = 3/4.
+ Nếu 2 < t ta có (X < t) = nên F(t) = P() = 1.
Vậy hàm phân phối xác suất của ĐLNN X là:
34
0 khi t 0
1/ 4 khi 0 t 1F(t)
3 / 4 khi 1 t 2
1 khi 2 t
.
2.2.2.2. Tính chất
i) 0≤ F(t) ≤ 1, t ;
ii) t t
F( ) lim F(t) 1;F( ) lim F(t) 0
;
iii) F(t) là hàm không giảm.
iv) Hàm F(t) liên tục trái tại mọi điểm t = a .
Nếu X là ĐLNN liên tục thì F(t) liên tục tại mọi điểm t = a ;
v) Với a,b ,a b, ta có: P(a ≤ X < b) = F(b) – F(a).
Nếu X là ĐLNN liên tục thì P(X < a) = P(X a) và P(a ≤ X ≤ b) =
P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b) = F(b) – F(a).
Chứng minh: i) Theo tính chất của xác suất, ta có:
0 P(X t) 1, t .
0 F(t) 1, t .
ii) Khi t + thì biến cố (X < t) dần tới biến cố chắc chắn. Do
đó khi t + thì P(X < t) 1, tức là t
F( ) lim F(t) 1.
Khi t – thì biến cố (X < t) dần tới biến cố không thể. Do đó
khi t – thì P(X < t) 0, tức là t
F( ) lim F(t) 0.
iii) 1 2t , t , nếu 1 2t t thì 2 1 1 2(X t ) (X t ) (t X t )
1 2 1 2 1 2(X t ) (X t ) P(X t ) P(X t ) F(t ) F(t ) , nghĩa
là hàm F(t) không giảm.
iv) Với a , khi t a thì biến cố (X < t) (X < a)
t a t alim F(t) lim P(X t) P(X a) F(a)
F(t) liên tục bên
trái tại điểm a.
35
+) Vì X là ĐLNN liên tục nên tập giá trị của X có dạng (a, b), a có
thể là – , b có thể là + , hay [a, b]. Khi đó hàm phân phối xác suất
của X có dạng:
0 khi t a
F(t) P(X t) khi a t b
1 khi b t
Vì F(t) xác định trên (a, b) nên F(t) liên tục trên (a, b).
+) Xét tính liên tục tại t = a:
t a t a t a t alim F(t) lim P(X t) lim P( ) 0 F(a) lim F(t)
F(t) liên
tục tại t = a.
+) Xét tính liên tục tại t = b:
t b t b t b t blim F(t) lim P(X t) lim P( ) 1 F(b) lim F(t)
F(t) liên
tục tại t = b.
Vậy F(t) liên tục trên .
v) Vì a < b nên (X < b) = (X < a) + (a X < b)
P(X b) P(X a) P(a X b) F(b) F(a) P(a X b)
P(a X b) F(b) F(a) .
+) Với t , cho t số gia t .
Xét t 0 : P(t X t t) F(t t) F(t)
Vì X là ĐLNN liên tục nên
t 0 t 0
lim P(t X t t) lim F(t t) F(t)
P(X t) F(t) F(t) 0.
Tƣơng tự với t 0 , ta cũng có: P(X t) F(t) F(t) 0.
Vậy với X là ĐLNN liên tục thì F(t) = 0, t.
Do đó: P(X a) = P(X < a) + P(X = a) = P(X < a).
và P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b)
= F(b) – F(a).
36
Ví dụ 5. Cho X là ĐLNN có bảng phân phối xác suất.
X 0 1 2
P 7
15
7
15
1
15
Tìm hàm phân phối xác suất F(t) của X.
Giải. + Nếu t ≤ 0 thì F(t) = P(X < t) = P() = 0.
+ Nếu 0 < t ≤ 1 thì F(t) = P(X < t) = P(X = 0) = 7
15.
+ Nếu 1 < t ≤ 2 thì F(t) = P(X = 0) + P(X = 1) = 7
15+
7
15 =
14
15.
+ Nếu t > 2 thì F(t) = P(X = 0) + P(X = 1) + P(X = 2) = 1.
Vậy
0 khi t 0,
7 khi 0 < t 1,
15F(t)
14 khi 1 < t 2,
15
1 khi t > 2.
Ví dụ 6. Cho ĐLNN liên tục X có hàm phân phối xác suất
2
0 khi t 0,
F(t) mt khi 0 < t 3,
1 khi t > 3.
a) Tìm hệ số m.
b) Tính P(– 1 < X 2).
Giải. a) Vì hàm số F(t) là hàm phân phối của ĐLNN X liên tục nên
F(t) liên tục tại mọi điểm t nên F(t) liên tục tại t = 0 và t = 3.
Do đó:
2
t 0 t 0 t 0 t 0
2
t 3 t 3 t 3 t 3
F(0) lim F(t) lim F(t) 0 lim(mt ) lim 0
F(3) lim F(t) lim F(t) 9m lim1 lim(mt )
9m 1 m 1/ 9.
37
b) Sử dụng tính chất của hàm phân phối, ta có:
P(– 1 < X 2) = F(2) – F(–1) = 4 4
0 0,444.9 9
2.2.3. Hàm mật độ phân phối xác suất
2.2.3.1. Định nghĩa. Cho ĐLNN X có hàm phân phối xác suất
F(t), F(t) khả vi tại mọi điểm t . Hàm mật độ phân phối xác suất
của ĐLNN X là hàm số đƣợc ký hiệu và xác định nhƣ sau:
f (t) F'(t), t .
2.2.3.2. Tính chất
i) f(t) 0, t ;
ii) F(x) f(t)dt, ;
x
x
iii) P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b)
= P(a < X < b) f(t)dt
b
a
;
iv) f(t)dt 1.
Chứng minh: i) Vì 0≤ F(t) ≤ 1, t nên f(t) = F'(t) 0,
t .
ii) Do F(t) là một nguyên hàm của f(t) nên với x ta có:
xx
f (t) F(t) F(x) F( ) F(x)
.
iii) Vì F(t) là một nguyên hàm của f(t) nên:
P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b)
F(b) F(a) F(t) f(t)dt
bb
a
a
.
iv) Vì f(t)dt F(t) F(+ ) F( ) 1 0 1.
Ví dụ 7. Cho ĐLNN X có hàm phân phối F(t).
38
2
0 khi t 0
tF(t) khi 0 < t 3
9
1 khi t > 3.
a) Tìm hàm mật độ phân phối của X;
b) Tính P(-1 < X 2).
Giải. a)
0 khi t 0 t > 3
f(t) = F'(t) 2t khi 0 < t 3.
9
b) Sử dụng tính chất của hàm mật độ phân phối, ta có:
2 0 2
1 1 0
22
0
2tP( 1 X 2) f (t)dt 0.dt dt
9
t 4 0,444.
9 9
Ví dụ 8. Cho ĐLNN X có hàm mật độ xác suất:
2
0 khi t 2
f(t) k khi t > 2.t
a) Tìm k;
b) Tìm hàm phân phối của ĐLNN X;
c) Tìm P(- 3 ≤ X ≤ 3).
Giải. a)
2
2
22
k k k1 f(t)dt 0dt dt k 2.
t t 2
b) + Nếu x ≤ 2 thì F(x) 0dt 0.
x
+ Nếu x > 2 thì
2
2
22 2
2 2 2F(x) f(t)dt f(t)dt dt 1
t t
xx x
x
.
39
Vậy
0 khi x 2
F(x) 2 1 khi x > 2.
x
c) Cách 1: Sử dụng tính chất của hàm mật độ phân phối, ta có:
P(- 3 ≤ X ≤ 3) = 33
2
22
2 2 1dx 0,333.
t t 3
Cách 2: Sử dụng tính chất của hàm phân phối, ta có:
P(- 3 ≤ X ≤ 3) = F(3) – F(-3) = 2 1
(1 ) 0 0,3333 3
2.3. CÁC THAM SỐ ĐẶC TRƢNG CỦA ĐẠI LƢỢNG
NGẪU NHIÊN
2.3.1. Kỳ vọng
2.3.1.1. Định nghĩa. Kỳ vọng của ĐLNN X là một số thực đƣợc
ký hiệu E(X) và xác định nhƣ sau:
i) Nếu X là ĐLNN rời rạc có bảng phân phối xác suất
1 2 n
1 2 n
X x x ... x
P p p ... p
thì n
i i
i 1
E(X) x p
;
ii) Nếu X là ĐLNN liên tục có hàm mật độ phân phối xác suất f(t)
thì E(X) t.f(t)dt
.
Ví dụ 1. Có 2 ngƣời, mỗi ngƣời bắn 1 viên đạn vào bia với xác
suất bắn trúng tƣơng ứng là 0,6 và 0,9. Hãy tính kỳ vọng của số viên
đạn trúng bia.
Giải. Gọi X là số viên đạn trúng bia DX = {0, 1, 2}.
P(X = 0) = (1 – 0,6).(1 – 0,9) = 0,04.
P(X = 1) = 0,6.(1 – 0,9) + (1 – 0,6).0,9 = 0,42.
P(X = 2) = 0,6.0,9 = 0,54.
Bảng phân phối xác suất của X là:
40
X 0 1 2
P 0,04 0,42 0,54
E(X) = 0.0,04 + 1.0,42 + 2.0,54 = 1,5.
Ví dụ 2. Cho X là ĐLNN liên tục có hàm mật độ xác suất
2
0 khi t (0,3)
f(t) t khi t 0, 3 .
9
Tính kỳ vọng của ĐLNN X?
Giải. 30 3 2 4
0 3 0
t t 9E(X) t.f(t)dt t.0dt t. dt t.0dt 2,25
9 36 4
.
2.3.1.2. Tính chất
i) E(C) = C, C là hằng số;
ii) E(C.X) = C.E(X), C là hằng số;
iii) E(X Y) = E(X) E(Y);
iv) Nếu X, Y độc lập thì E(XY) = E(X)E(Y).
Chứng minh: i) Ta có thể xem hằng số là ĐLNN chỉ nhận giá trị C
với xác suất bằng 1. Do đó: E(C) = 1.C = C.
ii) Đặt Y = C.X. Nếu X là ĐLNN rời rạc thì Y = CX là ĐLNN rời
rạc có bảng phân phối xác suất:
1 2 n
1 2 n
Y = C.X k x kx ... kx
P p p ... p
thì n n
i i i i
i 1 i 1
E(Y) = E(C.X) (kx )p k x p k.E(X)
.
iii) Ta chứng minh trong trƣờng hợp X, Y là các ĐLNN rời rạc có
bảng phân phối xác suất:
1 2 n
1 2 n
X x x ... x
P p p ... p 1 2 m
1 2 m
Y y y ... y
P q q ... q
Khi đó, bảng phân phối xác suất của X + Y là:
41
1 1 1 2 n m
11 12 nm
X+Y x y x y ... x y
P p p ... p
trong đó n
ij j
i=1
p q j 1,m và m
ij i
j=1
p p i 1,n
Thật vậy, khi biến cố (X = xi) xảy ra thì ĐLNN X + Y nhận các
giá trị: xi + y1, xi + y2, ..., xi + ym. Do đó:
i i i 1 i 2p P(X x ) P(X Y x y ) P(X Y x y ) ...
i mP(X Y x y )
m
i i1 i2 im ij
j 1
p p p ... p p
.
Tƣơng tự chứng minh đƣợc: n
ij j
i=1
p q .
Ta có: E(X + Y) = n m n m n m
i j ij i ij j ij
i 1 j 1 i 1 j 1 i 1 j 1
(x y )p (x p ) (y p )
n m m n
i ij j ij
i 1 j 1 j 1 i 1
x p y p
n m
i i j j
i 1 j 1
x p y q E(X) E(Y).
iv) Ta chứng minh trong trƣờng hợp X, Y là các ĐLNN độc lập,
rời rạc có bảng phân phối xác suất:
1 2 n
1 2 n
X x x ... x
P p p ... p 1 2 m
1 2 m
Y y y ... y
P q q ... q
Khi đó, bảng phân phối xác suất của XY là:
1 1 1 2 n m
1 1 1 2 n m
X+Y x y x y ... x y
P p q p q ... p q
n m n m
i j i j i i j j
i 1 j 1 i 1 j 1
E(XY) x y p q x p y q E(X).E(Y).
42
2.3.1.3. Ý nghĩa
Kỳ vọng của một ĐLNN là số đại diện về giá trị trung bình
theo xác suất của các giá trị của ĐLNN.
Ví dụ 3. Một ngƣời tham gia trò chơi tung 3 con xúc xắc. Mỗi lần
tham gia trò chơi ngƣời đó bỏ ra a đồng. Nếu có 1, 2 hoặc 3 mặt "1
chấm" xuất hiện thì thu về tƣơng ứng 2a, 3a hoặc 4a đồng. Nếu không
có mặt "1 chấm" nào xuất hiện thì mất a đồng bỏ ra. Hỏi ngƣời đó có
nên tham gia trò chơi này không?
Giải. Gọi X là số tiền thu về cho 1 lần khi tham gia trò chơi, ta có
X là một ĐLNN nhận các giá trị rời rạc là 0, 2a, 3a, 4a.
P(X = 0) = 3
3
5 125
6 216 ; P(X = 2a) =
1 2
3
3
C .5 75
6 216 ;
P(X = 3a) = 2
3
3
C .5 15
6 216 ; P(X = 4a) =
3
3
3
C 1
6 216 .
Bảng phân phối xác suất của X là:
X 0 2a 3a 4a
P 125
216
75
216
15
216
1
216
Kỳ vọng của ĐLNN X là E(X) = 199a
216, nghĩa là trung bình mỗi
lần tham gia trò chơi này ngƣời đó thu về 199a
216 đồng. Mà mỗi lần
tham gia trò chơi ngƣời đó bỏ ra a đồng. Do đó số tiền thực chất ngƣời
đó nhận đƣợc là 199a 17a
a 0216 216
nên ngƣời đó không nên tham gia
trò chơi này nhiều lần.
2.3.2. Phƣơng sai
2.3.2.1. Định nghĩa. Giả sử ĐLNN X có kỳ vọng E(X) = µ.
Phương sai của ĐLNN X là một số thực không âm, ký hiệu D(X) và
đƣợc xác định nhƣ sau: D(X) = E{(X – E(X))2}.
i) Nếu X là ĐLNN rời rạc thì D(X) = n
2
i i
i 1
(x μ) p
;
43
ii) Nếu X là ĐLNN liên tục thì D(X) = 2(x μ) f(x)dx
.
Ví dụ 4. Cho X là ĐLNN rời rạc có bảng phân phối xác suất
X 0 1 2
P 0,4 0,2 0,4
Tính phƣơng sai của ĐLNN X?
Giải. Ta có kỳ vọng E(X) = 0.0,4 + 1.0,2 + 2.0,4 = 1.
D(X) = (0 – 1)2.0,4 + (1 – 1)
2.0,2 + (2 – 1)
2.0,4 = 0,8.
2.3.2.2. Tính chất
i) D(C) = 0, với C là hằng số;
ii) D(CX) = C2D(X), với C là hằng số;
iii) D(X) = E(X2) – [E(X)]
2;
iv) Nếu X, Y là 2 ĐLNN độc lập thì D(X Y) = D(X) + D(Y).
Chứng minh: i) Theo định nghĩa phƣơng sai, ta có:
2 2D(C) E (C E(C)) E(C C) E(0) 0.
ii) Ta có: 2 2D(CX) E (CX E(CX)) E (CX CE(X))
2 2 2 2E C .(X E(X)) C .E (X E(X))
2C .D(X).
iv) Ta có:
22 2D(X) E (X E(X)) E X 2X.E(X) E(X)
22E(X ) E 2X.E(X) E E(X) .
Mà E(X) là một hằng số, do đó:
22D(X) E(X ) 2E(X).E X E(X) = E(X
2) – [E(X)]
2.
iv) Theo iii) ta có:
22D(X Y) E(X Y) E(X Y)
= 22 2E(X 2XY Y ) E(X) E(Y)
44
D(X Y) = E(X2) + E(2XY) + E(Y
2) – [E(X)]
2 2E(X).E(Y) –
[E(Y)]2 = E(X
2) 2E(X).E(Y) + E(Y
2) – [E(X)]
2 2E(X).E(Y) –
[E(Y)]2 = E(X
2) – [E(X)]
2 + E(Y
2) – [E(Y)]
2 = D(X) + D(Y).
Ví dụ 5. Cho X là ĐLNN rời rạc có bảng phân phối xác suất
X 0 1 2
P 0,4 0,2 0,4
Tính phƣơng sai của ĐLNN X?
Giải. Ta có E(X) = 1.
E(X2) = 0
2.0,4 + 1
2.0,2 + 2
2.0,4 = 1,8.
Vậy D(X) = E(X2) – (E(X))
2 = 1,8 – 1 = 0,8.
Ví dụ 6. Cho X là ĐLNN liên tục có hàm mật độ xác suất nhƣ sau:
2
0 khi t (0,3)
f(t) t khi t 0,3 .
9
Tính phƣơng sai của ĐLNN X.
Giải. Cách 1. Ta có D(X) = E(X2) – (E(X))
2; Theo ví dụ 10,
E(X) = 9
4.
E(X2) =
0 3
2 2 2 2
0 3
t f(t)dt t f(t)dt t f(t)dt t f(t)dt
35
0
t 2435,467
45 45 .
Vậy D(X) =
2243 9 27
0,33645 4 80
.
Cách 2. 2 23 2
0
9 9 tD(X) t f(t)dt t dt
4 4 9
45
D(X)
35 4 3
0
t t 9t 27+ 0,336
45 8 48 80
.
2.3.2.3. Ý nghĩa. Phƣơng sai của ĐLNN X để đo mức độ phân tán
của các giá trị của ĐLNN X quanh giá trị kỳ vọng toán E(X). Phƣơng
sai càng lớn thì độ phân tán càng nhiều, phƣơng sai càng nhỏ thì độ
phân tán càng ít.
Ví dụ 7. Một nhà đầu tƣ đang cân nhắc giữa việc đầu tƣ vào hai dự
án A và B trong hai lĩnh vực độc lập nhau. Khả năng thu hồi vốn sau 2
năm (tính bằng %) của hai dự án là các ĐLNN có bảng phân phối xác
suất nhƣ sau:
Dự án A:
XA 65 67 68 69 70 71 73
P 0,04 0,12 0,16 0,28 0,24 0,08 0,08
Dự án B:
XB 66 68 69 70 71
P 0,12 0,28 0,32 0,2 0,08
Từ các bảng phân phối ta tìm đƣợc:
E(XA) = 69,16%; D(XA) = 3,094.
E(XB) = 68,72%; D(XB) = 1,802.
Nhƣ vậy nếu cần chọn phƣơng án đầu tƣ sao cho tỷ lệ thu hồi vốn
có kỳ vọng cao hơn thì nên chọn dự án A, song nếu cần chọn phƣơng
án đầu tƣ sao cho độ rủi ro của tỷ lệ thu hồi vốn thấp hơn tức khả năng
thu hồi vốn ổn định hơn thì ta nên chọn dự án B.
2.3.3. Độ lệch chuẩn. Độ lệch chuẩn của ĐLNN X đƣợc ký hiệu
là σ và đƣợc xác định bởi công thức: σ = D(X) .
Ta thấy rằng đơn vị đo của phƣơng sai bằng bình phƣơng đơn vị
đo của ĐLNN. Vì vậy khi cần đánh giá mức phân tán của ĐLNN theo
đơn vị đo của nó ngƣời ta thƣờng tính độ lệch chuẩn.
2.3.4. Trung vị
46
2.3.4.1. Định nghĩa. Cho X là một ĐLNN, nếu tồn tại số thực a
sao cho 1
P(X a)2
và 1
P(X a)2
thì số a đƣợc gọi là trung vị
của ĐLNN X và ký hiệu là a = med(X).
2.3.4.2. Hệ quả
i) Nếu X là ĐLNN rời rạc và có i
i
x a
1p
2
i
i
x a
1và p
2
thì med(X) = a;
ii) Nếu X là ĐLNN liên tục và có F(a) = 1
2
a1
(hay f (t)dt )2
thì med(X) a.
Ví dụ 8. Tìm trung vị của ĐLNN X có bảng phân phối xác suất:
X 1 2 3 4
P 0,4 0,3 0,2 0,1
Giải. Ta có P(X < 2) = P(X = 1) = 0, 4 < 1
2;
P(X > 2) = P(X = 3) + P(X = 4) = 0,3 < 1
2. Do đó med(X) = 2.
Ví dụ 9. Tìm trung vị của ĐLNN X có hàm phân phối xác suất nhƣ
sau:
2
0 khi x 0
xF(x) khi 0 x 30
900
1 khi 30 x
Giải. Ta có
22a 1
a 4501F a a 15 2.900 2
2 0 a 300 a 30
Vậy trung vị của ĐLNN X là med(X) = 15 2 .
47
Nhận xét. - Số trung vị là số đặc trƣng cho giá trị trung tâm của
ĐLNN.
- Đối với ĐLNN rời rạc có thể có nhiều số trung vị, nhƣng đối với
ĐLNN liên tục chỉ có duy nhất một số trung vị.
2.3.5. Số mốt
Định nghĩa. i) Cho X là ĐLNN rời rạc, nếu có P(X = a) =
max{P(X = ai)} = max{pi}, i = 1, 2, ..., n thì số a đƣợc gọi là số mốt
của X.
ii) Cho X là ĐLNN liên tục có hàm mật độ phân phối xác suất là
f(t) đạt giá trị lớn nhất tại t = a trên thì a gọi là số mốt của X.
Ký hiệu: a = Mod(X).
Ví dụ 10. 1) Tìm số mốt của ĐLNN X chỉ tổng số chấm trên 2 mặt
xảy ra khi gieo ngẫu nhiên 2 con xúc xắc.
Giải. Ta có bảng phân phối xác suất của ĐLNN X là:
X 2 3 4 5 6 7 8 9 10 11 12
P 1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
Ta có P(X = 7) = 6/36 = 1/6 = ii 1,11max p
Mod(X) = 1/36.
2) Tìm số mốt của ĐLNN liên tục X có hàm mật độ phân phối xác
suất là:
2
1f (t) , t .
(1 t )
Giải. Ta có 2
2
1 1(1 t ) 0, t , t
(1 t )
.
Do đó t
1max f (t)
, tại t = 0 Mod(X) = 0.
48
BÀI TẬP CHƢƠNG 2
Bài 2.1. Trong một hộp có 6 quả cầu trắng, 4 quả cầu đỏ. Lấy ngẫu
nhiên 1 quả cầu. Gọi X là số quả cầu đỏ đƣợc lấy ra. Lập bảng phân
phối xác suất của X.
Đ/s:
X 0 1
P 3
5
2
5
Bài 2.2. Một ngƣời đƣợc phát 3 viên đạn để bắn lần lƣợt vào bia
cho đến khi trúng với xác suất bắn trúng mỗi viên là 0,8. Lập bảng
phân phối xác suất của số viên đạn đƣợc bắn ra.
Đ/s: Gọi X là ĐLNN chỉ số viên đạn đƣợc bắn ra.
X 0 1 2 3
P 0,008 0,8 0,16 0,032
Bài 2.3. Một hộp có 8 sản phẩm trong đó có 2 phế phẩm, 6 chính
phẩm.
a. Lấy ngẫu nhiên 3 sản phẩm. Gọi X là số chính phẩm có trong 3
sản phẩm lấy ra. Lập bảng phân phối xác suất của X.
b. Lấy lần lƣợt từng sản phẩm một cho tới khi lấy đƣợc chính
phẩm thì thôi. Gọi Y là số sản phẩm đƣợc lấy ra. Lập bảng phân phối
xác suất của Y, tính kỳ vọng và phƣơng sai.
c. Lấy lần lƣợt từng sản phẩm cho tới khi lấy đƣợc 2 chính phẩm
thì thôi. Gọi Z là số sản phẩm đƣợc lấy ra. Lập bảng phân phối xác
suất của Z.
Đ/s: a. Ta có bảng phân phối xác suất của X.
X 1 2 3
P 3
28
15
28
5
14
b. Bảng phân phối xác suất của Y.
49
Y 1 2 3
P 6
8
3
14
1
28
c. Bảng phân phối xác suất của Z.
Z 2 3 4
P 15
28
5
14
3
28
Bài 2.4. Gieo đồng thời 2 con xúc xắc cân đối đồng chất. Gọi
X là tổng số chấm xuất hiện ở 2 mặt con xúc xắc.
a. Lập bảng phân phối xác suất của X.
b. Lập hàm phân phối xác suất của X.
Đ/s: a. Bảng phân phối xác suất của X.
X 2 3 4 5 6 7 8 9 10 11 12
P 1
36
1
18
1
12
1
9
5
36
1
6
5
36
1
9
1
12
1
18
1
36
Bài 2.5. Trong một cái bát có 5 hạt đậu trong đó có 2 hạt đậu
đỏ. Lấy ngẫu nhiên ra 2 hạt. Gọi X là số hạt đậu đỏ đƣợc lấy ra.
a. Lập bảng phân phối xác suất của X.
b. Lập hàm phân phối xác suất của X.
c. Tính P(0 < X < 3)
Đ/s: a. Bảng phân phối xác suất của X là:
X 2 3 4
P 3
10
3
5
1
10
c. P(0 < X < 3) = 7/10.
Bài 2.6. Cho X là ĐLNN có bảng phân phối xác suất nhƣ sau:
X 2 3 5
P 0,3 0,5 0,2
a. Tính E(X), D(X).
b. Tìm hàm phân phối xác suất của X.
c. Tính E(3X – 2).
50
d. Tính D(3X – 2).
e. Tìm số mod(X) và Trung vị của X.
Bài 2.7. Cho ĐLNN X có bảng phân phối
X 1 3 4
P 0,1 0,4 + m 0,2 + 2m
a. Tìm m.
b. Tìm E(X), D(X).
c. Tìm hàm phân phối xác suất của X.
d. Tính P(2 < X < 5).
e. Tìm số mod(X) và Trung vị của X.
Bài 2.8. Cho ĐLNN X có hàm phân phối xác suất:
2
0 0
( ) 0 1
1 1
khi x
F x mx khi x
khi x
a. Tìm m.
b. Tìm hàm mật độ phân phối xác suất của X.
c. Tìm xác suất để giá trị ĐLNN X thuộc khoảng (0,25; 0,75).
d. Tính kỳ vọng, phƣơng sai của ĐLNN X.
Đ/s: a. m = 1.
b.
0 0
( ) '( ) 2 0 1
0 1
khi x
f x F x x khi x
khi x
c. P(0,25 < X < 0,75) = 0,5.
d. E(X) = 2/3; D(X) = 1/18.
Bài 2.9. Cho ĐLNN X có hàm mật độ phân phối xác suất:
mcos ;2 2
( )
0 ;2 2
x khi x
f x
khi x
a. Tìm m.
51
b. Tìm hàm phân phối xác suất của X.
c. Tìm xác suất để giá trị ĐLNN X thuộc khoảng (0; /4).
d. Tính kỳ vọng, phƣơng sai của ĐLNN X.
Đ/s: a. m = 1/2.
b.
0 2
1( ) (sinx 1) -
2 2 2
1 2
khi x
F x khi x
khi x
c. 2
4.
d. E(X) = 0.
Bài 2.10. Thời gian xếp hàng chờ mua hàng của khách là ĐLNN
có hàm phân phối xác suất nhƣ sau (đơn vị phút)
3 2
0 0
( ) mx - 3x +2x 0 1
1 1
khi x
F x khi x
khi x
a. Tìm tham số m.
b. Tìm thời gian xếp hàng trung bình.
c. Tìm xác suất để trong 3 ngƣời xếp hàng thì có không quá 2
ngƣời phải chờ quá 0,5 phút.
Đ/s: a. m = 2; b. E(X) = 0,5; c. 0,875.
Bài 2.11. Cho X là ĐLNN có hàm phân phối xác suất nhƣ sau
0 0
1( ) - mcosx 0
2
1
khi x
F x khi x
khi x
a. Tìm tham số m.
b. Tìm P(0 < X < /2).
52
c. Tìm E(X).
Đ/s: a. m = 1/2; P(0 < X < /2) = 1/2; E(X) = /2.
Bài 2.12. Cho X1, X2, X3 là các ĐLNN độc lập và có bảng phân
phối xác suất của chúng nhƣ sau:
X1 0 1 X2 1 2 X3 0 2
P 0,6 0,4
P 0,4 0,6 P 0,8 0,2
Đặt 1 2 3X X XX
3
. Tính E(X);D(X).
Đ/s: E(X) 0,8;D(X) 0,12.
53
Chƣơng 3
MỘT SỐ QUY LUẬT PHÂN PHỐI
XÁC SUẤT THƢỜNG GẶP
Trong thực tế, mỗi ĐLNN đều tuân theo một quy luật phân phối
xác suất nào đó và ngƣợc lại mỗi quy luật phân phối xác suất lại tƣơng
ứng với một lớp các ĐLNN. Vì vậy phân loại các ĐLNN theo từng
quy luật phân phối xác suất giúp cho việc sử dụng chúng đƣợc dễ
dàng hơn. Ở trong chƣơng này, chúng tôi giới thiệu một số qui luật
phân phối xác suất thƣờng gặp với các ĐLNN rời rạc và liên tục. Mỗi
quy luật phân phối xác suất sẽ đƣợc giới thiệu dạng phân phối và các
tham số đặc trƣng cơ bản của nó.
3.1. MỘT SỐ QUY LUẬT PHÂN PHỐI XÁC SUẤT RỜI RẠC
3.1.1. Qui luật phân phối xác suất Không – Một
3.1.1.1. Định nghĩa
ĐLNN rời rạc X đƣợc gọi là ĐLNN có quy luật phân phối
không – một với tham số p (0 < p < 1) nếu bảng phân phối xác suất
của X có dạng:
X 0 1
P 1 – p p
Ký hiệu ĐLNN có phân phối không – một với tham số p là: A(p)
hay X A(p).
Ví dụ 1. 1) ĐLNN X chỉ số mặt N xuất hiện khi gieo ngẫu nhiên 1
đồng xu là ĐLNN có quy luật phân phối không – một với tham số
p = 1/2.
2) ĐLNN Y chỉ số mặt chấm 1 xuất hiện khi gieo một con xúc xắc
là ĐLNN có quy luật phân phối không – một với tham số p = 1/6.
3.1.1.2. Các tham số đặc trưng
Cho X là ĐLNN có quy luật phân phối A(p). Khi đó:
E(X) = 0.(1 – p) + 1.p = p.
Nhƣ vậy: E(X) = p.
E(X2) = 0
2.(1 – p) + 1
2.p = p .
Do đó: D(X) = E(X2) – [E(X)]
2 = p – p
2 = p(1 – p).
54
3.1.2. Quy luật phân phối xác suất nhị thức
3.1.2.1. Định nghĩa
ĐLNN rời rạc X đƣợc gọi là ĐLNN có quy luật phân phối nhị
thức nếu X có bảng phân phối dạng:
X 0 ... k ... n
P 0 0 n
nC p q ... k k n k
nC p q ... n n 0
nC p q
với 0 < p < 1, q = 1 – p.
Khi X có phân phối nhị thức ta ký hiệu X B(n,p) ; n, p gọi là các
tham số của phân phối nhị thức.
Ví dụ 2. Xác suất để một cây sống sau một thời gian trồng là p
(0 < p < 1). Trồng 1000 cây, gọi X là số cây sống sau một thời gian
trồng. Khi đó X là một ĐLNN có phân phối nhị thức B(1000, p).
3.1.2.2. Các tham số đặc trưng
Cho X là ĐLNN có quy luật phân phối B(n, p). Khi đó:
E(X) = np; D(X) = np(1 – p) = npq.
Chứng minh: Áp dụng công thức khai triển nhị thức Newton, ta
có: n n
n k k n k n 1 k k 1 n k
n n
k 0 k 1
(q x) C x q n(q x) kC x q
n
n 1 k k 2 n k
n
k 1
n(n 1)(q x) k(k 1)C x q
.
Thay x = p, ta đƣợc: n
k k 1 n k
n
k 1
n kC p q
và n
k k 2 n k
n
k 1
n(n 1) k(k 1)C p q
.
Ta có: n n
k k n k k k 1 n k
n n
k 0 k 1
E(X) kC p q p kC p q pn
.
n n n2 2 k k n k k k n k k k n k
n n n
k 0 k 0 k 0
E(X ) k C p q k(k 1)C p q kC p q
55
n n
2 2 k k 2 n k k k n k 2
n n
k 1 k 0
E(X ) p k(k 1)C p q kC p q n(n 1)p np
.
2 2D(X) n(n 1)p np (np) np(1 p) npq.
Ví dụ 3. Một xạ thủ bắn 20 phát vào bia, xác suất trúng đích của mỗi
phát là 0,8.
a) Tính xác suất để bắn 20 phát có 18 phát trúng.
b) Tìm số phát trúng trung bình khi bắn 20 phát.
c) Tìm xác suất để có ít nhất 18 phát trúng.
Giải. Gọi X là số phát bắn trúng đích khi bắn 20 phát. Khi đó X là
ĐLNN có phân phối nhị thức với tham số n = 20, p = 0,8.
a) Do đó xác suất để trong 20 phát có 18 phát trúng là:
P(X = 18) = 18 18 2
20 (0,8) (1 0,8)C b) Số phát trúng trung bình khi bắn 20 phát là: E(X) = np = 20.0,8 = 16
c) Xác suất để trong 20 phát bắn có ít nhất 18 phát trúng là:
P(18 ≤ X ≤ 20) = P(X = 18) + P(X = 19) + P(X = 20) 18 18 2 19 19 1 20 20 0
20 20 20(0,8) (1 0,8) (0,8) (1 0,8) (0,8) (1 0,8) .C C C 3.1.3. Quy luật phân phối xác suất Poisson
3.1.3.1. Định nghĩa
ĐLNN rời rạc X đƣợc gọi là ĐLNN có phân phối quy luật Poisson
nếu X có bảng phân phối:
X 0 ... k ... n ...
P λe ... λ ke λ
k!
... λ ne λ
n!
...
trong đó > 0 là tham số.
Ký hiệu X có phân phối Poisson với tham số là X P().
Ví dụ 4. Số nguyên tử bị phân hủy trong một quảng thời gian của
trình phân rã các nguyên tố phóng xạ là một ĐLNN có quy luật phân
phối Poisson.
56
3.1.3.2. Các tham số đặc trưng
Cho X là ĐLNN có phân phối Poisson với tham số . Khi đó:
E(X) = ; D(X) = .
3.1.3.3. Mối liên hệ giữa phân phối B(n, p) với phân phối P()
Giả sử X B(n, p) . Khi n lớn, p khá bé thì X có phân phối xấp xỉ
phân phối Poisson với tham số = np. Khi đó:
P(X = k) = λ k
k k n k
n n
e λP (k) = C p (1 p) .
k!
Trong thực tế công thức Poisson có thể dùng thay cho công thức
Bernoulli nếu thỏa mãn n 20 và p 0,1 (tức là np np(1 - p)).
Ví dụ 5. Gieo 1000 hạt giống biết xác suất không nảy mầm của 1
hạt là 0,005. Tìm xác suất để trong 1000 hạt đó có 10 hạt không nảy
mầm.
Giải. Gọi X là số hạt giống không nảy mầm khi gieo 1000 hạt thì
X là 1 ĐLNN có phân phối nhị thức với tham số n = 1000, p = 0,005.
Ta có n = 1000 khá lớn, p = 0,005 khá bé. Khi đó áp dụng phân
phối Poisson ta đƣợc xác suất để có 10 hạt không nảy mầm khi gieo
1000 hạt giống:
P(X = 10) = 5 10
10 990 10
1000
5(0,995) (0,005) .
10!
e
C
3.2. MỘT SỐ QUY LUẬT PHÂN PHỐI XÁC SUẤT LIÊN TỤC
3.2.1. Quy luật phân phối đều U[a, b]
Quy luật phân phối đều là quy luật phân phối đơn giản nhất trong
các quy luật phân phối xác suất của ĐLNN liên tục.
3.2.1.1. Định nghĩa
ĐLNN liên tục X đƣợc gọi là phân phối theo quy luật đều trong
đoạn [a, b] nếu hàm mật độ xác suất của nó có dạng:
1khi x a,b
f (t) b a
0 khi x a,b
[ ]
[ ]
3.2.1.2. Các tham số đặc trưng
57
Kỳ vọng:
bb 2
a a
t t b aE(X) tf (t)dt dt .
b a 2(b a) 2
Phƣơng sai: D(X) = E(X2) – [E(X)]
2
D(X) 2 2b 2
2
a
b a t b at f (t)dt dt
2 b a 2
b 23
a
t b a
3(b a) 2
= 222 2 b ab ab a a b.
3 2 12
Quy luật phân phối đều có ứng dụng rộng rãi trong thống kê
toán. Trong một số kết luận về lý thuyết thống kê ngƣời ta thƣờng
xuất phát từ quy tắc sau đây: Nếu ta không biết gì về giá trị của tham
số cần ƣớc lƣợng thì mỗi giá trị có thể có của tham số đó là đồng khả
năng. Điều đó dẫn tới việc quan niệm tham số cần ƣớc lƣợng nhƣ một
ĐLNN tuân theo quy luật phân phối đều.
Ví dụ 1. Khi thâm nhập thị trƣờng mới, doanh nghiệp không thể
khẳng định đƣợc một cách chắc chắn doanh số hàng tháng có thể đạt
đƣợc sẽ là bao nhiêu mà chỉ dự kiến đƣợc rằng doanh số tối thiểu sẽ là
20 triệu đồng/tháng và tối đa là 40 triệu đồng/tháng. Tìm xác suất để
doanh nghiệp đạt đƣợc doanh số tối thiểu là 35 triệu đồng/tháng.
Giải. Gọi X là doanh số hàng tháng mà doanh nghiệp đó có thể đạt
đƣợc ở thị trƣờng đó.
Do không có thông tin gì hơn về X nên ta có thể xem X là ĐLNN
có phân phối đều trên khoảng (20, 40).
Vậy hàm mật độ phân phối xác suất của X là:
40 200,05 khi x (20,40)
f (t) 2
0 khi x (20,40)
58
Từ đó xác suất để doanh nghiệp đạt đƣợc doanh số tối thiểu là 35
triệu đồng/tháng đƣợc tìm theo tính chất của hàm mật độ phân phối
xác suất nhƣ sau:
P(X > 35) = 40
40
35
35 35
f (t)dt 0,05dt 0,05 0,25.
3.2.1. Quy luật phân phối chuẩn
3.2.1.1. Định nghĩa
ĐLNN liên tục X nhận các giá trị trên (- ∞, + ∞) đƣợc gọi là phân
phối theo quy luật chuẩn với tham số µ và > 0, ký hiệu là
X N(µ, 2), nếu hàm mật độ xác suất của X có dạng:
21 x μ
2 σ1f(x)
σ 2πe
Đặc biệt: Khi µ = 0, = 1 thì phân phối chuẩn N(0, 1) đƣợc gọi là
phân phối chuẩn hóa hay chuẩn tắc.
3.2.1.2. Các tham số đặc trưng
Cho X là ĐLNN có quy luật phân phối chuẩn N(µ, 2), khi đó:
E(X) = µ; D(X) = 2; Med(X) = µ; Mod(X) = µ.
3.2.1.3. Định lý
Nếu ĐLNN X có phân phối chuẩn N(µ, 2) thì ĐLNN
X μY =
σ
có phân phối chuẩn tắc N(0, 1).
3.2.1.4. Hàm số La-pla-ce
Hàm số đƣợc ký hiệu và xác định nhƣ sau đƣợc gọi là hàm La–
pla–ce:
2x t
2
0
1(x) e dt, x ( ; )
2π
.
Các giá trị hàm La-pla-ce đƣợc tính theo bảng 1.
a) Tính chất
i) (x) là hàm số lẻ: (– x) = – (x);
ii) (x) là hàm tăng thực sự: x1 < x2 (x1) < (x2);
iii) 1 1
lim (x) ; lim (x) ;2 2
x x
59
iv) Nếu F(x) là hàm phân phối xác suất của ĐLNN X có phân phối
chuẩn N(µ, 2) thì:
F(x) = P(X < x) =
21 t μx x
2 σ1 1 x μf(t)dt .
2 σσ 2πe dt
và từ đó ta có:
P(α < x < β) = P(α ≤ x < β) = P(α < x ≤ β)
= F(β) – F(α) = β μ α μ
.σ σ
b) Hệ quả. X có phân phối chuẩn N(µ, 2), với mọi > 0 ta có:
ε
P X μ ε 2 .σ
Chứng minh:
μ + ε μ μ ε μ
P X μ ε P μ ε X μ + ε σ σ
ε ε ε ε ε
2σ σ σ σ σ
.
Ví dụ 2. Cho X là ĐLNN có phân phối chuẩn E(X) = 3, = 2.
Tính P(X < 2); P(X > 1,5); P(1,3 < X < 2).
Giải. Ta có 1 2 3 1 1 1
P(X 2) 0,52 2 2 2 2
= 0,5 – 0,192 = 0,308.
1
P(X 1,5) 1 P(X 1,5) 1 0,752
0,5 0,75 0,5 0,75
= 0,5 + 0,273 = 0,773.
0,5 0,85 0,191 0,302 0,111 .
Ví dụ 3. Các vòng bi do một máy tự động sản xuất ra đƣợc coi là
đạt tiêu chuẩn nếu đƣờng kính của nó sai lệch so với đƣờng kính thiết
kế không quá 0,7 mm. Biết rằng sai lệch này là ĐLNN có phân phối
chuẩn với = 0 và = 0,4 mm. Tìm tỷ lệ vòng bi đạt tiêu chuẩn của
máy đó.
60
Giải. Tỷ lệ vòng bi đạt tiêu chuẩn chính là xác suất để lấy một
vòng bi đạt tiêu chuẩn. Nếu gọi X là độ sai lệch giữa đƣờng kính của
vòng bi sản xuất ra với đƣờng kính vòng bi thiết kế thì vòng bi đạt tiêu
chuẩn khi X 0,7 .
Do đó ta có:
P( X 0,7) P( X 0,7) 0,7
2 2 1,75 0,9189.0,4
3.2.1.5. Định nghĩa. Cho U N(0, 1) và 0 < α < 1 cho trƣớc. Khi
đó giá trị Uα thỏa mãn P(U > Uα) = α đƣợc gọi là phân vị chuẩn mực α.
Tính chất. i) U1 – α = – Uα;
ii) (Uα) = 0,5 – α.
Ví dụ 4. Tìm U0,025; U0,975; U0,05.
Giải. Ta có: (U0,025) = 0,5 – 0,025 = 0,475 = (1,96) U0,025 = 1,96.
U0,975 = – U1 – 0,975 = – U0,025 = – 1,96.
(U0,05) = 0,5 – 0,05 = 0,45 (1,64) U0,05 = 1,64.
3.2.1.6. Một số định lý về phân phối chuẩn
a) Định lý. Cho C là hằng số, ĐLNN X N(µ, 2). Khi đó:
CX N(Cµ, C2
2); X C N(µ C,
2)
b) Định lý. Giả sử n ĐLNN X1, X2, ..., Xn độc lập và
Xi N(µi, i2) ( i 1,n ). Khi đó: X = X1 + X2 + ... + Xn là ĐLNN có
phân phối chuẩn N(µ, 2) với µ = µ1 + µ2 + ... + µn và
2 = 1
2 + 2
2 +
...+ n2.
c) Định lý Lindeberg – Levy. Nếu Xi N(µ, 2) ( i 1,n ) n khá lớn
và n ĐLNN Xi độc lập với nhau thì ĐLNN n
2
i
i 1
X X N(n ,n )
và2n
i
i 1
1Y X N ,
n n
. Tức là với n khá lớn thì:
P(X < x)1 x μ
2 σ
n
n
và P(Y < x)
1 (x μ) n
2 σ
,
với là hàm La-pla-ce.
61
c) Định lý Moa-vơ-rơ. Cho X B(n, p) .Với n khá lớn thì ĐLNN X
xấp xỉ có phân phối chuẩn N(np, np(1 – p)).
Tức là P(α < x < β) = P(α ≤ x < β) = P(α < x ≤ β) = P(α ≤ x ≤ β)
= β np α np
np(1 p) np(1 p)
.
với là hàm La-pla-ce.
Ví dụ 5. Gieo ngẫu nhiên độc lập 10000 lần một đồng xu cân đối.
Tính xác suất để trong 10000 lần gieo đó có số lần mặt ngửa (N) xuất
hiện nằm trong khoảng (5050; 5100).
Giải. Gọi X là số lần mặt N xuất hiện trong 10000 lần gieo đó, ta
có X là ĐLNN có phân phân phối nhị thức B(10000; 0,5). Xác suất
cần tìm là P(5050 < X < 5100).
Vì n khá lớn nên X xấp xỉ có phân phối chuẩn N(5000; 25002), do
đó:
P(5050 < X < 5100) = 5100 10000.0,5 5050 10000.0,5
10000.0,5.0,5 10000.0,5.0,5
= 2 1 0,474 0,314 0,160 .
Ví dụ 6. Một công ty bảo hiểm, bảo hiểm 10000 xe máy. Mỗi chủ
xe phải nộp 100000 đồng/năm và trung bình nhận lại 5 triệu đồng nếu
xe của họ bị tai nạn giao thông. Qua thống kê biết tỷ lệ để 1 xe máy bị
tai nạn giao thông trong 1 năm là 0,006. Tìm xác suất để:
a) Sau 1 năm hoạt động công ty bị lỗ.
b) Sau 1 năm hoạt động công ty lãi ít nhất 800 triệu.
Giải. a) Gọi X là số xe bị tai nạn giao thông trong một năm, ta có
X là ĐLNN có phân phối nhị thức n = 10000; p = 0,006.
np = 60; np(1 – p) = 59,69; np(1 p) 7,726 .
Công ty bị lỗ khi số xe tai nạn lớn hơn 200 chiếc (vì khi đó số tiền
chi trả nhiều hơn số tiền thu vào).
Gọi A là biến cố công ty bảo hiểm bị lỗ trong 1 năm.
Ta có: A = (200 X 10000). Vì n khá lớn nên:
62
P(A) = 10000 60 200 60
060.0,994 60.0,994
.
Vậy xác suất công ty bị lỗ sau 1 năm hoạt động là 0.
b) Công ty lãi ít nhất 600 triệu khi số xe bị tai nạn nhỏ hơn hoặc
bằng 80 chiếc, vì khi đó số tiền chi trả cho xe bị tai nạn nhỏ hơn số
tiền thu vào là 400 triệu.
Gọi B là biến cố sau 1 năm hoạt động công ty lãi ít nhất 600 triệu
đồng.
P(B) = 80 60 80 60
(0 80) 0,99560.0,994 60.0,994
P X
.
3.2.2. Quy luật phân phối – bình phƣơng
3.2.2.1. Định nghĩa. Cho dãy ĐLNN X1, X2, ..., Xn có phân phối
chuẩn hóa N(0, 1). Khi đó ĐLNN n
2 2
i
i 1
χ X
sẽ phân phối theo quy
luật - bình phương (khi bình phƣơng) với n bậc tự do, ký hiệu là: 2 2χ χ (n) .
Hàm mật độ phân phối xác suất của ĐLNN 2 có dạng:
x n1
2 2n
2
0 khi x 0
1f (x) e .x khi x 0
n2 .
2
trong đó x 1 t
0
(x) t e dt
là hàm Gamma.
3.2.2.2. Các tham số đặc trưng
Cho 2χ là ĐLNN có phân phối theo quy luật khi bình phƣơng với
n bậc tự do, khi đó: E(2) = n; D(
2) = 2n.
3.2.2.3. Định nghĩa. Cho 2 2χ χ (n) và 0 < α < 1 cho trƣớc. Khi
đó giá trị 2
αχ (n) sao cho 2 2
αP(χ > χ (n)) = α đƣợc gọi là phân vị khi
bình phương n bậc tự do.
Các giá trị phân vị 2
αχ (n) đƣợc tính sẵn thành bảng 3a, bảng 3b.
63
Ví dụ 7. (Tra bảng 3b) 2
0,05χ (14) 23,685 ; 2
0,01χ (24) 42,980 .
3.2.3. Quy luật phân phối Student – T(n)
3.2.3.1. Định nghĩa. Nếu U N(0, 1), 2 2χ χ (n) thì ĐLNN
2
UT
χ
n
sẽ phân phối theo quy luật Student với n bậc tự do, ký hiệu
là: T T(n) .
3.2.3.2. Các tham số đặc trưng
Cho T là ĐLNN có phân phối Student với n bậc tự do, khi đó:
E(T) = 0; D(T) = n
n 2.
3.2.3.3. Định nghĩa. Cho T T(n) và 0 < α < 1 cho trƣớc. Khi đó
giá trị αt (n) sao cho αP(T > t (n)) = α đƣợc gọi là phân vị Student n
bậc tự do với mức ý nghĩa α.
Các giá trị phân vị αt (n) đƣợc tính sẵn thành bảng 2.
Nhận xét: i) α 1 αt (n) = t (n) ;
ii) Với n 30 thì α αt (n) = U .
Ví dụ 8. 0,025t (8) 2,306 ;
0,99 1 0,01 0,01t (24) t (24) t (24) 2,492 ;
0,005 0,005t (35) U =2,57 .
64
BÀI TẬP CHƢƠNG 3
Bài 3.1. Gieo một con xúc xắc đối xứng và đồng chất. Tìm quy
luật phân phối xác suất và các tham số đặc trƣng của số lần xuất hiện
mặt 6 chấm.
Đ/s: Gọi X là số lần xuất hiện của mặt 6 chấm khi gieo con xúc
xắc. 1 5
E(X) ;D(X)6 36
.
Bài 3.2. Điều tra ý kiến của khách hàng đối với sản phẩm của
doanh nghiệp thì thấy có 60% khách hàng thích sản phẩm đó. Tìm quy
luật phân phối xác suất và các tham số đặc trƣng của thái độ ƣa thích
của khách hàng đối với sản phẩm.
Đ/s: Gọi X là ĐLNN chỉ thái độ ƣa thích của khách hàng đối với
sản phẩm.
X A(0,6). E(X) = 0,6. D(X) = 0,24.
Bài 3.3. Bắn 5 viên đạn vào mục tiêu. Xác xuất trúng đích của mỗi
lần bắn nhƣ nhau và bằng 0,2. Muốn phá hủy mục tiêu phải có ít nhất
3 viên trúng mục tiêu. Tính xác suất để mục tiêu bị phá hủy.
Đ/s: P = 0,0579.
Bài 3.4. Gieo 10.000 hạt giống với xác suất để mỗi hạt giống nảy
mầm là 0,85. Gọi X là số hạt nảy mầm. Hỏi X tuân theo quy luật phân
phối xác suất gì? Tìm E(X), D(X).
Bài 3.5. Tổng đài điện thoại phục vụ 100 máy điện thoại. Xác suất
để trong mỗi phút mỗi máy gọi đến tổng đài là 0,02. Tìm số máy gọi
đến tổng đài trung bình trong 1 phút.
Đ/s: 2 máy.
Bài 3.6. Cho U N(0, 1). Tìm các xác suất sau:
a. P(U > 1,96) b. P(U > 1,64) c. P(U < - 1,64)
d. P(U < 1,64) e. P(1 < U < 1,5) d. P(-1 < U < 2).
Bài 3.7. Cho X N(10, 25). Tìm các xác suất sau:
a. P(X > 20) b. P(20 < X < 25)
c. P(X < 10) d. P(12 < X < 24).
65
Bài 3.8. Trong hệ thống tỷ giá hối đoái thả nổi, sự biến động của
tỷ giá hối đoái chịu sự tác động của rất nhiều nhân tố và có thể xem
nhƣ biến ngẫu nhiên phân phối chuẩn. Giả sử ở một giai đoạn nào đó
tỷ giá của USD với VNĐ có trung bình là 15000đ và độ lệch chuẩn là
500đ. Tìm xác suất để trong một ngày nào đó.
a. Tỷ giá sẽ cao hơn 16000đ.
b. Tỷ giá sẽ thấp hơn 14500đ.
c. Tỷ giá sẽ nằm trong khoảng từ 14500 đến 16500đ.
Bài 3.9. Trọng lƣợng sản phẩm X do một máy tự động sản xuất là
ĐLNN tuân theo quy luật chuẩn với E(X) = 100 gam và độ lệch chuẩn
1 gam. Sản phẩm đƣợc coi là đạt tiêu chuẩn kỹ thuật nếu trọng lƣợng
của nó đạt từ 98 đến 102 gam.
a. Tìm tỷ lệ sản phẩm đạt tiêu chuẩn của nhà máy.
b. Tìm tỷ lệ phế phẩm của nhà máy.
Đ/s: a. 95,44%; b. 4,56%.
66
Chƣơng 4
ĐẠI LƢỢNG NGẪU NHIÊN HAI CHIỀU
Ở các chƣơng trƣớc chúng ta đã xét các ĐLNN mà tập giá trị có
thể của chúng đƣợc biểu diễn bằng một số thực, đó là các ĐLNN một
chiều. Ngoài ĐLNN một chiều, trong thực tế chúng ta còn gặp các
biến số mà tập giá trị đƣợc xác định bằng bộ n số (x1, x2, ..., xn) với
n 2, những ĐLNN này gọi là ĐLNN n chiều. Việc nghiên cứu
ĐLNN nhiều chiều cho ta xác định đƣợc quy luật xác suất của nó cũng
nhƣ việc tác động qua lại giữa các thành phần với nhau. Trong kinh tế
và xã hội thì điều này rất quan trọng, chẳng hạn muốn đánh giá ảnh
hƣởng của thu nhập đến tiêu dùng nhƣ thế nào ta xét một ĐLNN hai
chiều là thu nhập và tiêu dùng.
4.1. ĐỊNH NGHĨA. Cho X1, X2, ..., Xn là n ĐLNN cùng liên kết
với một phép thử có không gian mẫu . Bộ (X1, X2, ..., Xn) đƣợc gọi
là đại lượng ngẫu nhiên n chiều, nếu x1, x2, ..., xn là n giá trị tƣơng
ứng của X1, X2, ..., Xn thì bộ số thực (x1, x2, ..., xn) gọi là giá trị của
ĐLNN n chiều (X1, X2, ..., Xn).
Ví dụ 1. Gieo ngẫu nhiên một lần 2 con xúc xắc, gọi X1, X2 là 2
ĐLNN tƣơng ứng là chỉ số chấm xuất hiện của con xúc xắc thứ nhất
và thứ 2. Khi đó ĐLNN (X1, X2) có 36 giá trị là (x1, x2) = {(1, 1);
(1, 2); ...; (6, 6)}.
ĐLNN n chiều (X1, X2, ..., Xn) đƣợc gọi là ĐLNN n chiều rời rạc
nếu X1, X2, ..., Xn là các ĐLNN rời rạc; và gọi là ĐLNN n chiều liên
tục nếu X1, X2, ..., Xn là các ĐLNN liên tục.
Trong chƣơng này chúng ta chỉ nghiên cứu về ĐLNN hai chiều.
4.2. HÀM PHÂN PHỐI XÁC SUẤT CỦA ĐLNN HAI CHIỀU
4.2.1. Định nghĩa. Cho (X, Y) là ĐLNN hai chiều. Hàm số hai
biến số ký hiệu và xác định nhƣ sau gọi là hàm phân phối xác suất của
ĐLNN hai chiều.
F(x, y) P(X x;Y y), x, y .
trong đó biến cố (X x;Y y) (X x) (Y y) .
4.2.2. Tính chất
67
i) 0 F(x, y) 1 ;
ii) F(x, y) là hàm không giảm theo mỗi biến, nghĩa là:
1 2 1 2F(x , y) F(x , y), khi x x
và 1 2 1 2F(x, y ) F(x, y ), khi y y ;
iii) x y x
y
lim F(x, y) 0; lim F(x, y) 0; lim F(x, y) 0
;
x y x
y
lim F(x, y) F(y); lim F(x, y) F(x); lim F(x, y) 1
.
4.3. PHÂN PHỐI XÁC SUẤT CỦA ĐLNN HAI CHIỀU
4.3.1. Bảng phân phối xác suất của ĐLNN hai chiều rời rạc
4.3.1.1. Định nghĩa. Cho X, Y là hai ĐLNN ngẫu nhiên cùng liên
kết với một phép thử có miền giá trị lần lƣợt là DX = {x1, x2, ..., xn} và
DY = {y1, y2, ..., ym}.
Đặt pij = P(X = xi; Y = yj), i 1,n; j 1,m .
Khi đó bảng số có dạng dƣới đây gọi là bảng phân phối xác suất
của ĐLNN hai chiều (X, Y).
X
Y x1 x2 ... xi ... xn
y1 p11 p21 ... pi1 ... pn1
y2 p12 p22 ... pi2 ... pn2
... ... ... ... ... ... ...
yj p1j p2j ... pij ... pnj
... ... ... ... ... ... ...
ym p1m p2m ... pim ... pnm
Ví dụ 1. Cho X, Y là 2 ĐLNN chỉ số mặt ngửa xuất hiện của đồng
tiền thứ nhất và thứ 2 khi gieo ngẫu nhiên 2 đồng tiền cân đối.
Ta có tập giá trị của X là DX = {0, 1}; DY = {0, 1}.
11
1p P(X 0;Y 0) P(SS)
4 ;
21
1p P(X 1;Y 0) P(NS)
4 ;
68
12
1p P(X 0;Y 1) P(SN)
4 ;
22
1p P(X 1;Y 1) P(NN)
4 .
Vậy bảng phân phối của ĐLNN ngẫu nhiên hai chiều (X, Y) là:
X
Y 0 1
0 1
4
1
4
1
1
4
1
4
4.3.1.2. Tính chất. Cho (X, Y) là ĐLNN hai chiều rời rạc có bảng
phân phối nhƣ ở mục 4.3.1.1. Khi đó ta có:
i) 0 p 1, i 1,n, j 1,m ij ;
ii) m n n m
j 1 i 1 i 1 j 1
p p 1
ij ij;
iii) n
j j
i 1
p q P(Y y )
ij ; m
i i
j 1
p p P(X x )
ij.
Qua tính chất iii) ta thấy nếu biết phân phối của ĐLNN hai chiều
(X, Y) thì ta sẽ biết luật phân phối của các biến ngẫu nhiên X, Y.
Ví dụ 2. Cho X, Y là ĐLNN rời rạc có bảng phân phối xác suất
nhƣ sau:
X
Y 0 1 2
1 0,4 0,3 0
2 0 0,12 0,18
Khi đó: P(X = 0) = 0,4 + 0 = 0,4.
P(X = 1) = 0,3 + 0,12 = 0,42.
P(X = 2) = 0 + 0,18 = 0,18.
Vậy bảng phân phối của ĐLNN X là:
69
X 0 1 2
P 0,4 0,42 0,18
Tƣơng tự bảng phân phối của ĐLNN Y là:
Y 1 2
P 0,7 0,3
4.3.1.3. Định lý. Điều kiện cần và đủ để hai ĐLNN rời rạc X và Y
độc lập với nhau là pij = P(X = xi; Y = yj) = P(X = xi).P(Y = yj) = piqj ,
i 1,n; j 1,m .
Ví dụ 3. Cho X, Y là 2 ĐLNN chỉ số mặt ngửa xuất hiện của đồng
tiền thứ nhất và thứ 2 khi gieo ngẫu nhiên 2 đồng tiền cân đối. Khi đó
X và Y độc lập với nhau.
Ví dụ 4. Cho X, Y là ĐLNN rời rạc có bảng phân phối xác suất
nhƣ sau:
X
Y 0 1 2
1 0,4 0,3 0
2 0 0,12 0,18
Ta thấy X và Y phụ thuộc nhau, vì P(X = 0; Y = 1) = 0,4
P(X = 0)P(Y = 1) = 0,4.0,7.
4.3.2. Hàm mật độ phân phối xác suất của ĐLNN hai chiều liên tục
4.3.2.1. Định nghĩa. Cho ĐLNN hai chiều liên tục (X, Y) có hàm
phân phối xác suất là F(x, y). Nếu tồn tại hàm hai biến f(x, y) không
âm, khả tích trên 2 và thỏa mãn đẳng thức:
yx
F(x, y) f u,v dudv
thì hàm f(x, y) đƣợc gọi là hàm mật độ phân phối xác suất của ĐLNN
liên tục hai chiều (X, Y).
4.3.2.2. Tính chất. Cho f(x, y) là hàm mật độ phân phối xác suất
của ĐLNN hai chiều (X, Y). Khi đó ta có:
i) f x, y dxdy 1
;
70
ii) 2
D
P (X,Y) D f x, y dxdy, D ;
iii) Nếu F(x, y) có đạo hàm riêng cấp 2 hỗn hợp tại điểm 2(x, y) thì
"
xyF (x,y) f (x, y) ;
iv) Gọi fX(x), fY(y) là các hàm mật độ phân phối xác suất của
ĐLNN X, Y. Khi đó: Xf (x) f x, y dy
; Yf (y) f x, y dx
.
Ví dụ 5. Tìm hàm mật độ của ĐLNN 2 chiều (X, Y) có hàm phân
phối xác suất là:
1 1 1 1F(x, y) arctan x arctan y , x, y .
2 2
Giải. Ta có: '
x 2
1 1 1F (x, y) arctan y
(1 x ) 2
.
''
xy 2 2
1 1F (x, y) .
(1 x ) (1 y )
.
Hàm mật độ của ĐLNN 2 chiều (X, Y) là:
2 2 2
1f (x, y)
(1 x )(1 y )
.
Ví dụ 6. Cho ĐLNN 2 chiều (X, Y) có hàm mật độ phân phối xác
suất:
2 2 2
Af (x, y) .
(16 x )(25 y )
a) Xác định hằng số A;
b) Tìm hàm phân phối của (X, Y);
c) Tìm các hàm phân phối của X và Y.
Giải.
a) Ta có: 2 2 2
A1 f x, y dxdy dxdy
(16 x )(25 y )
2 2 2
A 1 1dx. dy
(16 x ) (25 y )
71
2
A 1 x 1 y. arctan . arctan4 4 5 5
2
A A( ) ( )
20 2 2 2 2 20
A = 20.
Vậy 2 2 2
20f (x, y)
(16 x )(25 y )
.
b) Ta có:
y yx x
2 2 2
20 1 1F(x, y) f x, y dxdy dx. dy
(16 x ) (25 y )
2
1 x yarctan arctan .
4 2 5 2
c) Ta có:
X 2y y
1 x yF (x) lim F(x, y) lim arctan arctan
4 2 5 2
2
1 x 1 xarctan arctan
4 2 2 2 4 2
.
Yx
F (y) lim F(x,y)
1 y
arctan5 2
.
4.3.2.3. Định lý. Giả sử X Yf (x),f (y) lần lƣợt là hàm mật độ của
ĐLNN X và Y; f(x, y) là hàm mật độ phân phối của ĐLNN (X, Y).
Điều kiện cần và đủ để X và Y độc lập với nhau là f(x, y) =
fX(x).fY(y).
4.4. PHÂN PHỐI XÁC SUẤT CÓ ĐIỀU KIỆN CỦA ĐLNN HAI CHIỀU
4.4.1. Phân phối có điều kiện của ĐLNN hai chiều rời rạc
Cho X, Y là hai ĐLNN ngẫu nhiên cùng liên kết với một phép thử
có miền giá trị lần lƣợt là DX = {x1, x2, ..., xn} và DY = {y1, y2, ..., ym}.
Gọi i j i jP x y P X x Y y i 1,n; j 1,m là xác suất
có điều kiện để thành phần X nhận giá trị bằng xi với điều kiện thành
phần Y nhận giá trị bằng yj.
72
Bảng phân phối xác suất có điều kiện của thành phần X với điều
kiện Y = yj có dạng:
jX y 1x 2x ... ix ... nx
P 1 jP x y 2 jP x y ... i jP x y ... n jP x y
trong đó các xác suất có điều kiện đƣợc tính bằng công thức:
i j ij
i j
j j
P x , y pP x y
P(Y y ) P(Y y )
i 1,n; j 1,m
Tƣơng tự, ta có bảng phân phối xác suất có điều kiện của thành
phần Y với điều kiện X = xi có dạng:
iY x 1y 2y ... jy ... my
P 1 iP y x 2 iP y x ... j iP y x ... m iP y x
trong đó các xác suất có điều kiện đƣợc tính bằng công thức:
i j ij
j i
i i
P x , y pP y x
P(X x ) P(X x )
i 1,n; j 1,m
Ví dụ 1. Phân phối xác suất của lƣơng tháng Y (triệu đồng) và giới
tính X của công nhân một công ty nhƣ sau:
Y
X 0,5 1 1,5
Nữ: 0 0,1 0,3 0,2
Nam: 1 0,06 0,18 0,16
Tìm phân phối xác suất của lƣơng tháng của nữ công nhân.
Giải. Trƣớc hết ta tìm P(x1) = P(X = 0) = 0,1 + 0,3 + 0,2 = 0,6.
từ đó: 1 11 1
1
P(x ,y ) 0,1 1P y x
P(x ) 0,6 6 ;
1 22 1
1
P(x ,y ) 0,3 1P y x
P(x ) 0,6 2 ;
73
1 33 1
1
P(x ,y ) 0,2 1P y x
P(x ) 0,6 3 .
Vậy bảng phân phối xác suất của lƣơng tháng của nữ công nhân là:
1Y x 0,5 1 1,5
P 1
6
1
2
1
3
4.4.2. Phân phối có điều kiện của ĐLNN hai chiều liên tục
Giả sử (X, Y) là ĐLNN hai chiều liên tục có hàm mật độ phân
phối xác suất f(x, y). Hàm mật độ xác suất có điều kiện của thành
phần X với Y = y, ký hiệu f(x/y) là biểu thức:
X
f (x, y)f x y
f (x) .
Tƣơng tự, hàm mật độ xác suất có điều kiện của thành phần Y với
X = x, ký hiệu f(y/x) là biểu thức:
Y
f (x, y)f y x
f (y) .
trong đó fX(x), fY(y) lần lƣợt là hàm mật độ phân phối xác suất của X, Y.
Ví dụ 2. Cho ĐLNN 2 chiều (X, Y) có hàm mật độ phân phối xác
suất:
2 2 2
2
2 2 2
1khi x y r
f x, y r
0 khi x y r
Tìm các hàm mật độ phân phối xác suất có điều kiện của các thành
phần.
Giải. Với 2 2 2x y r , ta có f(x, y) = 0 nên fX(x) = 0
Với 2 2 2 2 2x y r x r y , ta có 2
1f x, y
r
nên
2 2
2 2
r y 2 2
X 2 2 2
r y
2 r y1 1f (x) f (x, y)dx dx dx
r r r
.
74
2 2
2 2 2
2X
2 2 2
2 r ykhi x y r
f (x) r
0 khi x y r
Do đó
2 2
2 2
X 2 2
1khi x r y
f (x, y) 2 r yf x yf (x)
0 khi x r y
.
Tƣơng tự, ta xác định đƣợc:
2 2
2 2
Y 2 2
1khi y r xf (x, y)
2 r xf y xf (y)
0 khi y r x
.
4.5. KỲ VỌNG CÓ ĐIỀU KIỆN
4.5.1. Kỳ vọng có điều kiện của ĐLNN hai chiều rời rạc
Cho X, Y là hai ĐLNN ngẫu nhiên cùng liên kết với một phép thử
có miền giá trị lần lƣợt là DX = {x1, x2, ..., xn} và DY = {y1, y2, ..., ym}.
- Kỳ vọng có điều kiện của ĐLNN X với điều kiện (Y = yj) là một
số đƣợc ký hiệu và xác định nhƣ sau:
n
j i i j
i 1
E X / y x P x / y ; j 1,m
.
- Kỳ vọng có điều kiện của ĐLNN Y với điều kiện (X = xi) là một
số đƣợc ký hiệu và xác định nhƣ sau:
m
i j j i
j 1
E Y / x y P y / x ;i 1,n.
Ví dụ 1. Tìm kỳ vọng có điều kiện ĐLNN rời rạc hai chiều có
bảng phân phối xác suất sau đây:
X
Y 0 1 2
1 0,4 0,3 0
2 0 0,12 0,18
Giải. Ta có bảng phân phối xác suất có điều kiện
75
1X y 1 0 1 2
P(xi/1) 4
7
3
7 0
Do đó 1
4 3 3E X y 1 0. 1. 2.0
7 7 7 .
Tƣơng tự ta có: 2
8E X y 2
5 ; 1E Y x 0 1;
2
9E Y x 1 ;
5 3E Y x 2 2.
4.5.2. Kỳ vọng có điều kiện của ĐLNN hai chiều liên tục
Giả sử (X, Y) là ĐLNN hai chiều liên tục có hàm mật độ xác suất
có điều kiện f(x/y) và f(y/x).
- Kỳ vọng có điều kiện của ĐLNN X với điều kiện Y = y là một số
đƣợc ký hiệu và xác định nhƣ sau: E X / y x.f (x / y)dx.
- Kỳ vọng có điều kiện của ĐLNN Y với điều kiện X = x là một số
đƣợc ký hiệu và xác định nhƣ sau: E Y / x y.f (y / x)dy.
76
BÀI TẬP CHƢƠNG 4
Bài 4.1. Cho bảng phân phối xác suất đồng thời của ĐLNN 2
chiều rời rạc
X
Y 26 30 41 50
2,3 0,05 0,08 0,12 0,04
2,7 0,09 0,3 0,11 0,21
a. Tìm bảng phân phối xác suất của các thành phần X, Y. Tính
E(X); EY).
b. Hỏi X, Y có độc lập không? Vì sao?.
c. Tìm bảng phân phối xác suất có điều kiện của Y khi X = 26 và
của X khi Y = 2,7.
Đ/s: b. X, Y không độc lập với nhau.
c.
Y/X = 26 2,3 2,7
P 0,357 0,643
X/Y = 2,7 26 30 41 50
P 0,1268 0,4225 0,1549 0,2958
Bài 4.2. Thống kê dân số của một nƣớc theo trình độ học vấn X và
lứa tuổi Y cho kết quả sau:
Y
X
(25 – 35)
30
(35 – 55)
45
(55 – 100)
70
Thất học 0 0,01 0,02 0,05
Tiểu học 1 0,03 0,06 0,10
Trung học 2 0,18 0,21 0,15
Đại học 3 0,07 0,08 0,04
a. Tìm xác suất để lấy ngẫu nhiên 1 ngƣời thì ngƣời đó ở độ tuổi
40 và học Đại học.
77
b. Xây dựng bảng phân phối xác suất của học vấn và của lứa tuổi.
c. Xây dựng bảng phân phối xác của học vấn của những ngƣời độ
tuổi 30.
Đ/s. a. 0,08 c. P(X/y = 30) = 1/29; 3/29; 18/29; 7/29.
Bài 4.3. Cho các ĐLNN X và Y có bảng phân phối xác xuất đồng
thời nhƣ sau:
Y
X 1 2 3
1 0,12 0,15 0,03
2 0,28 0,35 0,07
a. Chứng minh X và Y độc lập với nhau.
b. Lập bảng phân phối xác suất của ĐLNN XY.
Đ/s: b.
XY 1 2 3 4 6
P 0,12 0,43 0,03 0,35 0,07
Bài 4.4. Cho X và Y là hai ĐLNN độc lập có phân phối xác suất
nhƣ sau:
X 0 1 2 3
P 0,4 0,3 0,2 0,1
Y 0 1 2 3 4
P 0,1 0,3 0,4 0,15 0,05
a. Tìm bảng phân phối xác suất của (X, Y).
b. Tính P{X > Y}.
Đ/s: b. P{X > Y} = 0,19.
Bài 4.5. Giả sử X = (X, Y) là ĐLNN liên 2 chiều có hàm mật độ
phân phối xác suất: f (x,y) k(4 x y) với 0 < x, y < 1.
a. Tìm k. b. Xác định Xf (x) , Yf (y). c. Tính P(X + Y < 0,5).
Đ/s: a. k = 2/5; b. X
2f (x) (3 x)
5 với 0 < x < 1;
c. Y
2 7f (y) ( 2y)
5 2 với 0 < y < 1.
78
Chƣơng 5
CÁC ĐỊNH LÝ GIỚI HẠN
5.1. ĐỊNH NGHĨA. Dãy các ĐLNN {Xn} đƣợc gọi là hội tụ theo
xác suất tới ĐLNN X nếu với > 0, n
nlimP X X 1.
Khi đó
ta ký hiệu: P
nX X .
5.2. BẤT ĐẲNG THỨC TRÊ-BƢ-SÉP. Cho ĐLNN X có kỳ
vọng E(X) và phƣơng sai D(X) đều hữu hạn. Khi đó với mọi > 0,
ta có:
2 2
D(X) D(X)P X E(X) 1 hay P X E(X)
(1)
Các bất đẳng thức (1) đƣợc gọi là các bất đẳng thức Trê-bư-sép.
Chứng minh: Giả sử X là ĐLNN liên tục có hàm mật độ phân phối
f(t).
Theo tính chất hàm mật độ, ta có:
E(X)
E(X)
P X E(X) P E(X) X E(X) f (t)dt
E(X)
E(X)
1 f (t)dt f (t)dt
. (2)
Mặt khác:
2
2 2
2
t E(X)t E(X) t E(X) 1
2
2
t E(X)f (t). f (t)
(vì f(t) 0).
Vì f(t) 0 nên
E(X)
E(X)
f (t)dt f (t)dt f (t)dt
2E(X)2
2 2
E(X)
t E(X) 1f (t)dt f (t)dt f (t)dt t E(X) f (t)dt
E(X)
2
E(X)
1f (t)dt f (t)dt .D(X)
(3)
79
Từ (2) và (3) suy ra: 2
D(X)P X E(X) 1 .
Về mặt thực tế bất đẳng thức Trê-bƣ-sép chỉ cho phép đánh giá
cận trên hoặc cận dƣới xác suất để ĐLNN X nhận giá trị sai lệch so
với kỳ vọng của nó lớn hơn hoặc bé thua . Đôi khi sự đánh giá đó là
hiển nhiên và không có ý nghĩa. Chẳng hạn, nếu D(X) 2 thì bất
đẳng thức là hiển nhiên đúng. Song nó lại có ƣu điểm là áp dụng đƣợc
đối với mọi ĐLNN mà không cần biết quy luật phân phối xác suất của
nó.
Ví dụ 1. Thu nhập trung bình hàng năm của dân cƣ một vùng là
700 USD và độ lệch chuẩn là 120 USD. Hãy xác định một khoảng thu
nhập hàng năm xung quanh giá trị trung bình của ít nhất 95% dân cƣ
vùng đó.
Giải. Gọi X là thu nhập hàng năm của dân cƣ vùng đó thì X là
ĐLNN với quy luật phân phối xác suất chƣa biết song có kỳ vọng toán
E(X) = 700 và độ lệch chuẩn D(X) = 120. Do đó theo bất đẳng thức
Trê-bƣ-sép, ta có:
2
130P X 700 1 0,95 536,656
Vậy ít nhất 95% dân cƣ vùng đó có thu nhập hàng năm nằm trong
khoảng (700 – 536,656; 700 + 536,656), tức là khoảng (163,344;
1236,656).
5.3. ĐỊNH LÝ TRÊ-BƢ-SÉP
5.3.1. Định lý. Giả sử X1, X2, ..., Xn là dãy các ĐLNN độc lập từng
đôi một, có kỳ vọng E(Xi) đều hữu hạn ( i 1,n ) và phƣơng sai
D(Xi) bị chặn trên bởi hằng số C (nghĩa là D(Xi) C, C là hằng số,
i 1,n ). Khi đó > 0 ta có:
n n
i in
i 1 i 1
1 1lim P X E(X ) 1
n n
.
Khi đó ta nói: n n
(P)
i i
i 1 i 1
1 1X E(X )
n n
.
Chứng minh:
80
Đặt n n n
n i n i i
i 1 i 1 i 1
1 1 1S X E(S ) E X E(X )
n n n
và n n
n i i2 2i 1 i 1
1 1 nC CD(S ) D X D(X )
n n n n
.
Áp dụng bất đẳng thức Trê-bƣ-sép đối với ĐLNN Sn, ta có:
nn n 2 2
D(S ) C0,P S E(S ) 1 1
n
n n 2n n
Clim P S E(S ) lim 1 1
n
Mà xác suất của một biến cố không vƣợt quá 1 nên:
n nn
0,limP S E(S ) 1
n n
i in
i 1 i 1
1 10, lim P X E(X ) 1.
n n
5.3.2. Hệ quả. Giả sử X1, X2, ..., Xn là dãy các ĐLNN độc lập
cùng tuân theo một quy luật phân phối xác suất nào đó với kỳ vọng
E(Xi) = và phƣơng sai D(Xi) = 2 hữu hạn ( i 1,n ). Khi đó > 0
ta có:
n
in
i 1
1lim P X 1
n
Qua hệ quả trên ta thấy khi n khá lớn thì trung bình cộng các
ĐLNN có cùng kỳ vọng hầu nhƣ lấy những giá trị xấp xỉ kỳ vọng của
chúng và xấp xỉ này càng tốt nếu n càng lớn. Điều này có ý nghĩa thực
tiễn rất lớn, chẳng hạn nhƣ muốn đo đạc một đại lƣợng vật lý nào đó
ta cần thực hiện nhiều lần và lấy trung bình cộng của các kết quả làm
giá trị thực của đại lƣợng.
Nội dung hệ quả này còn là cơ sở cho một phƣơng pháp đƣợc áp
dụng trong thống kê là phƣơng pháp mẫu mà thực chất của nó là dựa
vào mẫu ngẫu nhiên để đi đến kết luận cho tổng thể các đối tƣợng
đƣợc nghiên cứu.
5.4. ĐỊNH LÝ BERNOULLI
81
Định lý: Giả sử fn(A) là tần suất xuất hiện biến cố A trong n phép
thử độc lập và p là xác suất xuất hiện biến cố A trong mỗi phép thử.
Khi đó > 0 ta có: nnlimP f (A) p 1
.
Chứng minh: Gọi Xi là số lần xuất hiện biến cố A trong phép thử
thứ i, i 1,n .
Ta có:
Do đó: Xi A(p) ( i 1,n )
2
i i
p 1 p 1E(X ) p;D(X ) p(1 p) , i 1,n.
2 4
D(Xi) bị chặn, i 1,n .
n n n
n i n i i
i 1 i 1 i 1
1 1 1f (A) X E f (A) E X E(X ) p.
n n n
Áp dụng định lý Trê-bƣ-sép cho dãy các ĐLNN X1, X2, ..., Xn ở
trên ta có:
n n
i in
i 1 i 1
1 10, lim P X E(X ) 1
n n
nnlimP f (A) p 1.
Định lý Bernoulli nêu lên sự hội tụ theo xác suất của tần suất xuất
hiện biến cố trong n phép thử độc lập về xác suất xuất hiện biến cố đó
trong mỗi phép thử khi số phép thử tăng lên vô hạn. Do đó trong thực
tế khi số phép thử tăng lên khá lớn ta lấy fn(A) làm giá trị xấp xỉ cho
xác suất P(A).
5.5. ĐỊNH LÝ GIỚI HẠN TRUNG TÂM
Định lý. Giả sử X1, X2, ..., Xn là dãy các ĐLNN độc lập cùng tuân
theo một quy luật phân phối xác suất nào đó với kỳ vọng E(Xi) = và
phƣơng sai D(Xi) = 2 hữu hạn ( i 1,n ). Khi đó:
1 nếu A xuất hiện ở phép thử thứ i
0 nếu A không xuất hiện ở phép thử thứ i iX
82
Đại lƣợng ngẫu nhiên 1 2 nX X ... XX
n
sẽ hội tụ theo xác
suất tới một ĐLNN có quy luật phân phối xác suất chuẩn 2
N ,n
khi n .
hay đại lƣợng ngẫu nhiên X
U n
sẽ hội tụ theo xác suất tới
quy luật phân phối xác suất chuẩn hóa N(0, 1) khi n .
Trong thực hành tính toán, khi n > 30 thì ta có thể xấp xỉ:
2 X
X N , hay n N 0,1n
.
Ví dụ. 1) Chọn ngẫu nhiên 192 số trên đoạn [0, 1]. Tìm xác suất để
tổng số điểm thu đƣợc X nằm trong khoảng (88, 104).
Giải. Ta có thể coi nhƣ 192
i
i 1
X X
, trong đó mọi ĐLNN Xi độc
lập và cùng tuân theo quy luật phân phối đều U(0, 1).
Từ đó ta có E(Xi) = 0 1
0,52
; D(Xi) =
2(1 0) 1
12 12
, i 1,192 .
E(X) = 192.0,5 = 96 và D(X) = 192/12=16 = 4.
Vì vậy P(88 X 104) 104 96 88 96
2 2 0,954.4 4
2) Cho biến ngẫu nhiên X B(1000; 0,02). Tìm xác suất để X
nhận giá trị trong khoảng (40, 50).
Giải. Có thể coi 1000
i
i 1
X X
, trong đó Xi độc lập và có cùng phân
phối không một A(0,02). Từ đó theo định lý giới hạn trung tâm suy ra
X N(, 2), trong đó = np = 1000.0,02 = 20;
2 = np(1 – p) = 19,6.
P(40 X 50) 50 20 40 20
6,77 4,51 0,5 4,99919,6 19,6
= 0,001.
83
BÀI TẬP CHƢƠNG 5
Bài 5.1. Xác suất xuất hiện sản phẩm loại 1 khi kiểm tra một sản
phẩm là 0,5. Gọi X là số lần xuất hiện sản phẩm loại 1 khi tiến hành
kiểm tra 100 sản phẩm. Đánh giá xác suất của biến cố (40 < X < 60).
Đ/s: X B(100; 0,5).
Áp dụng BĐT Trê-bƣ-sép, ta có:
P(40 < X < 60) = 2
25P( X 50 10) 1 0,75
10 .
Bài 5.2. Cho X là ĐLNN có E(X) = 1; D(X) = 0,04. Chứng minh
rằng:
a. 1 3
P( X ) 0,84.2 2
b. P(0 X 2) 0,96.
Bài 5.3. Hãy tìm , biết X là ĐLNN có D(X) = 0,01 thỏa mãn:
P( X E(X) ) 0,96.
Đ/s: 0 < 0,5.
Bài 5.4. Gieo một con xúc xắc cân đối đồng chất n lần một cách
độc lập. Gọi X là số lần xuất hiện mặt 6 chấm. Chứng minh rằng:
n n 31P n X n
6 6 36
.
Bài 5.5. Giả sử tiền điện của một gia đình phải trả trong một tháng
là ĐLNN với trung bình 16 USD và độ lệch chuẩn 1 USD. Sử dụng
bất đẳng thức Trê-bƣ-sép, hãy xác định số M nhỏ nhất để với xác suất
0,99 số tiền điện phải trả trong một năm (12 tháng) không vƣợt quá M.
Đ/s: M = 226,64.
Bài 5.6. Gieo một con xúc xắc 120 lần. Tính xác suất để số lần
xuất hiện mặt 6 chấm nhỏ hơn 15. Biết rằng con xúc xắc cân đối đồng
chất.
Đ/s: 0,113.
84
Chƣơng 6
LÝ THUYẾT MẪU
6.1. KHÁI NIỆM VỀ PHƢƠNG PHÁP MẪU
Trong thực tế chúng ta thƣờng phải nghiên cứu một tập hợp các
phần tử đồng nhất theo một hay nhiều dấu hiệu định tính hay định
lƣợng đặc trƣng cho các phần tử đó. Để nghiên cứu tập hợp các phần
tử này theo một dấu hiệu nhất định, đôi khi ta sử dụng phƣơng pháp
nghiên cứu toàn bộ, tức là thống kê toàn bộ tập hợp đó và phân tích
từng phần tử theo dấu hiệu nghiên cứu.
Ví dụ 1. Nghiên cứu dân số của một nƣớc theo các dấu hiệu nhƣ
tuổi tác, trình độ văn hóa, địa bàn cƣ trú, cơ cấu nghề nghiệp, ... có thể
tiến hành điều tra dân số và phân tích từng ngƣời theo các dấu hiệu
trên từ đó tổng hợp thành dấu hiệu chung cho toàn bộ dân số của nƣớc
đó.
Tuy nhiên, trong thực tế việc áp dụng phƣơng pháp nghiên cứu
toàn bộ sẽ gặp phải những khó khăn chủ yếu sau: Nếu quy mô tập hợp
quá lớn thì việc nghiên cứu toàn bộ sẽ đòi hỏi nhiều chi phí vật chất,
thời gian và đôi khi dẫn tới trùng hoặc bỏ sót các phần tử của nó; Có
khi trong quá trình nghiên cứu các đối tƣợng đó bị thay đổi hình dạng,
hoặc bị phá hủy, chúng không còn giá trị sử dụng nữa, hoặc chƣa có
thể xác định đƣợc tất cả các đối tƣợng.
Ví dụ 2. Kiểm tra chất lƣợng của một kho hàng có 106 sản phẩm,
ta không thể kiểm tra tất cả 106 sản phẩm; Để xác định tổng số ngƣời
còn mù chữ ở Việt Nam, ta không thể điều tra toàn bộ dân số Việt
Nam; Để tìm hiểu tâm lý của những ngƣời mắc bệnh truyền nhiễm
HIV, ta không thể tìm hiểu hết những ngƣời mắc bệnh HIV, vì còn
một bộ phận những ngƣời mắc bệnh đó ta chƣa phát hiện ra.
Vì thế, trong thực tế phƣơng pháp nghiên cứu toàn bộ thƣờng chỉ
đƣợc áp dụng với các tập hợp có quy mô nhỏ. Đối với đối tƣợng
nghiên cứu có số phần tử lớn ngƣời ta áp dụng phƣơng pháp nghiên
cứu không toàn bộ, đặc biệt là phƣơng pháp nghiên cứu chọn mẫu (gọi
là phương pháp mẫu). Phƣơng pháp này chủ trƣơng từ tập hợp nghiên
85
cứu chọn ra một số phần tử đại diện để nghiên cứu, khảo sát rồi từ đó
trên cơ sở các phƣơng pháp suy luận toán học ngƣời ta rút ra những
kết luận về các tính chất cần thiết của một dấu hiệu hay một đặc điểm
của tập tất cả các đối tƣợng nói chung.
Việc thu thập, sắp xếp và trình bày các số liệu của tổng thể hoặc
một mẫu gọi là thống kê mô tả. Còn việc sử dụng thông tin của mẫu để
tiến hành các suy đoán, kết luận về tổng thể gọi là thống kê suy diễn.
Ví dụ 3. Muốn khảo sát chiều cao trung bình của thanh niên Việt
Nam hiện nay có tăng lên so với trƣớc đây hay không, ta phải đo chiều
cao của tất cả các thanh niên Việt Nam. Điều này tuy làm đƣợc nhƣng
rõ ràng tốn rất nhiều thời gian, tiền bạc, công sức,… Do đó ta có thể
khảo sát khoảng 1 triệu thanh niên và từ chiều cao trung bình của 1
triệu ngƣời này, ta suy ra chiều cao trung bình của toàn bộ thanh niên
Việt Nam.
6.2. TỔNG THỂ VÀ MẪU
Tập hợp có các phần tử là các đối tƣợng mang dấu hiệu X mà ta
cần nghiên cứu đƣợc gọi là tổng thể. Số phần tử của tập hợp đó đƣợc
gọi là kích thước của tổng thể, ký hiệu là N.
Từ tổng thể ta chọn ra n phần tử thì n phần tử đó đƣợc gọi là một
mẫu có kích thước n (gọi là cỡ mẫu). Kích thƣớc mẫu thƣờng nhỏ hơn
rất nhiều so với kích thƣớc của tổng thể. Từ tổng thể ta có thể lấy ra
nhiều mẫu khác nhau với cùng một kích thƣớc n. Tập hợp tất cả các
mẫu có thể lấy ra đƣợc từ tổng thể đƣợc gọi là không gian mẫu.
Ví dụ 1. Ở ví vụ 3, tổng thể là tất cả các thanh niên Việt Nam, kích
thƣớc mẫu là 1 triệu thanh niên Việt Nam.
Ví dụ 2. Cần đánh giá chất lƣợng của nhà máy bia Hà Nội sản xuất
trong một tháng, ta không thể đem mở hết tất cả các chai bia để kiểm
tra chất lƣợng, vì nếu làm nhƣ vậy thì không còn bia để bán mà chỉ
mở một số chai bia nào đó, đánh giá chất lƣợng trên những chai bia
đƣợc mở này để đƣa ra kết luận (mang tính tƣơng đối) cho chất lƣợng
bia của toàn nhà máy. Số chai bia sản xuất trong một tháng là kích
thƣớc tổng thể, số chai bia đƣợc mở là kích thƣớc mẫu.
86
Thay vì nghiên cứu tất cả các phần tử có mặt trong tổng thể ta
chuyển sang nghiên cứu một bộ phận của tổng thể là mẫu, vì vậy mẫu
phải đại diện một cách khách quan nhất cho tổng thể. Để đảm bảo yêu
cầu trên ngƣời ta đƣa ra các phƣơng pháp chọn mẫu sau.
6.3. CÁC PHƢƠNG PHÁP CHỌN MẪU
6.3.1. Phƣơng pháp chọn mẫu có lặp. là phƣơng pháp ban đầu
lấy ngẫu nhiên một phần tử từ tổng thể và nghiên cứu, khảo sát phần
tử đó ghi nhận kết quả sau đó trả lại phần tử đó cho tổng thể rồi tiếp
tục chọn phần tử thứ 2 từ tổng thể, nghiên cứu, khảo sát nó ghi nhận
kết quả, rồi trả lại phần tử đó cho tổng thể, và cứ tiếp tục nhƣ thế cho
đến khi chọn đƣợc phần tử thứ n.
Cách chọn này có ƣu điểm là các phần tử chọn ra là một kết quả
của các phép thử độc lập, thuận lợi cho việc xét các điều kiện trong
các định lý toán học, nhƣng nó cũng có nhƣợc điểm là các phần tử
trong mẫu có thể lặp lại làm cho kích thƣớc mẫu giảm và không thể áp
dụng nếu trong trƣờng hợp quá trình nghiên cứu phần tử chọn ra bị
phá hủy cấu trúc.
6.3.2. Phƣơng pháp chọn mẫu không lặp. Từ tập hợp cần nghiên
cứu, rút ngẫu nhiên 1 phần tử, ghi lại các đặc số cần thiết từ phần tử
này và không trả phần tử đó về tập hợp ban đầu. Tiếp tục lấy tiếp ngẫu
nhiên lần sau.
Ta nhận thấy rằng với kích thƣớc n, số lƣợng các mẫu trong
trƣờng hợp lấy mẫu không lặp là n
NA , số lƣợng các mẫu trong trƣờng
hợp lặp là Nn. Khi N lớn hơn rất nhiều so với n thì n
NA và Nn sai khác
nhau không đáng kể vì vậy việc lấy mẫu có hoàn lại gần giống nhƣ
việc lấy mẫu không hoàn lại.
Ví dụ 3. Khi nghiên cứu về số cá trong một hồ thì tổng số cá trong
hồ là kích thƣớc của tổng thể. Từ hồ đó chọn ngẫu nhiên 10 cá thể cá
thì đƣợc mẫu không hoàn lại kích thƣớc 10. Nếu từ hồ đó chọn ngẫu
nhiên 1 cá thể cá rồi thả xuống, sau đó tiếp tục chọn 1 cá thể khác, tiến
hành 10 lần nhƣ thế ta đƣợc mẫu có hoàn lại kích thƣớc 10.
87
6.4. MẪU NGẪU NHIÊN VÀ MẪU CỤ THỂ
Khi nghiên cứu về dấu hiệu X, X là ĐLNN tuân theo quy luật
phân phối xác suất nào đó. Giả sử ta tiến hành n phép thử (quan sát)
độc lập để xác định n giá trị của mẫu. Gọi Xi là ĐLNN ứng với giá trị
sẽ thu đƣợc ở phép thử thứ i ( i 1,n ). Các ĐLNN Xi là độc lập với
nhau và có cùng phân phối với X, sau khi thực hiện phép thử Xi nhận
giá trị xi ( i 1,n ).
6.4.1. Định nghĩa. Một mẫu ngẫu nhiên có kích thƣớc n là n đại
lƣợng ngẫu nhiên độc lập, có cùng phân phối xác suất với X, đƣợc ký
hiệu là W = (X1, X2, ..., Xn).
Thực hiện một phép thử đối với W = (X1, X2, ..., Xn) ta sẽ thu
đƣợc một mẫu cụ thể (x1, x2, ..., xn). Nhƣ vậy mẫu cụ thể là một giá trị
của mẫu ngẫu nhiên.
6.4.2. Các ví dụ
Ví dụ 1. Khảo sát điểm thi môn Toán của một lớp. Ta tiến hành
quan sát 5 sinh viên. Khi đó dấu hiệu X cần nghiên cứu là điểm môn
Toán của sinh viên, X là một ĐLNN. Gọi Xi là điểm Toán của sinh
viên thứ i (i = 1,…, 5), Xi là các ĐLNN có cùng phân phối với X.
Khi đó W = (X1, X2, X3, X4, X5 ) là mẫu ngẫu nhiên có kích thƣớc 5.
Trong một lần quan sát mẫu ngẫu nhiên W, sinh viên thứ nhất
đƣợc 5 điểm, sinh viên thứ hai đƣợc 7 điểm, sinh viên thứ ba đƣợc 4
điểm, sinh viên thứ tƣ đƣợc 6 điểm, sinh viên thứ năm đƣợc 5 điểm.
Khi đó w = (x1, x2, …, xn) = (5, 7, 4, 6, 5) là giá trị cụ thể (hay còn gọi
là một mẫu cụ thể) của mẫu ngẫu nhiên W = (X1, X2, X3, X4, X5 ).
Ví dụ 2. Gọi X là ĐLNN chỉ "số sản phẩm làm ra của một tổ sản
xuất của nhà máy A trong một tháng". X1, X2, X3 lần lƣợt là ĐLNN
chỉ "sản lƣợng của tổ 1, 2, 3".
Khi đó ta có mẫu ngẫu nhiên kích thƣớc n = 3 là W = (X1, X2, X3),
tập i i, , x X ,i 1,3 1 2 3
w x x x là các giá trị của mẫu ngẫu nhiên
W. Chẳng hạn nhƣ w = (40, 30, 60) là một giá trị cụ thể của mẫu
W = (X1, X2, X3), hay là một mẫu cụ thể.
88
Ví dụ 3. Khi nghiên cứu chiều cao của một cộng đồng ngƣời, gọi X
là ĐLNN chỉ chiều cao. Ta chọn ngẫu nhiên 100 ngƣời, gọi Xi là
ĐLNN chỉ chiều cao của ngƣời thứ i ( i 1,100 ). Xi là một ĐLNN, nó có
cùng phân phối với X. Khi đó W = (X1, X2, ..., X100) là một mẫu ngẫu
nhiên có kích thƣớc 100. Sau khi đo đạc rồi, ta sẽ xác định đƣợc các giá
trị của Xi là xi ( i 1,100 ), khi đó bộ n số thực
w = (x1, x2, ..., x100) là một mẫu cụ thể.
6.5. CÁC PHƢƠNG PHÁP SẮP XẾP MẪU CỤ THỂ
Để nghiên cứu dấu hiệu X từ tổng thể ta rút ra mẫu ngẫu nhiên
có kích thƣớc n là W = (X1, X2, ..., Xn). Trong một lần thực hiện phép
thử mẫu ngẫu nhiên W ta đƣợc mẫu cụ thể w = (x1, x2, ..., xn), để khai
thác thông tin chứa đựng trong dãy số liệu này ta cần sắp xếp số liệu
nhằm dễ dàng nhận ra các đặc trƣng của dãy số liệu đó.
6.5.1. Sắp xếp theo bộ số tăng dần hoặc giảm dần
Trong trƣờng hợp mẫu có kích thƣớc n nhỏ, ngƣời ta thƣờng sắp
xếp các giá trị trong mẫu theo một bộ số khắc có giá trị tăng dần từ
nhỏ đến lớn hay từ lớn đến nhỏ, dƣới dạng (x1, x2, ..., xn)
với x1 x2 ... xn hay x1 x2 ... xn.
6.5.2. Sắp xếp theo bảng phân phối tần số, tần suất thực
nghiệm
6.5.2.1. Bảng phân phối tần số, tần suất thực nghiệm không chia lớp
Giả sử trong n giá trị của mẫu cụ thể w = (x1, x2, ..., xn) có k giá trị
phân biệt, không mất tính tổng quát ta giả thiết k giá trị đó là
x1< x2 < ...< xk, trong đó x1 có số lần lặp lại là n1, x2 có số lần lặp lại là
n2, ..., xk có số lần lặp lại là nk. Số ni gọi là tần số của giá trị xi.
Khi đó các số liệu của mẫu cụ thể đƣợc sắp xếp dƣới dạng bảng
sau đây gọi là bảng phân phối tần số.
Giá trị xi x1 x2 … xk
Tần số ni n1 n2 … nk
trong đó 1 2 kn n ... n n .
Hay theo bảng
89
Giá trị xi x1 x2 … xk
Tần suất fi f1 f2 … fk
trong đó ii
nf ( i 1,k)
n gọi là tần suất của giá trị xi. Bảng trên gọi
là bảng phân phân phối tần suất.
Ví dụ 1. Khảo sát ngẫu nhiên thu nhập của 30 ngƣời trong một
công ty ta có số liệu (đơn vị: triệu đồng/tháng): 2; 3; 4; 2; 5; 4; 6; 3; 6;
6; 5; 7; 2; 4; 8; 9; 10; 8; 9; 8; 8; 7; 5; 6; 3; 3; 9; 5; 7; 10.
Sắp xếp số liệu lại ta có bảng phân phối tần số:
xi 2 3 4 5 6 7 8 9 10
ni 3 4 3 4 4 3 4 3 2
Hay bảng phân phối tần suất:
xi 2 3 4 5 6 7 8 9 10
fi 3/20 4/20 3/20 4/20 4/20 3/20 4/20 3/20 2/20
6.5.2.2. Bảng phân phối tần số, tần suất thực nghiệm chia lớp
Trong trƣờng hợp mẫu có nhiều phần tử, các giá trị của các phần
tử chênh lệch nhau không nhiều, để thuận tiện cho việc tính toán ta
phân miền giá trị của mẫu thành k lớp (có thể chia đều hoặc không
đều nhau): [a0, a1), [a1, a2), ..., [ak, ak+1) và trong các khoảng có các tần
số tƣơng ứng là ni, i 1,k . Khi đó mẫu đƣợc sắp xếp theo bảng sau:
Giá trị xi [a0, a1) [a1, a2) … [ak-1, ak)
Tần số ni n1 n2 … nk
gọi là bảng phân phối tần số phân lớp.
Khi đó đối với mỗi khoảng, ta thay bởi 1 điểm đại diện, thông
thƣờng ngƣời ta lấy điểm giữa của khoảng.
Từ đó ta có bảng rút gọn:
Giá trị xi x1 x2 … xk
Tần số ni n1 n2 … nk
90
trong đó: i 1 ii
a ax , i 1,k.
2
Và từ đó ta cũng suy ra đƣợc bảng phân phối tần suất phân lớp:
Giá trị xi [a0, a1) [a1, a2) … [ak-1, ak)
Tần suất ni f1 f2 … fk
và bảng phân phối tần suất phân lớp rút gọn:
Giá trị xi x1 x2 … xk
Tần suất fi f1 f2 … fk
Ví dụ 2. Điều tra Glucoza trong máu ở 100 ngƣời, ta thu đƣợc kết
quả nhƣ sau:
Khoảng GLucoza 65-80 80-95 95-110 110-125 125-140
Số ngƣời 16 34 33 9 8
Ta có bảng phân phối tần số rút gọn:
Khoảng GLucoza 72,5 87,5 102,5 117,5 132,5
Số ngƣời 16 34 33 9 8
6.6. CÁC ĐẶC TRƢNG MẪU
6.6.1. Hàm mẫu (thống kê). Hàm G = G(X1, X2, ..., Xn) với
(X1, X2, ..., Xn) là một mẫu ngẫu nhiên gọi là một hàm mẫu hay một
thống kê.
Vì mẫu (X1, X2, ..., Xn) là một ĐLNN nên thống kê
G = G(X1, X2, ..., Xn) cũng là một ĐLNN.
Với mẫu cụ thể (x1, x2, ..., xn) của mẫu ngẫu nhiên (X1, X2, ..., Xn)
thì thống kê G = G(X1, X2, ..., Xn) cũng có một giá trị
g = G(x1, x2, ..., xn).
Phân phối xác suất của thống kê G(X1, X2, ..., Xn) phụ thuộc vào
phân phối xác suất của ĐLNN X ở tổng thể.
6.6.2. Trung bình mẫu, phƣơng sai mẫu, phƣơng sai mẫu điều chỉnh
6.6.1.1. Trung bình mẫu (Kỳ vọng mẫu)
91
a. Định nghĩa. Cho mẫu ngẫu nhiên W = (X1, X2, ..., Xn) của
ĐLNN X, khi đó thống kê n
i
i=1
1X X
n gọi là trung bình mẫu hay kỳ
vọng mẫu của X.
Giả sử mẫu cụ thể (x1, x2, ..., xn) là một giá trị của mẫu ngẫu nhiên
(X1, X2, ..., Xn), khi đó thống kê n
i
i=1
1X X
n cũng có một giá trị tƣơng
ứng đó là: n
i
i=1
1x x
n .
b. Cách tính giá trị trung bình mẫu
Giả sử các số liệu của mẫu cụ thể (x1, x2, ..., xn) đƣợc sắp xếp dƣới
dạng bảng phân phối tần số:
Giá trị xi x1 x2 … xk
Tần số ni n1 n2 … nk
trong đó k
i 1 2 k
i 1
n n n ... n n
.
Khi đó trung bình mẫu (kỳ vọng mẫu) đƣợc xác định nhƣ sau: k
i i
i 1
1x n x .
n
6.6.1.2. Phương sai mẫu
a. Định nghĩa. Cho mẫu ngẫu nhiên W = (X1, X2, ..., Xn) của
ĐLNN X, khi đó thống kê n n2 22 2
i i
i =1 i =1
1 1S X -X = X X
n n đƣợc gọi
là phương sai mẫu của X.
Giả sử mẫu cụ thể (x1, x2, ..., xn) là một giá trị của mẫu ngẫu nhiên
(X1, X2, ..., Xn), khi đó thống kê 2S cũng có một giá trị tƣơng ứng đó
là: n n2 22 2
i i
i =1 i =1
1 1s x -x = x x
n n .
b. Cách tính giá trị phương sai mẫu
92
Giả sử các số liệu của mẫu cụ thể (x1, x2, ..., xn) đƣợc sắp xếp dƣới
dạng bảng phân phối tần số:
Giá trị xi x1 x2 … xk
Tần số ni n1 n2 … nk
trong đó k
i 1 2 k
i 1
n n n ... n n
.
Khi đó phƣơng sai mẫu đƣợc xác định nhƣ sau: k
22 2
i i
i 1
1s n x x .
n
6.6.1.3. Phương sai mẫu điều chỉnh
Cho mẫu ngẫu nhiên W = (X1, X2, ..., Xn) của ĐLNN X, khi đó
thống kê n 22
i
i =1
1S X X
n 1
đƣợc gọi là phương sai mẫu điều
chỉnh.
Với mẫu cụ thể, thống kê 2
S có giá trị là n 22
i
i =1
1s x x
n 1
.
Ta có thể tính 2
s theo công thức: 2
2ns s .
n 1
Thống kê 2S = S gọi là độ lệch tiêu chuẩn mẫu.
Thống kê 2
S S gọi là độ lệch tiêu chuẩn mẫu điều chỉnh .
Ví dụ 1. Số xe hơi bán đƣợc trong 1 tuần ở mỗi đại lý trong 45 đại
lý, cho bởi bảng sau:
Số xe hơi bán đƣợc trong tuần (xi) 1 2 3 4 5 6
Số đại lý bán (ni) 15 12 9 5 3 1
Gọi X là số xe hơi bán đƣợc trong 1 tuần. Tính số xe hơi bán đƣợc
trung bình mẫu và phƣơng sai mẫu.
Giải: Ta có 6
i
i 1
n n 45.
Số xe hơi bán đƣợc trung bình trong tuần là:
93
6
i i
i 1
1x n x
n
1
1.15 2.12 3.9 4.5 5.3 6.1 2,378.45
Phƣơng sai mẫu là:
6
22 2
i i
i 1
1s n x x
n
2 2 2 2 2 2 2115.1 12.2 9.3 5.4 3.5 1.6 2,38 1,791.
45
Ví dụ 2. Xét kết quả điều tra Glucoza trong máu ở 100 ngƣời ở ví
dụ 2, mục 6.5. Gọi X là lƣợng Glocoza trong máu. Tính lƣợng
Glucoza trung bình mẫu và bình phƣơng độ lệch mẫu.
xi ni xini 2
i ix n
72,5 16 1160.00 84100.00
87,5 34 2975.00 260312.50
102,5 33 3382.50 346706.25
117,5 9 1057.50 124256.25
132,5 8 1060.00 140450.00
Tổng 100 9635.00 955825.00
Giải: Trung bình mẫu là: 5
i i
i 1
1 9635x n x 96,35
n 100
.
Phƣơng sai mẫu là: 5
22 2 2
i i
i 1
1 955825s n x x (96,35) 274,928.
n 100
6.7. LUẬT PHÂN PHỐI CỦA CÁC ĐẶC TRƢNG MẪU
Trên tổng thể , cho ĐLNN gốc X có kỳ vọng E(X) = và
phƣơng sai D(X) = 2. Cho mẫu ngẫu nhiên (X1, X2, ..., Xn), dựa vào
kỳ vọng và phƣơng sai của các đặc trƣng mẫu, dựa vào các tính chất
của phân phối chuẩn, phân phối khi bình phƣơng, phân phối Student
và dựa vào các định lý giới hạn, ta có thể suy ra phân phối của các đặc
trƣng mẫu sau đây:
6.7.1. Phân phối của phƣơng sai mẫu điều chỉnh
94
Định lý. Nếu ĐLNN X có phân phối chuẩn N(, 2) và
(X1, X2, ..., Xn) là một mẫu ngẫu nhiên thì: n
2 2
i2i 1
1(X ) (n)
và 2 2
2
nS (n 1)
.
6.7.2. Phân phối của trung bình mẫu
Vì quy luật phân phối xác suất của X phụ thuộc vào kích thƣớc
mẫu n của mẫu ngẫu nhiên (X1, X2, ..., Xn) và phƣơng sai của tổng thể
D(X) = 2 đã biết hay chƣa biết nên ta chia thành các trƣờng hợp sau:
6.7.2.1. Trường hợp n > 30, phương sai 2 đã biết
Theo kết quả của định lý giới hạn trung tâm, khi kích thƣớc mẫu
n > 30, trung bình mẫu X có thể xấp xỉ phân phối chuẩn 2
N( , )n
.
Do đó ta có:
XZ n N(0,1)
.
6.7.2.2. Trường hợp n 30, X N(, 2), phương sai 2
đã biết
Vì X N(, 2) nên các ĐLNN của mẫu ngẫu nhiên
(X1, X2, ..., Xn) cũng có phân phối chuẩn, có nghĩa là Xi N(, 2),
i 1,n . Do đó:
2
X N( , )n
hay
XZ n N(0,1)
.
6.7.2.3. Trường hợp n > 30, phương sai 2 chưa biết
Khi n > 30, ta có thể xấp xỉ S , do đó:
X XZ n n 1 N(0,1)
SS
.
6.7.2.4. Trường hợp n 30, X N(, 2), phương sai 2
chưa biết
Nếu X N(, 2) thì ĐLNN
XZ n 1 T(n 1)
S
có phân
phối Student với n – 1 bậc tự do.
95
BÀI TẬP CHƢƠNG 6
Bài 6.1. Hãy tính trung bình mẫu, phƣơng sai mẫu, độ lệch chuẩn
mẫu của các mẫu cụ thể chi ở bảng dƣới đây:
a.
xi - 2 1 2 3 4 5
ni 2 1 2 2 2 1
b.
xi 4 7 8 12
ni 5 2 3 10
c.
xi 12 13 15 17 18 20
ni 2 5 8 4 4 2
d.
xi 21 24 25 26 28 32 34
ni 10 20 30 15 10 10 5
e.
xi 3,0 3,5 3,8 4,4 4,5
ni 2 6 9 7 1
f.
xi 18,6 19,0 19,4 19,8 20,2 20,6
ni 4 6 30 40 18 2
g.
xi 65 70 75 80 85
ni 2 5 25 15 3
Đ/s: a. x = 2; s2 = 5,2; s = 2,404.
b. x = 8,9; s2 = 11,29; s = 3,447.
c. x = 15,56; s2 = 5,286; s = 2,347.
d. x = 26; s2 = 10,8; s = 3,303.
e. x = 3,86; s2 = 0,19; s = 0,444.
f. x = 19,672; s2 = 0,169; s = 0,413.
96
g. x = 76,2; s2 = 18,56; s = 4,352.
Bài 6.2. Cho 8 kết quả đo đạc về một ĐLNN X bởi cùng một máy
không có sai số hệ thống: 396, 378, 315, 420, 385, 401, 372, 383. Tính
trung bình mẫu, phƣơng sai mẫu và độ lệch tiêu chuẩn điều chỉnh.
Đ/s: x = 381,25; s2 = 826,438; s = 30,733.
Bài 6.3. Đo chiều cao của 100 sinh viên ở cùng một trƣờng đại học
ngƣời ta thu đƣợc bảng số liệu sau:
Chiều cao (cm) Số sinh viên
154-158 10
158-162 14
162-166 26
166-170 28
170-174 8
174-178 2
178-182 12
Tính chiều cao trung bình và độ lệch tiêu chuẩn điều chỉnh của
chiều cao qua mẫu nói trên.
Đ/s: x = 166,56; s = 6,763.
Bài 6.4. Các kết quả về việc đo độ bền các sợi chỉ ta thu đƣợc
bảng số liệu sau dƣới đây:
Độ bền của sợi chỉ Số sợi chỉ
120-140 1
140-160 4
160-180 10
180-200 14
200-220 12
220-240 6
240-260 2
260-280 1
97
Tính độ bền trung bình mẫu, phƣơng sai mẫu và độ lệch chuẩn
mẫu của mẫu nói trên.
Đ/s: x = 195,2; s2 = 812,96 ; s = 28,513.
Bài 6.5. Để xác định độ chính xác của một chiếc cân tạ không
có sai số hệ thống, ngƣời ta tiến hành cân 5 lần cân độc lập (cùng
một vật), kết quả nhƣ sau: 94,1; 94,8; 96,0; 95,4; 95,2 (kg). Xác
định trung bình mẫu, phƣơng sai mẫu và độ lệch chuẩn mẫu của
mẫu trên.
Bài 6.6. Lấy ngẫu nhiên 100 thanh niên ở một tỉnh đem đo
chiều cao ta thu đƣợc các số liệu sau:
Chiều cao (cm) Số thanh niên (ni)
154-158 10
158-162 14
162-166 26
166-170 28
170-174 12
174-178 8
178-182 2
Gọi X là chiều cao thanh niên. Hãy xác định trung bình mẫu,
phƣơng sai mẫu.
Bài 6.7. Để điều tra năng suất lúa của một huyện nào đó, ta
gặt ngẫu nhiên 365 điểm trồng lúa của huyện thu đƣợc các kết quả
sau:
Năng suất
(tạ/ha) 25 30 33 34 35 36 37 39 40
Điểm gặt (ni) 6 13 38 74 106 85 30 10 3
Gọi X là năng suất lúa trên một ha canh tác. Hãy xác định
năng suất trung bình, độ phân tán của năng suất.
Bài 6.8. Theo dõi doanh thu của 25 của hàng bán lẻ cùng một
mặt hàng thu đƣợc kết quả sau:
98
Doanh thu (triệu đồng/ngày) Số cửa hàng
10 – 12 2
12 – 14 5
14 – 16 8
16 – 18 7
18 – 20 3
Hãy xác định trung bình mẫu và độ lệch tiêu chuẩn mẫu điều
chỉnh.
Bài 6.9. Để nghiên cứu tuổi thọ của một loại bóng đèn, ngƣời ta
thắp thử 100 bóng và có số liệu sau:
Tuổi thọ (giờ) Số bóng tƣơng ứng
1010 – 1030 2
1030 – 1050 3
1050 – 1070 8
1070 – 1090 13
1090 – 1110 25
1110 – 1130 20
1130 – 1150 12
1150 – 1170 10
1170 – 1190 6
1190 – 1210 1
Sau khi cải tiến kỹ thuật ngƣời ta thắp thử 100 bóng, kết quả thu
đƣợc nhƣ sau:
Tuổi thọ
(giờ) 1150 1160 1170 1180 1190 1200
Số bóng
tƣơng ứng 10 15 20 30 15 10
So sánh trung bình và độ lệch tiêu chuẩn mẫu điều chỉnh của tuổi
thọ loại bóng đèn nói trên trƣớc và sau cải tiến kỷ thuật qua hai mẫu
cụ thể nói trên.
99
Chƣơng 7
BÀI TOÁN ƢỚC LƢỢNG THAM SỐ
7.1. KHÁI NIỆM ƢỚC LƢỢNG. Khi nghiên cứu đặc tính X ở
mỗi phần tử của tổng thể, nếu xác định đƣợc quy luật xác suất của X
thì việc đƣa ra đánh giá cũng nhƣ dự báo về sự biến động của tổng thể
liên quan đến đặc tính này sẽ chính xác và khách quan. Tuy nhiên,
không phải lúc nào chúng ta cũng có thể xác định đƣợc quy luật xác
suất của X. Trong một số trƣờng hợp, chúng ta chỉ biết đƣợc dạng
toán học của hàm phân phối hoặc hàm mật độ của ĐLNN X mà chƣa
biết các tham số có mặt trong chúng. Vì vậy, để xác định quy luật xác
suất của X, trƣớc hết ta phải đánh giá về các tham số này.
Trên thực tế, các tham số của tổng thể nhƣ: kỳ vọng = E(X),
phƣơng sai 2 = D(X), độ lêch chuẩn (X), tỷ lệ xác suất p ... là không
biết, vì ta không thể đi khảo sát hết tất cả các phần tử của tổng thể.
Tuy nhiên, nhiều bài toán chúng ta cần phải ƣớc lƣợng chúng. Việc
ƣớc lƣợng các tham số đó dựa vào một mẫu thống kê (X1, X2, ..., Xn)
đƣợc gọi là Bài toán ước lượng tham số.
Giả sử là một tham số nào đó của tổng thể ( có thể là kỳ vọng
= E(X), phƣơng sai 2 = D(X), độ lêch chuẩn (X), tỷ lệ xác suất
p...). Khi đó căn cứ trên mẫu (X1, X2, ..., Xn) ta cần xác định một đại
lƣợng gần đúng của , hay chỉ ra khoảng (a, b) nào đó mà
P(a b) , là một xác suất cho trƣớc gọi là độ tin cậy,
đủ lớn ( 1).
Nếu chỉ ƣớc lƣợng một giá trị gần đúng của thì gọi là ƣớc
lƣợng điểm của , còn nếu tìm một khoảng (a, b) để P(a b) ,
thì (a, b) đƣợc gọi là ƣớc lƣợng khoảng tin cậy của với độ tin cậy .
7.2. HÀM ƢỚC LƢỢNG VÀ PHƢƠNG PHÁP ƢỚC LƢỢNG ĐIỂM
Do đƣợc tính dựa vào mẫu (X1, X2, ..., Xn) nên nó phải là một
giá trị của thống kê G(X1, X2, ..., Xn), thống kê này đƣợc gọi là hàm
ước lượng, khi đó
100
= G(X1, X2, ..., Xn) sẽ đƣợc dùng để ƣớc lƣợng . Tất nhiên ƣớc
lƣợng của cần phải thỏa mãn một số tiêu chuẩn nào đó.
Có nhiều hàm ƣớc lƣợng = G(X1, X2, ..., Xn) của tham số khác
nhau. Tuy nhiên một hàm ƣớc lƣợng đƣợc coi là tốt nhất nếu nó thỏa
mãn các tiêu chuẩn đƣợc định nghĩa sau đây.
7.2.1. Ƣớc lƣợng không chệch
Thống kê 1 2 nG(X ,X ,...,X ) đƣợc gọi là một ước lượng không
chệch của tham số nếu E( ) .
Thống kê 1 2 nG(X ,X ,...,X ) đƣợc gọi là một ước lượng chệch
của tham số nếu E( ) .
Ví dụ 1. Giả sử dấu hiệu X ở tổng thể là một ĐLNN có kỳ vọng
E(X) = , phƣơng sai D(X) = 2 và 1 2 n(X ,X ,...,X ) là một mẫu ngẫu
nhiên. Khi đó ta có:
i) Thống kê n
i
i 1
1X X
n
là một ƣớc lƣợng không chệch của .
ii) Thống kê n 2
2
i
i =1
1S X -X
n là một ƣớc lƣợng chệch của
2.
iii) Thống kê n 22
i
i =1
1S X X
n 1
là một ƣớc lƣợng không
chệch của 2.
Giải. i) n n n
i i
i 1 i 1 i 1
1 1 1E(X) E X E(X )
n n n
. Vậy X là
một ƣớc lƣợng không chệch của .
ii) Ta có: n n2 2
2
i i
i =1 i =1
1 1S X X (X μ) (X μ)
n n
n n n
22 2
i i
i =1 i =1 i =1
1S X μ 2(X μ) X μ (X μ)
n
n n n
22 2
i i
i =1 i =1 i =1
1 1 1S X μ 2. (X μ) X μ (X μ)
n n n
101
n n n
22 2
i i
i =1 i =1 i =1
1 1 1 1S X μ 2(X μ) X μ .n(X μ)
n n n n
n
22 2
i
i =1
1 1 1S X μ 2(X μ) X .nμ .n(X μ)
n n n
n
22 2
i
i =1
1S X μ (X μ)
n .
Dođó:
n n
2 22 2 2
i i
i =1 i =1
1 1E(S ) E X μ (X μ) E X μ E(X μ)
n n
n n n
i 2i =1 i =1 i =1
1 1 1D(X ) D(X) D(X) D(X)
n n n
n
2 2
i
i =1
1 D(X) n 1D(X ) D(X) D(X) σ σ
n n n
.
Vậy S2 là ƣớc lƣợng chệch của .
iii) Vì 2 2
2 2 2 2n n nS S E(S ) E S E(S )
n 1 n 1 n 1
.
Vậy 2
S là ƣớc lƣợng không chệch của .
7.2.2. Ƣớc lƣợng vững
Thống kê 1 2 nG(X ,X ,...,X ) đƣợc gọi là một ƣớc lƣợng vững
của tham số nếu với mọi > 0 cho trƣớc, ta có:
nlim P 1
.
Ví dụ 2. 1) Giả sử dấu hiệu X ở tổng thể là một ĐLNN có kỳ vọng
E(X) = , phƣơng sai D(X) = 2 và 1 2 n(X ,X ,...,X ) là một mẫu ngẫu
nhiên. Khi đó ta có, thống kê n
i
i 1
1X X
n
là một ƣớc lƣợng vững của .
Giải. Với mọi > 0, áp dụng bất đẳng thức Trê-bƣ-sép với biến
X , ta có:
102
2
2P X 1
n
mà
2
2nlim 1 0
n
nên
nlimP X 1
.
Vậy n
i
i 1
1X X
n
là một ƣớc lƣợng vững của .
2) Xét một dãy n phép thử độc lập, xác suất xuất hiện biến cố A ở
mỗi phép thử là p = P(A). Gọi nA là số lần xuất hiện A trong n phép
thử, tần suất fn(A) = An
nlà ƣớc lƣợng vững của p = p(A). Khẳng định
này đƣợc suy ra từ Định lý Bernoulli.
7.3. PHƢƠNG PHÁP ƢỚC LƢỢNG KHOẢNG
7.3.1. Mở đầu
Ƣớc lƣợng điểm dù tốt nhất cũng chỉ cho ta một giá trị trong tập
vô hạn nên ta không biết đƣợc độ chính xác cũng nhƣ độ tin cậy của
ƣớc lƣợng, do đó không đánh giá đƣợc mức độ sai lầm khi dùng
thay thế cho .
Để khắc phục các hạn chế đó ngƣời ta đƣa ra khái niệm ƣớc lƣợng
khoảng tin cậy cho tham số , theo nghĩa dựa vào một thống kê
1 2 nG(X ,X ,...,X ) và một xác suất cho trƣớc , tìm khoảng (a, b)
sao cho:
P(a b)
trong đó:
+ Xác suất gọi là độ tin cậy của ước lượng.
+ Xác suất = 1- gọi là mức ý nghĩa, nó đánh giá mức độ sai
lầm khi ƣớc lƣợng.
+ Khoảng (a, b) gọi là khoảng tin cậy (khoảng ước lượng).
+ b – a = 2 gọi là độ dài khoảng tin cậy.
+ gọi là độ chính xác của ước lượng.
Bây giờ ta xét cụ thể các bài toán tìm khoảng tin cậy cho tham số
nhƣ sau:
103
7.3.2. Ƣớc lƣợng khoảng tin cậy cho tỷ lệ của tổng thể
Tiến hành một dãy n phép thử độc lập có tần suất xuất hiện biến cố
A là fn = fn(A) = m
n. Với độ tin cậy đã cho, hãy tìm khoảng tin cậy
đối xứng (p1, p2) của p = P(A) chƣa biết sao cho: 1 2P(p p p ) .
Khi n đủ lớn thì thống kê n
p(1 p)f N p,
n
hay
nf pZ n N(0,1)
p(1 p)
.
Vì p chƣa biết (chúng ta đang cố gắng ƣớc lƣợng nó) nên độ lệch
chuẩn p(1 p)
n
ta không biết đƣợc. Tuy nhiên với một số điều
kiện (thƣờng là n 100) ta có thể xấp xỉ p bởi fn. Do đó:
n
n n
f pZ n N(0,1)
f (1 f )
.
Do đó ta luôn tìm đƣợc giá trị phân vị 2
U sao cho:
n n
2 2n n n n
f p f pP n U P n U 1
f (1 f ) f (1 f )
n
2 2n n
f pP U n U
f (1 f )
n n n nn n
2 2
f (1 f ) f (1 f )P f U p f U
n n
Do đó n n n nn n
2 2
f (1 f ) f (1 f )f U p f U
n n
là khoảng
tin cậy đối xứng cho tỷ lệ tổng thể p.
Ví dụ 1. 1) Trong đợt bầu cử tổng thống, ngƣời ta phỏng vấn ngẫu
nhiên 1600 cử tri thì đƣợc biết có 960 ngƣời sẽ bầu cho ứng viên A.
Với độ tin cậy 99% hãy tìm khoảng tin cậy cho tỷ lệ cử tri sẽ đi bỏ
phiếu cho ứng viên A.
104
Giải. Gọi B là biến cố cử tri sẽ đi bỏ phiếu cho ứng viên A;
p = p(B) là tỷ lệ cử tri sẽ đi bỏ phiếu cho ứng viên A.
Trong mẫu cụ thể 1600 cử tri có 960 ngƣời bỏ phiếu cho ứng viên
A nên tỷ lệ mẫu là: f1600(B) = f = 960
0,61600
.
Với độ tin cậy = 99% = 0,99 0,005
2
U U 2,57 .
Độ chính xác của ƣớc lƣợng 0,6.0,4
2,57 0,0321600
.
Vậy với độ tin cậy 99%, khoảng tin cậy cho tỷ lệ p của phiếu bầu
cho ứng viên A là:
(0,6 – 0,032; 0,6 + 0,032) = (0,568; 0,632).
2) Để ƣớc lƣợng số hải cẩu trên một hòn đảo ngƣời ta đánh dấu
cho 2000 con. Sau một thời gian bắt lại 400 con thấy có 80 con có
đánh dấu. Hãy ƣớc lƣợng số hải cẩu có trên đảo với độ tin cậy 95%.
Giải. Gọi p là tỷ lệ hải cẩu có đánh dấu trên đảo.
Tỷ lệ mẫu f = 80/400 = 0,2.
Với độ tin cậy = 95%, ta có 0,025
2
U U 1,96 .
Độ chính xác của ƣớc lƣợng 0,2.0,8
1,96. 0,039400
.
Khoảng tin cậy cho tỷ lệ số hải cẩu có đánh dấu trên hòn đảo là:
(0,2 – 0,039; 0,2 + 0,039) = (0,161; 0,239).
Gọi số hải cẩu có trên đảo là N, khi đó p = 2000
N, nên ta có:
2000 2000 20000,161 0,239 N 8368 N 12422
N 0,239 0,161
7.3.3. Ƣớc lƣợng khoảng tin cậy cho kỳ vọng (trung bình) của
tổng thể
Giả sử trong tổng thể ĐLNN X có tham số kỳ vọng = E(X) chƣa
biết, phƣơng sai của tổng thể 2 = D(X) có thể đã biết hoặc chƣa biết.
Từ tổng thể ta lập mẫu ngẫu nhiên kích thƣớc n (X1, X2, ..., Xn) và độ
105
tin cậy = 1 - cho trƣớc, hãy tìm khoảng tin cậy đối xứng (1, 2)
sao cho: 1 2P( ) .
Để ƣớc lƣợng trung bình tổng thể chúng ta cần biết quy luật
phân phối của trung bình mẫu X , mà quy luật phân phối của X lại
phụ thuộc vào kích thƣớc mẫu n và phƣơng sai của tổng thể 2, nên ta
xét các trƣờng hợp sau:
7.3.3.1. Kích thước mẫu n > 30, 2 đã biết
Nhƣ ta đã biết, vì X
Z n N(0,1)
, nên với độ tin cậy
= 1 - , ta tìm đƣợc phân vị 2
U sao cho:
2
XP n U 1
2 2
P X U X U 1n n
.
Với mẫu cụ thể (x1, x2, ..., xn) thì khoảng tin cậy cho kỳ vọng với
độ tin cậy γ = 1 - là: α α
2 2
σ σx U . ;x + U .
n n
.
Ví dụ 2. Khảo sát về thu nhập của 100 nhân viên làm việc trong
một công ty thu đƣợc kết quả sau:
Thu nhập (triệu đồng/tháng 1 2 3 4 5 6 7 8
Số ngƣời 2 5 8 12 17 16 24 16
Biết rằng thu nhập của các nhân viên là ĐLNN có độ lệch chuẩn
= 200 nghìn đồng. Hãy ƣớc lƣợng thu nhập trung bình của một nhân
viên làm việc ở công ty này với độ tin cậy 95%.
Giải. Gọi là thu nhập trung bình của một nhân viên.
+ Trung bình mẫu:
1x (1.2 2.5 3.8 4.12 5.17 6.16 7.24 8.16) 5,61
100 .
106
+ Với độ tin cậy γ = 1 – α = 95%, ta suy ra α
2
U = U0,025 = 1,96.
+ Độ chính xác của ƣớc lƣợng: 2
0,2U . 1,96. 0,039
n 100
.
+ Khoảng tin cậy thu nhập trung bình của mỗi nhân viên trong
công ty là: (5,61 – 0,039; 5,61 + 0,039) = (5,571; 5,649).
Ví dụ 3. Để xác định chiều cao trung bình của cây bạch đàn trong
khu rừng, ta tiến hành đo ngẫu nhiên 350 cây. Kết quả thu đƣợc nhƣ sau:
Khoảng
chiều cao
(m)
6,5-7,0 7,0-7,5 7,5-8,0 8,0-8,5 8,5-9,0 9,0-9,5
Số cây 20 40 100 110 50 30
Với độ tin cậy 95%, ta có thể nói chiều cao trung bình của cây
bạch đàn thuộc khu rừng trên nằm trong khoảng nào? Giả sử độ lệch
chuẩn của ĐLNN chiều cao cây bạch đàn là 0,64.
Giải: Gọi là chiều cao trung bình của cây bạch đàn trong khu
rừng.
Ta có: n = 35; = 0,64; x 8,064 ; γ 0,95 ; 0,025U 1,96 .
Do đó khoảng ƣớc lƣợng chiều cao trung bình của cây bạch đàn
với độ tin cậy 95% là:
α α
2 2
σ σx U . ;x + U . 7,997 ; 8,131
n n
.
7.3.3.2. Kích thước mẫu n 30, 2 đã biết, X có phân phối chuẩn
Trƣờng hợp này tƣơng tự nhƣ trƣờng hợp 7.3.3.1. Vì
XZ n N(0,1)
, do đó khoảng tin cậy cho kỳ vọng với độ
tin cậy γ = 1 - là:
α α
2 2
σ σx U . ;x + U .
n n
.
7.3.3.3. Kích thước mẫu n > 30, 2 chưa biết
107
Vì n > 30 khá lớn nên ta có thể xấp xỉ S , trƣờng hợp này ta
chỉ thay bởi S . Khi đó khoảng tin cậy của là:
α α
2 2
S SX U . ; X + U .
n n
hayα α
2 2
S SX U . ; X + U .
n-1 n-1
.
Với mẫu cụ thể (x1, x2, ..., xn) thì khoảng tin cậy cho kỳ vọng với
độ tin cậy γ = 1 - là: α α
2 2
s sx U . ;x + U .
n n
hay α α
2 2
s sx U . ;x + U .
n-1 n-1
.
7.3.3.4. Kích thước mẫu n 30, 2 chưa biết, X có phân phối chuẩn
Vì X có phân phối chuẩn nên X X
Z n n 1 T(n 1)SS
.
Do đó, với độ tin cậy = 1 - , sẽ tìm đƣợc giá trị phân vị 2
t (n 1)
sao cho:
2
XP n 1 t (n 1) 1
S
2 2
S SP X t (n 1) X t (n 1) 1
n 1 n 1
Vậy với mẫu cụ thể (x1, x2, ..., xn) thì khoảng tin cậy của kỳ vọng
= E(X) với độ tin cậy γ = 1 - là:
2 2
s sx t (n 1). ;x t (n 1).
n 1 n 1
hoặc 2 2
s sx t (n 1). ;x t (n 1).
n n
.
108
trong đó: 2
t (n 1) đƣợc xác định từ bảng giá trị phân vị của hàm phân
phối Student với n – 1 bậc tự do.
Ví dụ 4. Xét ví dụ 3, với giả thiết độ lệch tiêu chuẩn chƣa biết,
X có phân phối chuẩn. Tìm khoảng ƣớc lƣợng chiều cao trung bình
của cây bạch đàn với độ tin cậy 95%.
Giải: Ta có: x = 8,064; s2
= 0,401; s = 0,633; n = 350.
γ 0,95 1 α α 1 0,95 0,05 .
0,025
1 0,05U 0,475
2
, tra bảng hàm La – pla – ce ta đƣợc
0,025U 1,96 .
Vì n = 350 > 30, D(X) chƣa biết và X có phân phối chuẩn nên áp
dụng trƣờng hợp 7.3.3.3 ta có:
Khoảng ƣớc lƣợng chiều cao trung bình của cây bạch đàn với độ
tin cậy 95% là: α α
2 2
s sx U . ;x + U .
n 1 n 1
0,633 0,633
8,061 1,96. ; 8,061 1,96. 7,998 ; 8,131349 349
Ví dụ 5. Số liệu thống kê doanh số bán của một siêu thị trong một
số ngày cho ở bảng sau:
Doanh số
(triệu đồng/ngày) 24 30 36 42 48 54 60 65 70
Số ngày 5 12 25 35 24 15 12 10 6
a) Ƣớc lƣợng doanh số bán trung bình trong một ngày của siêu thị
này với độ tin cậy 98%.
b) Những ngày có doanh số bán từ 60 triệu đồng trở lên là những
ngày bán đắt hàng. Hãy ƣớc lƣợng doanh số bán trung bình của một
ngày "bán đắt hàng" ở siêu thị này với độ tin cậy 95% (giả thiết doanh
số bán của những ngày bán đắt hàng là ĐLNN có phân phối chuẩn).
Giải.
a) Gọi là doanh số bán trung bình trong một ngày của siêu thị.
109
Từ mẫu ta tính đƣợc: x 45,847 ; s 11,534 .
Với độ tin cậy 98%, ta có: 0,01
2
U U 2,33
Do đó khoảng tin cậy của với độ tin cậy 98% là:
α α
2 2
s sx U . ;x + U .
n n
11,534 11,53445,847 2,33. ;45,847 2,33. (43,607;48,087)
144 144
b) Gọi c là doanh số bán trung bình của một ngày bán đắt hàng
của siêu thị.
Doanh số (triệu đồng/ngày) 60 65 70
Số ngày 12 10 6
Từ bảng này ta tính đƣợc: c
1790x 63,929,
28 cs 3,934 .
Với độ tin cậy 95% thì ta có 0,25
2
t (n 1) t (27) 2,052.
Vì n = 28 < 30, X là ĐLNN có phân phối chuẩn nên, khoảng tin
cậy doanh số bán trung bình của một ngày bán đắt hàng ở siêu thị này
là:
c cc c
2 2c c
s sx t (n 1). ;x t (n 1).
n n
3,934 3,93463,929 2,052. ;63,929 2,052. (62,424;65,435)
28 28
.
7.3.4. Ƣớc lƣợng phƣơng sai
Trên tổng thể , cho ĐLNN X có phân phối chuẩn N(, 2), với
phƣơng sai của tổng thể D(X) = 2 chƣa biết, kỳ vọng của tổng thể
E(X) = có thể đã biết hoặc chƣa biết. Từ mẫu kích thƣớc n
(X1, X2, ..., Xn) và độ tin cậy γ = 1 – α cho trƣớc, tìm khoảng tin cậy
đối xứng 2 2
1 2; sao cho:
2 2 2
1 2P .
110
Để giải bài toán trên, ta xét hai trƣờng hợp sau:
7.3.4.1. Trường hợp đã biết trung bình tổng thể = 0
Giả sử (X1, X2, ..., Xn) là mẫu ngẫu nhiên, khi đó ta có: n
2 2 2
i2i 1
1(X ) (n)
Với độ tin cậy = 1 - cho trƣớc, ta tìm đƣợc các giá trị phân vị 2
2
(n); 2
12
(n)
sao cho:
n2 2 2
i21
i 12 2
1P (n) (X ) (n) 1 1
2 2
.
2 22 2 2 2
2 2 21
2 21
2 2
1 nS nSP (n) nS (n) P
(n) (n)
.
Vậy khoảng tin cậy của 2 với độ tin cậy = 1 - là:
2 22
2 2
12 2
nS nS
(n) (n)
.
trong đó: S2 là phƣơng sai mẫu.
2 2
12 2
(n); (n)
tra từ bảng phân phối 2 với n bậc tự do.
7.3.4.2. Trường hợp chưa biết trung bình tổng thể = 0
Tƣơng tự nhƣ trên, ta có thống kê 2 2 2
2
nS (n 1)
. Do đó
với độ tin cậy = 1 - cho trƣớc, ta tìm đƣợc các giá trị phân vị 2
2
(n 1), 2
12
(n 1)
sao cho:
22 2
21
2 2
nSP (n 1) (n 1) 1 1
2 2
111
2 22
2 2
12 2
nS nSP
(n 1) (n 1)
.
Vậy khoảng tin cậy của 2 với độ tin cậy = 1 - là:
2 22
2 2
12 2
nS nS
(n 1) (n 1)
.
trong đó: S2 là phƣơng sai mẫu.
2 2
12 2
(n 1); (n 1)
tra từ bảng phân phối 2 với n bậc tự do.
Ví dụ 6. Để khảo sát chỉ tiêu X của một loại sản phẩm, ngƣời ta
quan sát một mẫu và có kết quả sau:
X (cm) 11-15) 15-19 19-23 23-27 27-31 31-35 35-39
Số sp ni 8 9 20 16 16 13 18
Giả sử X có phân phối chuẩn. Hãy ƣớc lƣợng phƣơng sai của X
với độ tin cậy γ = 90%.
Giải: Ta có n – 1 = 99 100; X = 26,36 (cm); s2 = 55,4304 (cm
2).
Tra bảng phân phối khi bình phƣơng 2 2 2 2(n 1) (99) (100) bậc tự do, ta đƣợc:
2 2 2 2
0,05 0,951
2 2
(n 1) (100) 124,324; (n 1) (100) 77,93
.
Vậy khoảng ƣớc lƣợng của phƣơng sai là:
2 2
2 2
12 2
n.s n.s ;
(n 1) (n 1)
100 55,4304 100 55,4304
; 44,585 ; 71,128 .124,324 77,93
112
BÀI TẬP CHƢƠNG 7
Bài 7.1. Hãy ƣớc lƣợng tỷ lệ chính phẩm của một nhà máy bằng
khoảng tin cậy đối xứng với độ tin cậy 0,95 biết rằng kiểm tra 100 sản
phẩm của nhà máy thì thấy có 10 phế phẩm.
Đ/s: (0,841; 0,959).
Bài 7.2. Bằng khoảng tin cậy đối xứng hãy ƣớc lƣợng tỷ lệ hạt nảy
mầm với độ tin cậy 95% trên cơ sở kết quả thực nghiệm: gieo 1000
hạt, có 860 hạt nảy mầm.
Đ/s: (0,86; 0,882).
Bài 7.3. Mở thử 200 hộp của một kho đồ hộp, ngƣời ta thấy có 8
hộp bị biến chất. Với độ tin cậy 0,97 hãy ƣớc lƣợng khoảng tỷ lệ đồ
hộp bị biến chất ở kho đó.
Đ/s: (0,009; 0,07).
Bài 7.4. Trƣớc ngày bầu cử khối trƣởng của một khối dân cƣ, một
cuộc thăm dò dƣ luận đã đƣợc tiến hành. Ngƣời ta chọn ngẫu nhiên
100 ngƣời để hỏi ý kiến thì có 60 ngƣời nói rằng họ sẽ bỏ phiếu cho
ông A. Tìm khoảng tin cậy cho tỷ lệ ngƣời bỏ phiếu cho ông A với độ
tin cậy 90%.
Đ/s: (0,52; 0,68).
Bài 7.5. Trong một mẫu ngẫu nhiên gồm 200 ngƣời dùng xe máy,
có 162 ngƣời dùng xe máy 100 phân khối trở lên. Tìm khoảng tin cậy
với mức tin cậy 95% cho tỷ lệ những ngƣời dùng xe lớn hơn 100
phân phối.
Đ/s: (75,5%; 86,5%).
Bài 7.6. Điều tra năng suất lúa trên diện tích 100 ha trồng lúa của
một vùng, ngƣời ta thu đƣợc bảng số liệu sau:
Năng suất (tạ/ha) 41 44 45 46 48 52 54
Diện tích 10 20 30 15 10 10 5
a. Tìm ƣớc lƣợng không chệch của năng suất lúa trung bình của
vùng đó.
b. Tìm khoảng ƣớc lƣợng của năng suất lúa trung bình ở vùng đó
với độ tin cậy 95%.
113
Đ/s: a. 246 s 10,8x ; b. (45,35; 46,69).
Bài 7.7. Đo chiều dài của 25 chi tiết máy do một máy sản xuất,
với phƣơng sai 2 = 100 cm
2, 100 x cm . Giả sử chiều dài tuân
theo quy luật phân phối chuẩn. Hãy tìm khoảng tin cậy của chiều
dài của loại chi tiết đó với độ tin cậy 99%.
Đ/s: (94,86; 105,14).
Bài 7.8. Để xác định trọng lƣợng trung bình của các bao bột
trong kho, ngƣời ta đem cân ngẫu nhiên 15 bao của kho đó và tìm
đƣợc239,8 ; s 0,414x kg . Hãy tìm khoảng ƣớc lƣợng của
trọng lƣợng trung bình của các bao bột trong kho với độ tin cậy là
99%. Giả thiết rằng trọng lƣợng đóng bao của các bao bột là
ĐLNN có phân phối chuẩn.
Đ/s: (39,288; 40,312).
Bài 7.9. Cân thử 25 bao gạo, ngƣời ta tính đƣợc trọng lƣợng
trung bình của một bao gạo là 40 kgx , độ lệch tiêu chuẩn điều
chỉnh mẫu s = 5 kg . Với độ tin cậy 95%, hãy tìm ƣớc lƣợng
khoảng cho trọng lƣợng trung bình của bao gạo, biết rằng trọng
lƣợng của bao gạo là ĐLNN tuân theo quy luật phân phối chuẩn.
Bài 7.10. Điểm trung bình môn XSTK của sinh viên trƣờng
Đại học A là biến ngẫu nhiên có độ lệch chuẩn 0,26 điểm. Khảo
sát ngẫu nhiên 100 sinh viên trƣờng này thấy điểm trung bình môn
XSTK là 5,12 điểm. Hãy ƣớc lƣợng khoảng điểm trung bình môn
XSTK của sinh viên trƣờng A với độ tin cậy 98%?
Đ/s: (5,06 ; 5,18).
Bài 7.11. Để ƣớc lƣợng chiều dài trung bình của các tấm vật
liệu do một nhà máy sản xuất, ngƣời ta tiến hành đo 5 tấm và thu
đƣợc kết quả sau: 2,015; 2,025; 2,015; 2,020; 2,015 (mm). Hãy
ƣớc lƣợng chiều dày trung bình của các tấm vật liệu do nhà máy
sản xuất với độ tin cậy 95%. Biết rằng chiều dày của các tấm vật
liệu là một ĐLNN tuân theo quy luật phân phối chuẩn.
Đ/s: (2,012; 2,024).
114
Bài 7.12. Đo đƣờng kính của 20 chi tiết do một máy tiện sản xuất
ra, ta có số liệu nhƣ sau:
Đƣờng kính (mm) Số chi tiết máy
247 1
248 2
249 3
250 5
251 1
252 1
253 2
255 1
256 1
257 1
258 1
259 1
Giả sử đƣờng kính là một đại lƣợng ngẫu nhiên tuân theo quy luật
phân phối chuẩn. Hãy xác định khoảng ƣớc lƣợng đƣờng kính trung
bình với độ tin cậy 95%.
Đ/s: Khoảng ƣớc lƣợng là (250,036; 253,363).
Bài 7.13. Để định mức thời gian gia công một chi tiết máy, ngƣời
ta theo dõi ngẫu nhiên quá trình gia công ngẫu nhiên 25 chi tiết và thu
đƣợc số liệu sau:
Thời gian gia công (phút) Số chi tiết tƣơng ứng
15 – 17 1
17 – 19 3
19 – 21 4
21 – 23 12
23 – 25 3
25 – 27 2
Hãy ƣớc lƣợng thời gian trung bình để gia công một chi tiết máy
với độ tin cậy 95%. Giả sử thời gian gia công chi tiết là ĐLNN tuân
theo quy luật phân phối chuẩn.
115
Bài 7.14. Để xác định giá trị trung bình của một loại hàng hóa
trên thị trƣờng, ngƣời ta điều tra ngẫu nhiên trên 100 cửa hàng trên
địa bàn thành phố và thu đƣợc các số liệu sau đây:
Giá (ngàn đồng) 83 85 87 89 91 93 95 97 99 101
Số cửa hàng 6 7 12 15 30 10 8 6 4 2
Với độ tin cậy 95% hãy ƣớc lƣợng khoảng giá trị trung bình
của loại hàng hóa đó.
Đ/s: (89,903; 91,537).
Bài 7.15. Trọng lƣợng của một loại sản phẩm là biến ngẫu
nhiên phân phối theo quy luật chuẩn với độ lệch chuẩn là 1 gam.
Cân thử 25 sản phẩm này ta thu đƣợc kết quả sau:
Trọng lƣợng (gam) 18 19 20 21
Số sản phẩm 3 5 15 2
Với độ tin cậy 97% hãy tìm khoảng ƣớc lƣợng trọng lƣợng
trung bình của loại sản phẩm nói trên.
Đ/s: (19,206; 20,074).
Bài 7.16. Để xác định kích thƣớc trung bình của chi tiết do một
nhà máy sản xuất ngƣời ta lấy ngẫu nhiên 200 chi tiết để đo kích
thƣớc và thu đƣợc bảng sau:
Kích thƣớc chi tiết (cm) Số chi tiết tƣơng ứng
54,795 – 54,805 6
54,805 – 54,815 14
54,815 – 54,825 33
54,825 – 54,835 47
54,835 – 54,845 45
54,845 – 54,855 33
54,855 – 54,865 15
54,865 – 54,875 7
Với độ tin cậy 95% hãy ƣớc lƣợng khoảng kích thƣớc trung
bình của chi tiết do máy đó sản xuất. Giả thiết rằng kích thƣớc chi
tiết là ĐLNN có phân phối chuẩn.
116
Đ/s: (54,833; 54,837).
Bài 7.17. Đo đƣờng kính của 100 trục máy do 1 nhà máy sản xuất
thì đƣợc bảng số liệu:
Đƣờng kính (cm) 9,75 9,8 9,85 9,9
Số trục máy 5 37 42 16
Hãy ƣớc lƣợng khoảng giá trị trung bình đƣờng kính của trục máy
với độ tin cậy 97%?
Đ/s: (9,826; 9,843).
Bài 7.18. Giả sử chiều dài của 1 loại sản phẩm là biến ngẫu nhiên
có phân phối chuẩn. Đo ngẫu nhiên 10 sản phẩm này thì đƣợc chiều
dài trung bình 10,02m và độ lệch chuẩn của mẫu chƣa hiệu chỉnh là
0,04m. Tìm khoảng ƣớc lƣợng trung bình chiều dài của loại sản phẩm
này với độ tin cậy 95%?
Đ/s: (9,99;10,050).
Bài 7.19. Năng suất lúa trong vùng A là biến ngẫu nhiên. Gặt ngẫu
nhiên 115 ha lúa của vùng này ta có số liệu:
Năng suất
(tạ/ha) 40–42 42–44 44–46 46–48 48–50 50–52
Diện tích (ha) 7 13 25 35 30 5
Hãy tìm khoảng ƣớc lƣợng trung bình cho năng suất lúa ở vùng A
với độ tin cậy 95%?
Đ/s: (45,983; 46,904).
Bài 7.20. Để nghiên cứu nhu cầu về loại hàng X ở phƣờng A
ngƣời ta tiến hành khảo sát 400 gia đình. Kết quả khảo sát là:
Nhu cầu
(kg/tháng) 0–1 1–2 2–3 3–4 4–5 5–6 6–7 7–8
Số gia đình 10 35 86 132 78 31 18 10
Hãy ƣớc lƣợng khoảng cho trung bình nhu cầu về loại hàng X của
các gia đình ở phƣờng A với độ tin cậy 95%?
Đ/s: (3,478; 3,762).
117
Bài 7.21. Một nhân viên chọn ngẫu nhiên một mẫu n = 12 hóa
đơn trong số các hóa đơn bán hàng của công ty và thu đƣợc giá trị
sau (đơn vị: ngàn đồng): 875, 1231, 453, 522, 2130, 1550, 309,
760, 498, 999, 1320, 1021. Hãy ƣớc lƣợng của giá trị trung bình
của các hóa đơn bán hàng và ƣớc lƣợng của phƣơng sai của các
giá trị của hóa đơn bán hàng.
Bài 7.22. Kiểm tra ngẫu nhiên 16 viên thuốc từ một lô thuốc
mới nhập về tìm đƣợc phƣơng sai mẫu điều chỉnh của thành phần
chính trong mỗi viên thuốc là s2 = 0,078 gam
2. Với độ tin cậy
95% hãy ƣớc lƣợng độ phân tán của thành phần chính trong mỗi
viên thuốc của cả lô thuốc đó. Biết trọng lƣợng là thành phần
chính trong mỗi viên thuốc có phân phối chuẩn.
Đ/s: (0,176; 0,431).
Bài 7.23. Cho biết trọng lƣợng X của một sản phẩm do nhà
máy A sản xuất có phân phối chuẩn 2N( , ) . Chọn ngẫu nhiên
20 sản phẩm đƣợc sản xuất từ nhà máy đó và cân 20 sản phẩm đó
ta có kết quả cho theo bảng sau:
Trọng lƣợng X (kg) 19,3 19,8 20 20,3
Số sản phẩm 5 6 8 1
Hãy tìm khoảng tin cậy của phƣơng sai D(X) = 2 với độ tin
cậy 95% trong hai trƣờng hợp
a. Cho biết kỳ vọng bằng 20.
b. Không biết kỳ vọng.
Đ/s: a. (0,081; 0,29); b. (0,055; 0,204).
118
Chƣơng 8
BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT
8.1. KHÁI NIỆM CHUNG
8.1.1. Giả thuyết thống kê
Giả thuyết về quy luật phân phối xác suất của ĐLNN, về tham số
đặc trƣng của ĐLNN hoặc về tính độc lập của các ĐLNN đƣợc gọi là
giả thuyết thống kê, ký hiệu là H0.
Một giả thuyết trái với giả thuyết H0 đƣợc gọi là đối thuyết, ký
hiệu là H1. H0 và H1 thành lập một cặp giả thuyết thống kê. Khi giả
thuyết H0 bị bác bỏ thì thừa nhận giả thuyết H1 và ngƣợc lại.
Ví dụ 1. 1) Khi nghiên cứu về chiều cao trung bình của một loại
cây A ở trong một khu rừng với chiều cao X của loại cây A đó có
phân phối chuẩn N(, 2), ta có thể đƣa ra giả thuyết sau:
Giả thuyết H0: "Chiều cao trung bình của loại cây A là = 20m".
Khi đó các đối thuyết của H0 có thể là:
Đối thuyết H1: "Chiều cao trung bình 20m".
Đối thuyết H1: "Chiều cao trung bình > 20m".
Đối thuyết H1: "Chiều cao trung bình < 20m".
2) Khi tìm hiểu tuổi thọ của một loại bóng đèn do nhà máy Điện
Quang sản xuất, ta có thể đƣa ra giả thuyết H0 nhƣ sau:
Giả thuyết H0: "Tuổi thọ của một loại bóng đèn đó có phân phối
chuẩn".
Đối thuyết H1: "Tuổi thọ của một loại bóng đèn đó không có phân
phối chuẩn".
Vì các giả thuyết có thể đúng hoặc có thể sai nên cần kiểm định,
tức tìm ra kết luận về thừa nhận hay không thừa nhận đƣợc của giả
thuyết đó. Việc kiểm định này gọi là kiểm định thống kê và nó phải
dựa vào thông tin thực nghiệm của mẫu để kết luận.
8.1.2. Tiêu chuẩn kiểm định
Để kiểm định cặp giả thuyết thống kê H0, H1, từ tổng thể ta chọn ra
mẫu ngẫu nhiên kích thƣớc n là W = (X1, X2, ..., Xn). Dựa vào mẫu
này ta xây dựng thống kê:
119
G = f(X1, X2, ..., Xn, 0).
trong đó 0 là tham số liên quan đến giả thuyết H0, sao cho nếu H0
đúng thì quy luật phân phối xác suất của G hoàn toàn xác định. Khi đó
thống kê G đƣợc gọi là tiêu chuẩn kiểm định.
8.1.3. Miền bác bỏ
Để xây dựng miền bác bỏ, ta sử dụng nguyên lý xác suất nhỏ: Nếu
một biến cố có xác suất khá bé ta có thể coi nó không xảy ra trong
một lần thực hiện phép thử.
Vì quy luật phân phối xác suất của G đã biết nên với một xác suất
khá bé cho trƣớc, ta có thể tìm đƣợc miền W tƣơng ứng sao cho
nếu giả thuyết H0 đúng thì xác suất để G nhận giá trị thuộc miền W
bằng :
0P(G W / H )
Vì khá bé, theo nguyên lý xác suất nhỏ ta có thể coi biến cố
(G W/H0) không xảy ra trong một lần thực hiện phép thử.
Giá trị đƣợc gọi là mức ý nghĩa của kiểm định và miền W đƣợc
gọi là miền bác bỏ giả thuyết H0 với mức ý nghĩa .
Ký hiệu W là miền bù của W, đƣợc gọi là miền chấp nhận giả
thuyết H0.
8.1.4. Giá trị quan sát của tiêu chuẩn kiểm định
Thực hiện một phép thử đối với mẫu ngẫu nhiên
W = (X1, X2, ..., Xn) thu đƣợc một mẫu cụ thể w = (x1, x2, ..., xn) và
qua đó ta tìm đƣợc giá trị thực nghiệm của thống kê G là
g = f(x1, x2, ..., xn, 0) giá trị này gọi là giá trị quan sát của tiêu chuẩn
kiểm định.
8.1.5. Quy tắc kiểm định giả thuyết thống kê
Sau khi tính đƣợc giá trị quan sát g của tiêu chuẩn kiểm định, ta so
sánh giá trị này với miền bác bỏ W và kết luận theo nguyên tắc sau:
i) Nếu g W thì ta có cơ sở để bác bỏ H0 và thừa nhận H1.
ii) Nếu g W thì ta chƣa có đủ cơ sở để kết luận H0 đúng mà chỉ
có thể nghĩa là qua mẫu cụ thể này chƣa khẳng định đƣợc H0 sai. Do
120
đó ta chỉ có thể nói: Qua mẫu cụ thể này chƣa có cơ sở để bác bỏ H0
(trên thực tế là vẫn thừa nhận H0).
8.1.6. Các sai lầm mắc phải khi thực hiện một bài toán kiểm định
Trong kiểm định giả thuyết, ta không thể biết đƣợc chắc chắn giả
thuyết H0 đúng hay sai, vì mẫu chỉ là một phần của tổng thể. Do vậy,
ta có thể mắc phải một trong hai loại sai lầm sau đây:
Sai lầm loại 1: Trên thực tế giả thuyết H0 đúng nhƣng qua kiểm
định, ta lại kết luận giả thuyết H0 sai. Ngƣời ta ký hiệu khả năng mắc
sai lầm loại này là , và đƣợc gọi là mức ý nghĩa.
P(G W/H0 đúng) =
Sai lầm loại 2: Trên thực tế giả thuyết H0 sai nhƣng qua kiểm
định, ta lại kết luận giả thuyết H0 đúng. Ngƣời ta ký hiệu khả năng
mắc sai lầm loại này là .
P(G W /H0 đúng) =
Ta mong muốn chọn W sao cho cả hai khả năng mắc sai lầm đã
nêu trên là thấp nhất. Nhƣng ta biết rằng khi giảm sai lầm loại 1 thì
khả năng sai lầm loại 2 tăng lên và ngƣợc lại. Khi kiểm định giả thiết,
ngƣời ta có thể ấn định trƣớc mức ý nghĩa rồi tìm miền W sao cho
sai lầm loại 1 không vƣợt quá và sai lầm loại 2 là cực tiểu.
8.1.7. Quy tắc chung khi kiểm định giả thuyết thống kê
Bước 1. Thiết lập giả thuyết H0 và đối thuyết H1
Ta có 3 loại bài toán sau:
Bài toán 1 Bài toán 2 Bài toán 3
Giả thiết H: = 0
Đối thiết K: 0
Giả thiết H: = 0
Đối thiết K: > 0
Giả thiết H: = 0
Đối thiết K: < 0
Với là tham số chƣa biết nào đó của ĐLNN X, 0 là một giá trị
cụ thể nào đó đƣợc biết trƣớc.
Bước 2. Lập mẫu ngẫu nhiên của X là (X1, X2, ..., Xn); chọn tiêu
chuẩn kiểm định G = f(X1, X2, ..., Xn, 0) và xác định quy luật phân
phối của nó với điều kiện giả thuyết H0 đúng.
Bước 3. Với mức ý nghĩa , xác định miền bác bỏ giả thuyết H0 là W.
Bước 4. Với mẫu cụ thể (x1, x2, ..., xn), ta có giá trị của tiêu chuẩn
kiểm định g = f(x1, x2, ..., xn, 0).
121
Bước 5. Nếu g W thì ta có cơ sở để bác bỏ H0 và thừa nhận H1
với mức ý nghĩa .
Nếu g W thì ta chƣa có đủ cơ sở để bác bỏ kết luận H0, tạm
thời chấp nhận H0 đúng với mức ý nghĩa .
8.2. KIỂM ĐỊNH THAM SỐ
8.2.1. Kiểm định về kỳ vọng của ĐLNN có phân phối chuẩn
8.2.1.1. Trường hợp phương sai 2 đã biết
Giả sử ĐLNN X trong tổng thể có phân phối chuẩn N(, 2) với
phƣơng sai 2 đã biết nhƣng chƣa biết kỳ vọng . Nếu có cơ sở để giả
thiết rằng giá trị của nó bằng 0, ta đƣa ra giả thuyết thống kê
H0: = 0.
Từ mẫu ngẫu nhiên W = (X1, X2, ..., Xn) ta chọn thống kê:
0(X )G n
Nếu giả thuyết H0 đúng, thì G N(0,1) .
Với mức ý nghĩa thì tùy thuộc vào dạng của đối thuyết H1, ta xét
các trƣờng hợp sau:
a) Bài toán 1. Giả thuyết H0: = 0
Đối thuyết H1: 0
Vì G N(0,1) nên với mức ý nghĩa [0, 1], ta có thể tìm đƣợc
giá trị phân vị
2
Usao cho:
2
P( G U ) .
Mặt khác theo nguyên lý xác suất nhỏ, nếu H0 đúng, ta tìm đƣợc
W sao cho: 0P(G W / H ) .
Do đó:
00
2 2
(X )P(G W / H ) P( G U ) P n U
.
Hay miền bác bỏ của H0 là 0
2
(X )W n U
.
Vậy với mẫu cụ thể w = (x1, x2, ..., xn) ta thực hiện bài toán kiểm
định theo các bƣớc sau:
122
+ Tính x và 0μ n
g = σ
x .
+ Với mức ý nghĩa , suy ra α
2
U .
+ So sánh g và α
2
U :
Nếu α
2
g > U ta bác bỏ H0, chấp nhận H1.
Nếu α
2
g U ta chấp nhận H0, bác bỏ H1.
Ví dụ 1. Giám đốc một xí nghiệp cho biết lƣơng trung bình của
một công nhân thuộc xí nghiệp hiện nay là 6 triệu/tháng. Chọn ngẫu
nhiên 36 công nhân thấy lƣơng trung bình là 5,2 triệu/đồng. Lời báo
cáo của giám đốc có tin cậy đƣợc không với mức ý nghĩa bằng
α = 5%, biết rằng tiền lƣơng của công nhân là ĐLNN phân phối chuẩn
với độ lệch chuẩn 0,4.
Giải: Gọi X là tiền lƣơng của công nhân, là tiền lƣơng trung
bình thực sự của công nhân hiện nay. X là ĐLNN có phân phối chuẩn.
D(X) = (0,4)2 đã biết.
Theo yêu cầu của đề bài, ta có bài toán kiểm định giả thuyết:
Giả thuyết H0: μ = 6
Đối thuyết H1: μ 6
Với n = 36; x = 5,2; = 0,4
0( μ ) n (5,2 6) 36g 12.
σ 0,4
x
Với α = 5%, tra bảng hàm La-pla-ce ta đƣợc: α
2
U = 0,025U 1,96.
Đối chiếu g và α
2
U , ta thấy α
2
g > U nên bác bỏ H0, chấp nhận
H1; nghĩa là với mức ý nghĩa 5% thì lời nói của giám đốc là sai.
b) Bài toán 2. Giả thuyết H0: = 0
Đối thuyết H1: > 0
123
Tƣơng tự nhƣ trên với mức ý nghĩa [0, 1], ta có thể tìm đƣợc
giá trị phân vị U sao cho:
00
(X )P(G W / H ) P(G U ) P n U
.
Hay miền bác bỏ của H0 là 0(X )W n U
.
Với mẫu cụ thể w = (x1, x2, ..., xn) ta thực hiện bài toán kiểm định
theo các bƣớc sau:
+ Tính x và 0μ n
g = σ
x .
+ Với mức ý nghĩa , suy ra U .
+ So sánh g và U
Nếu g > U ta bác bỏ H0, chấp nhận H1.
Nếu g U ta chấp nhận H0, bác bỏ H1.
Ví dụ 2. Một vƣờn cây con phi lao có chiều cao trung bình chƣa
xác định. Theo hợp đồng đã ký giữa ngƣời sản xuất cây con và lâm
trƣờng trồng cây thì chỉ khi nào chiều cao của cây đạt trên 1m mới
đem ra trồng để đảm bảo sống cao.
Ngƣời ta điều tra ngẫu nhiên 50 cây trong vƣờn và tính đƣợc chiều
cao trung bình x = 1,1 m. Hỏi vƣờn cây phi lao nói trên đã đƣa ra
trồng đƣợc chƣa? Cho biết chiều cao của cây phi lao là ĐLNN có
phân phối chuẩn và sự biến động về chiều cao của cây phi lao trong
giai đoạn vƣờn ƣơm ở trong những điều kiện tƣơng tự là = 0,1 m;
= 0,05.
Giải: Gọi X là chiều cao của cây con phi lao trong vƣờn ƣơm.
là chiều cao trung bình của cây con phi lao trong vƣờn ƣơm.
X là ĐLNN có phân phối chuẩn; kích thƣớc mẫu n = 50 > 30.
Phƣơng sai D(X) = 2 = (0,1)
2 đã biết.
Theo yêu cầu của đề bài ta có bài toán:
Giả thuyết H0: = 1
124
Đối thuyết H1: > 1
Ta có: n = 50; = 0,05; x = 1,1; 0 = 1.
0x μ n 1,1 1 50
g = 7,071σ 0,1
.
Với α = 0,05 tra bảng hàm La-pla-ce ta đƣợc: 0,05U 1,64
Ta có 0,05g > U nên bác bỏ H, chấp nhận K; nghĩa là có thể đƣa
cây phi lao trên ra trồng đƣợc.
c) Bài toán 3. Giả thuyết H0: = 0
Đối thuyết H1: < 0
Tƣơng tự nhƣ trên với mức ý nghĩa [0, 1], ta có thể tìm đƣợc
giá trị phân vị U sao cho:
00
(X )P(G W / H ) P(G U ) P n U
.
Hay miền bác bỏ của H0 là 0(X )W n U
.
Với mẫu cụ thể w = (x1, x2, ..., xn) ta thực hiện bài toán kiểm định
theo các bƣớc sau:
+ Tính x và 0μ n
g = σ
x .
+ Với mức ý nghĩa , suy ra α U .
+ So sánh g và α U .
Nếu g > U ta bác bỏ H0, chấp nhận H1.
Nếu g U ta chấp nhận H0, bác bỏ H1.
Ví dụ 3. Trọng lƣợng X gói mì ăn liền tuân theo qui luật chuẩn
N(, 25). Từ mẫu 25 gói mì ăn liền ta tìm đƣợc trung bình mẫu
x 82g . Với mức ý nghĩa = 0,05 hãy kiểm định giả thuyết:
Giả thuyết H0: = 85
Đối thuyết H1: < 85
125
Giải. Ta có 0μ n (82 85) 25
g = 3σ 5
x ; 0,05U 1,64 .
Vì g > U , nên ta bác bỏ H0.
8.2.1.2. Trường hợp phương sai 2 chưa biết
Giả sử ĐLNN X trong tổng thể có phân phối chuẩn N(, 2) với
phƣơng sai 2 và kỳ vọng chƣa biết. Nếu có cơ sở để giả thiết rằng
giá trị của nó bằng 0, ta đƣa ra giả thuyết thống kê H0: = 0.
Từ mẫu ngẫu nhiên W = (X1, X2, ..., Xn) ta chọn thống kê:
0(X )G n 1
S
Nếu giả thuyết H0 đúng, thì G T(n 1) .
Với mức ý nghĩa thì tùy thuộc vào dạng của đối thuyết H1, ta xét
các trƣờng hợp sau:
a) Bài toán 1. Giả thuyết H0: = 0
Đối thuyết H1: 0
Vì G T(n 1) nên với mức ý nghĩa [0, 1], ta có thể tìm đƣợc
giá trị phân vị 2
t (n 1) sao cho:2
P( G t (n 1)) .
Mặt khác theo nguyên lý xác suất nhỏ, nếu H0 đúng, ta tìm đƣợc
W sao cho: 0P(G W / H ) .
Do đó: 0
2
P(G W / H ) P( G t (n 1))
0
2
(X )P n 1 t (n 1)
S
.
Hay miền bác bỏ của H0 là 0
2
(X )W n 1 t (n 1)
S
.
Vậy với mẫu cụ thể w = (x1, x2, ..., xn) ta thực hiện bài toán kiểm
định theo các bƣớc sau:
+ Tính x và 0x μ n 1
g = s
.
126
+ Tra bảng phân phối Student tìm α
2
t (n 1) .
+ So sánh g và α
2
t (n 1) .
Nếu α
2
g > t (n 1) ta bác bỏ H0, chấp nhận H1.
Nếu α
2
g t (n 1) ta chấp nhận H0, bác bỏ H1.
Ví dụ 4. Năng suất lúa là một ĐLNN có phân phối chuẩn N(, 2).
Điều tra năng suất giống lúa trên ở 200 ha ta thu đƣợc bảng số liệu
sau:
Năng suất (tạ/ha) 46 48 49 50 51 53 54 58
Diện tích (ha) 17 18 35 45 42 23 10 10
Với mức ý nghĩa 5%, hãy kiểm tra ý kiến sau đúng hay sai: năng
suất lúa trung bình của giống lúa đó là 52 tạ/ha.
Giải. Gọi X là năng suất của giống lúa, là năng suất lúa trung
bình của giống lúa.
X là ĐLNN có phân phối chuẩn. D(X) = 2 chƣa biết. n = 200,
0 = 52 tạ.
Ta có bài toán: Giả thuyết H0: = 52
Đối thuyết H1: 52
Từ mẫu ta tính đƣợc x 50,16 ; 2s 37,114 s 6,092 .
Ta có 0x μ n 1 50,16 52 199
g = 4,261s 6,092
.
Với mức ý nghĩa = 5% 0,025 0,025t (199) = U 1,96 .
Vì α
2
g > t (n 1) nên ta bác bỏ H0, nghĩa là ý kiến đó sai.
b) Bài toán 2. Giả thuyết H0: = 0
Đối thuyết H1: > 0
Tƣơng tự mục 8.2.1.2 a) từ thống kê 0(X )G n 1
S
có phân
phối T(n–1), ta có miền bác bỏ của H0 nhƣ sau:
127
0(X )W n 1 t (n 1)
S
Vậy với mẫu cụ thể w = (x1, x2, ..., xn) ta thực hiện bài toán kiểm
định theo các bƣớc sau:
+ Tính x và 0x μ n 1
g = s
.
+ Tra bảng phân phối Student tìm αt (n 1) .
+ So sánh g và αt (n 1) :
Nếu αg > t (n 1) ta bác bỏ H0, chấp nhận H1.
Nếu αg t (n 1) ta chấp nhận H0, bác bỏ H1.
Ví dụ 5. Trong điều kiện chăn nuôi bình thƣờng, lƣợng sữa trung
bình của một con bò 14kg/ngày. Cải tiến chế độ chăn nuôi đã cho
lƣợng sữa nhiều lên. Để có thông tin ngƣời ta đã điều tra ngẫu nhiên
40 con bò và tính đƣợc lƣợng sữa trung bình/ngày của 1 con bò x là
18kg và độ lệch tiêu chuẩn s = 2,5 kg. Với mức ý nghĩa = 0,1 thử
xem lƣợng sữa trung bình của bò có tăng thực sự hay không? Cho biết
lƣợng sữa/ngày của một con bò là ĐLNN có phân phối chuẩn.
Giải: Gọi X là lƣợng sữa 1 ngày của một con bò. X là ĐLNN có
phân phối chuẩn. D(X) = 2 chƣa biết.
Theo yêu cầu của bài toán, ta có bài toán kiểm định giả thuyết:
Giả thuyết H0: µ = 14
Đối thuyết H1: µ > 14
Ta có: n = 40; s = 2,5; x = 18.
0X μ n 1 (18 14) 39g 9,992.
s 2,5
Vì = 0,1 tra bảng phân phối Student ta đƣợc 0,1 0,1t (39) = U 1,27.
Vì U > 0,1 0,1t (39) = U 1,27 nên bác bỏ H, chấp nhận K; lƣợng sữa
đã tăng lên thực sự.
c) Bài toán 3. Giả thuyết H0: = 0
Đối thuyết H1: < 0
128
Tƣơng tự mục 8.2.1.2 a) từ thống kê 0(X )G n 1
S
có
phân phối T(n–1), ta có miền bác bỏ của H0 nhƣ sau:
0(X )W n 1 t (n 1)
S
Vậy với mẫu cụ thể w = (x1, x2, ..., xn) ta thực hiện bài toán
kiểm định theo các bƣớc sau:
+ Tính x và 0x μ n 1
g = s
.
+ Tra bảng phân phối Student tìm αt (n 1) .
+ So sánh – g và αt (n 1) :
Nếu αg > t (n 1) ta bác bỏ H0, chấp nhận H1.
Nếu αg t (n 1) ta chấp nhận H0, bác bỏ H1.
Ví dụ 6. Trọng lƣợng đóng bao của các bao gạo trong kho là
ĐLNN có phân phối chuẩn với trọng lƣợng trung bình theo quy định
là 50 kg.
Nghi ngờ gạo bị đóng thiếu, ngƣời ta đem cân ngẫu nhiên 25 bao
và thu đƣợc các số liệu nhƣ sau:
Trọng lƣợng (kg) 48-48,5 48,5-49 49-49,5 49,5-50 50-50,5
Số bao 2 5 10 6 2
Với mức ý nghĩa α = 0,01 hãy kết luận về điều nghi ngờ nói trên.
Giải. Gọi X là trọng lƣợng đóng bao của bao gạo. X là ĐLNN có
phân phối chuẩn; D(X) chƣa biết.
Trọng lƣợng đóng bao trung bình theo quy định là tham số µ0 = 50 (kg).
Đây là bài toán kiểm định tham số µ của phân phối chuẩn N(µ, 2)
khi chƣa biết 2. Theo yêu cầu của bài toán, ta có bài toán kiểm định
giả thuyết:
Giả thiết H0: µ = 50
Đối thiết H1: µ < 50
Từ bảng ta tính đƣợc: x = 49,27; s = 0,519.
129
0x μ n 1 (49,27 50) 24
g = 6,891.s 0,519
Tra bảng phân phối Student ta tìm đƣợc α 0,01t (n 1) t (24) 2,49.
Đối chiếu ta thấy 0,01 g = 6,891 t (24) 2,49 nên bác bỏ H,
chấp nhận K; tức là qua mẫu cụ thể này thừa nhận gạo bị đóng thiếu
với mức ý nghĩa 0,01.
Chú ý. Nếu mẫu ngẫu nhiên có phân phối bất kỳ và kích thước
mẫu n 30 thì các trường hợp 8.2.1.1. và 8.2.1.2 vẫn áp dụng được.
8.2.2. Kiểm định về phƣơng sai của ĐLNN có phân phối chuẩn
Giả sử nghiên cứu dấu hiệu X trong tổng thể, X là một ĐLNN có
phân phối chuẩn N(, 2) với phƣơng sai
2 chƣa biết, song có cơ sở
để giả thiết rằng giá trị của nó là 2
0 . Ta đƣa ra giả thuyết thống kê H0:
2 = 2
0 .
8.2.2.1.Trường hợp kỳ vọng E(X) = đã biết
Để kiểm định giả thuyết trên từ mẫu ta rút ra mẫu ngẫu nhiên có
kích thƣớc n là W = (X1, X2, ..., Xn) và chọn tiêu chuẩn kiểm định là
thống kê:
22
2
2 2
nS (n 1)SG
Nếu giả thuyết H0 đúng thì thống kê
22 2
2
0
nSG (n)
, do đó
với mức ý nghĩa cho trƣớc và tùy thuộc vào dạng của đối thuyết H1
ta xây dựng đƣợc miền bác bỏ W của H0 theo các trƣờng hợp sau
đây:
Trường hợp 1. Giả thuyết H0: 2 = 2
0
Đối thuyết H1: 2 2
0
Miền bác bỏ của H0 là 2 2
2 2
2 21
0 02 2
nS nSW (n) (n)
.
Trường hợp 2. Giả thuyết H0: 2 = 2
0
Đối thuyết H1: 2 > 2
0
130
Miền bác bỏ của H0 là 2
2
2
0
nSW G (n)
.
Trường hợp 3. Giả thuyết H0: 2 = 2
0
Đối thuyết H1: 2 < 2
0
Miền bác bỏ của H0 là 2
2
12
0
nSW G (n)
.
Với mẫu cụ thể w = (x1, x2, ..., xn) ta thực hiện bài toán kiểm định
theo các bƣớc sau:
+ Tính s và
2
2
0
n.sg
.
+ Tra bảng phân phối khi bình phƣơng tìm α (n) hoặc
α
2
(n) .
+ Nếu g W thì ta bác bỏ H0, chấp nhận H1.
Nếu g W thì ta chấp nhận H0, bác bỏ H1.
Ví dụ 7. Một máy đóng gói tự động đƣợc coi là hoạt động bình
thƣờng nếu phƣơng sai về trọng lƣợng của các gói hàng do máy đóng
không vƣợt quá 100 (gam)2. Cân ngẫu nhiên 15 gói hàng do máy đóng
và tính đƣợc phƣơng sai mẫu điều chỉnh là 180 (gam)2. Với mức ý
nghĩa 5% có thể nói máy vẫn hoạt động bình thƣờng hay không? Biết
trọng lƣợng của các gói hàng do máy đóng là ĐLNN phân phối chuẩn
N(5600, 2).
Giải: Gọi X là trọng lƣợng của các gói hàng do máy đóng. X là
ĐLNN có phân phối chuẩn; E(X) = = 5600; = 0,05; n = 15.
Ta có bài toán kiểm định:
Giả thuyết H0: 2 = 100
Đối thuyết H1: 2 < 100
Theo giả thiết bài toán, ta có:
2 22 n 1 14
s 180 s s .180 168.n 15
131
2
2
0
n.s 15.168g 15,5.
100
Tra bảng phân phối khi bình phƣơng ta đƣợc
1 α 0,95(n) = (15) = 7,261.
Vì
2
1 0,952
0
n.sg 15,5 (n) (15) 7,261
nên bác bỏ H1,
nghĩa là máy hoạt động không bình thƣờng.
8.2.2.2.Trường hợp kỳ vọng E(X) = chưa biết
Để kiểm định giả thuyết trên từ mẫu ta rút ra mẫu ngẫu nhiên có
kích thƣớc n là W = (X1, X2, ..., Xn) và chọn tiêu chuẩn kiểm định là
thống kê: 2
22
2 2
nS (n 1)SG
Nếu giả thuyết H0 đúng thì thống kê
22 2
2
0
nSG (n 1)
, do
đó với mức ý nghĩa cho trƣớc và tùy thuộc vào dạng của đối thuyết
H1 ta xây dựng đƣợc miền bác bỏ W của H0 theo các trƣờng hợp sau
đây:
Trường hợp 1. Giả thuyết H0: 2 = 2
0
Đối thuyết H1: 2 2
0
Miền bác bỏ của H0 là:
2 22 2
2 21
0 02 2
nS nSW (n 1) (n 1)
.
Trường hợp 2. Giả thuyết H0: 2 = 2
0
Đối thuyết H1: 2 > 2
0
Miền bác bỏ của H0 là 2
2
2
0
nSW G (n 1)
.
Trường hợp 3. Giả thuyết H0: 2 = 2
0
Đối thuyết H1: 2 < 2
0
132
Miền bác bỏ của H0 là 2
2
12
0
nSW G (n 1)
.
Với mẫu cụ thể w = (x1, x2, ..., xn) ta thực hiện bài toán kiểm định
theo các bƣớc sau:
+ Tính s và 2
2
0
nSg
.
+ Tra bảng phân phối khi bình phƣơng tìm α (n-1) hoặc
α
2
(n-1) .
+ Nếu g W thì ta bác bỏ H0, chấp nhận H1.
Nếu g W thì ta chấp nhận H0, bác bỏ H1.
Ví dụ 8. Một máy sản xuất các tấm chất dẻo đƣợc thƣờng xuyên
theo dõi về độ dày của sản phẩm. Biết độ dày X của các tấm chất dẻo
là ĐLNN có phân phối chuẩn. Nếu độ lệch chuẩn vƣợt quá 0,3 mm thì
chất lƣợng sản phẩm không đƣợc đảm bảo về kỹ thuật. Ngƣời ta chọn
ngẫu nhiên 10 tấm chất dẻo rồi đo độ dày của mỗi tấm và đƣợc kết
quả sau (đơn vị đo mm): 22; 22,6; 23,2; 22,7; 22,5; 22,8; 22,5; 22,8;
22,9; 23. Từ yêu cầu của thực tế với mức ý nghĩa 5% hãy lập cặp giả
thuyết và đối thuyết thích hợp đánh giá tình trạng làm việc của máy
sản xuất các tấm chất dẻo trên.
Giải. Ta có E(X) = chƣa biết.
Độ lệch chuẩn ở mức cho phép không vƣợt quá 0,3 mm tƣơng ứng
với phƣơng sai 2 không vƣợt quá 0,09 mm
2. Ta có bài toán kiểm định
giả thuyết:
Giả thuyết H0: 2 = 0,09
Đối thuyết H1: 2 > 0,09
Với mẫu đã cho ta có: x 22,7 ; s2 = 0,098 s = 0,313.
Ta có 2
2
0
nS 10.0,098g 10,889.
0,09
Với mức ý nghĩa = 0,05 ta có: 2 2
0,05(n 1) (9) 16,919 .
Miền bác bỏ của H0 là W 16,919; .
133
Vì g = 10,889 W nên chấp nhận H0, nghĩa là máy sản xuất tấm
dẻo vẫn hoạt động bình thƣờng.
8.2.3. Kiểm định về tỷ lệ xác suất
Giả sử trong dãy n phép thử Bernoulli biến cố A xuất hiện m lần.
Gọi p là xác suất để biến cố A xuất hiện trong mỗi phép thử (p chƣa
biết). Từ một cơ sở nào đó ngƣời ta tìm đƣợc p = p0, nhƣng nghi ngờ
về điều này. Với mức ý nghĩa α cần kiểm định giả thuyết H0: p = p0.
Với mức ý nghĩa , ta xây dựng quy tắc kiểm định của cặp giả
thuyết, đối thuyết sau:
Giả thuyết H0: p = p0
Đối thuyết H1: p p0
Xét thống kê m np
Gnp(1 p)
, thống kê này theo định lý giới hạn
trung tâm có phân phối xấp xỉ chuẩn tắc N(0,1). Nếu H0 đúng thì
0
0 0
m npG N(0,1)
np (1 p )
.
Tƣơng tự nhƣ bài toán kiểm định kỳ vọng của ĐLNN có phân phối
chuẩn, ta có quy tắc kiểm định bài toán trên là:
+ Nếu 0
20 0
m npG U
np (1 p )
thì ta bác bỏ H0.
+ Nếu 0
20 0
m npG U
np (1 p )
thì ta chấp nhận H0.
Ví dụ 9. Gieo 300 hạt giống đậu tƣơng. Ta thấy có 261 hạt nảy
mầm. Ngƣời ta nói rằng tỉ lệ nảy mầm của hạt đậu tƣơng là p = 0,9.
Điều đó có đúng hay không? Tại sao? Cho mức ý nghĩa α = 5%.
Giải. Ta xem việc gieo 300 hạt giống đậu tƣơng nhƣ là tiến hành
300 phép thử Bernoulli. Xác suất nảy mầm của hạt đậu tƣơng là p.
Bài toán kiểm định giả thuyết:
Giả thuyết H0: p = 0,9
Đối thuyết H1: p 0,9.
Ở đây n = 300, p0 = 0,9, m = 261 nên
134
0
0 0
m np 261 300.0,9g = 1,73.
np (1 p ) 300.0,9.(1 0,9)
Tra bảng hàm La–pla–ce, tìm 0,025 0,025 U 0,475 U 1,96 .
Vì 2
g < U nên ta chấp nhận H, bác bỏ K; nghĩa là tỉ lệ nảy mầm
của hạt đậu tƣơng p = 0,9 là đúng.
Chú ý 1. Với cặp giả thuyết, đối thuyết
Giả thiết H: p = p0
Đối thiết K: p > p0
Ta có quy tắc kiểm định bài toán trên là:
+ Nếu 0
0 0
m npU
np (1 p )
thì ta bác bỏ H0.
+ Nếu 0
0 0
m npU
np (1 p )
thì ta chấp nhận H0.
Chú ý 2. Với cặp giả thuyết, đối thuyết
Giả thuyết H0: p = p0
Đối thuyết H1: p < p0
Ta có quy tắc kiểm định bài toán trên là:
+ Nếu 0
0 0
m npU
np (1 p )
thì ta bác bỏ H0.
+ Nếu 0
0 0
m npU
np (1 p )
thì ta chấp nhận H0.
Ví dụ 10. Một kho hạt giống có tỉ lệ nảy mầm xác định p0 = 0,9.
Ngẫu nhiên có một thiết bị bị hỏng làm thay đổi điều kiện bên trong
của kho. Hỏi tỉ lệ nảy mầm của kho hạt giống có còn giữ nguyên hay
không với mức ý nghĩa = 0,05? Để có thông tin về tỷ lệ nảy mầm
mới của kho ta làm thí nghiệm 200 hạt thấy có 140 hạt nảy mầm.
Giải: Bài toán kiểm định giả thuyết
Giả thuyết H0: p = 0,9
Đối thuyết H1: p < 0,9.
135
Ta có:
0
0 0
m np 140 200.0,9g = 9,428 U 1,64
np (1 p ) 200.0,9(1 0,9)
.
Nên ta bác bỏ H0, chấp nhận H1; tức tỷ lệ nảy mầm của kho đã bị
giảm đi.
136
BÀI TẬP CHƢƠNG 8
Bài 8.1. Trong nhà máy bánh kẹo A, một máy tự động sản xuất ra
các thanh chocolate với trọng lƣợng quy định là 250gram và độ lệch
chuẩn là 5gram. Trong một ngày, bộ phận kiểm tra kỹ thuật chọn một
mẫu ngẫu nhiên gồm 32 thanh chocolate và tính đƣợc trọng lƣợng
trung bình của chúng là 248gram. Hãy kiểm định giả thuyết H: “Trọng
lƣợng các thanh chocolate do máy tự động sản xuất ra đúng quy
định”, với mức ý nghĩa α = 0,05?
Đ/s: Bác bỏ giả thuyết “Trọng lƣợng các thanh chocolate do máy
tự động sản xuất ra đúng quy định”.
Bài 8.2. Trọng lƣợng sản phẩm một nhà máy sản xuất (X) là một
ĐLNN phân phối theo quy luật chuẩn với độ lệch chuẩn 2 kg và trọng
lƣợng trung bình 20 kg. Nghi ngờ máy hoạt động không bình thƣờng
làm thay đổi trọng lƣợng trung bình của sản phẩm, ngƣời ta cân thử
100 sản phẩm và thu đƣợc kết quả sau:
Trọng lƣợng sản phẩm (kg) 19 20 21 22 23
Số sản phẩm tƣơng ứng 10 60 20 5 5
Với mức ý nghĩa hãy kết luận về điều nghi ngờ trên với mức ý
nghĩa 97%.
Bài 8.3. Trọng lƣợng quy định một loại chi tiết là 250 (gam). Giả
sử trọng lƣợng tuân theo quy luật phân phối chuẩn N(µ, 25). Ngƣời ta
lấy mẫu gồm 16 chi tiết và tính đƣợc trọng lƣợng trung bình là 244
gam. Hãy kiểm định giả thiết H: µ = 250 với đối thiết K: µ < 250, với
mức ý nghĩa 5%.
Bài 8.4. Trọng lƣợng một loại gà ở trại chăn nuôi A khi xuất
chuồng là 3,62 kg/con. Biết trọng lƣợng gà là biến ngẫu nhiên có
phân phối chuẩn N(µ; 0,01). Sau một thời gian ngƣời ta cho gà ăn
thức ăn mới và cân thử 15 con khi xuất chuồng thấy trọng lƣợng trung
bình của gà là 3,69 kg/con. Với mức ý nghĩa 2%, hãy cho ý kiến về
kết luận: "Loại thức ăn mới này tốt hơn so với loại thức ăn trƣớc đây",
đúng hay sai?
137
Bài 8.5. Trọng lƣợng trung bình khi xuất chuồng một trại chăn
nuôi gà công nghiệp năm trƣớc là 3,3 kg/con. Năm nay ngƣời ta sử
dụng loại thức ăn mới. Cân thử 15 con xuất chuồng, ta đƣợc số
liệu sau (kg): 3,25; 2,5; 4,0; 3,8; 3,9; 4,02; 3,6; 3,8; 3,2; 3,82; 3,4;
3,75; 4,0; 3,5; 3,75. Giả sử trọng lƣợng của gà là ĐLNN phân phối
theo quy luật chuẩn. Với mức ý nghĩa 5% hãy kết luận về tác dụng
của loại thức ăn này có thực sự làm tăng trọng lƣợng trung bình
của gà lên hay không.
Bài 8.6. Chiều cao cây giống X (m) trong một vƣờm ƣơm là
ĐLNN có phân phối chuẩn. Ngƣời ta đo ngẫu nhiên 25 cây giống
này và có bảng số liệu:
X (m) 0,8 0,9 1,0 1,1 1,2 1,3
Số cây 1 2 9 7 4 2
Theo quy định của vƣờn ƣơm khi nào cây cao hơn 1 m thì đem
ra trồng. Với mức ý nghĩa 5%, hỏi cây của vƣờn ƣơm đã đem ra
trồng đƣợc chƣa?
Bài 8.7. Trong điều kiện nuôi bình thƣờng, lƣợng sữa trung bình
của một con bò là 14 kg/ngày. Nghi ngờ điều kiện chăn nuôi bò kém
đi làm cho lƣợng sữa giảm xuống. Ngƣời ta điều tra ngẫu nhiên 25
con bò và tính đƣợc lƣợng sữa trung bình của mỗi con trong một ngày
là 12,5 kg và độ lệch chuẩn mẫu điều chỉnh 2,5 kg. Với mức ý nghĩa
0,05 hãy kết luận về điều nghi ngờ nói trên. Giả thiết lƣợng sữa bò là
đại lƣợng ngẫu nhiên có phân phối chuẩn.
Đ/s: Lƣợng sữa bò có xu hƣớng giảm.
Bài 8.8. Năng suất trung bình của một giống lúa là 47 tạ/ha. Sau
một thời gian canh tác, ngƣời ta nghi ngờ giống lúa đó bị thoái hóa,
năng suất giảm. Dựa vào mẫu kích thƣớc n = 25, năng suất trung bình
mẫu là 45,5 tạ/ha và độ lệch mẫu điều chỉnh 4 tạ/ha. Hãy kết luận về
điều nghi ngờ nói trên với mức ý nghĩa 3%. Cho biết năng suất của
giống lúa đó là ĐLNN tuân theo quy luật chuẩn.
Đ/s: Giống lúa đó bị thoái hóa.
Bài 8.9. Mức hao phí xăng (X) cho một loại xe ô tô chạy trên đoạn
đƣờng AB là ĐLNN phân phối chuẩn có kỳ vọng toán là 50 lít. Do
138
đƣờng đƣợc tu sửa lại, ngƣời ta cho rằng mức hao phí xăng trung bình
đã giảm xuống. Quan sát 30 chuyến xe chạy trên đƣờng AB ta thu
đƣợc bảng số liệu sau:
Mức xăng
hao phí (lít) 48,5-49,0 49,0-49,5 49,5-50,0 50,0-50,5 50,5-51,0
Số chuyến xe 5 10 10 3 2
Với mức ý nghĩa 5% hãy kết luận về ý kiến nêu trên.
Đ/s: Có cơ sở để kết luận mức xăng hao phí trung bình giảm
xuống.
Bài 8.10. Để kiểm tra độ chính xác của một máy ngƣời ta đo ngẫu
nhiên kích thƣớc của 15 chi tiết máy do máy đó sản xuất và tính đƣợc
s2 = 14,6. Với mức ý nghĩa 1% hãy kết luận máy móc có hoạt động
bình thƣờng không, biết rằng kích thƣớc chi tiết là ĐLNN phân phối
chuẩn có dung sai theo thiết kế là 2 = 12.
Đ/s: Máy móc vẫn hoạt động bình thƣờng.
Bài 8.11. Từ một mẫu kích thƣớc n = 15 rút ra từ tổng thể phân
phối chuẩn ngƣời ta tìm đƣợc s2 = 144. Với mức ý nghĩa 1% hãy kiểm
định cặp giả thuyết: H0: 2 = 138; H1:
2 > 138.
Bài 8.12. Trọng lƣợng của con gà lúc mới nở là ĐLNN có phân
phối chuẩn. Nghi ngờ độ đồng đều trọng lƣợng gà con bị giảm sút
ngƣời ta cân thử 12 con và tìm đƣợc s2 = 11,41 gram
2. Với mức ý
nghĩa 5% hãy kết luận về điều nghi ngờ trên, biết rằng bình thƣờng độ
phân tán của trọng lƣợng gà con là 2 = 10 gram
2.
Đ/s: Chƣa có cơ sở để nghi ngờ rằng độ đồng đều về trọng lƣợng
gà con giảm sút.
Bài 8.13. Lô hàng đủ tiêu chuẩn xuất khẩu nếu tỷ lệ phế phẩm
không vƣợt quá 3%. Kiểm tra ngẫu nhiên 400 sản phẩm của lô hàng
này thấy có 14 phế phẩm. Với mức ý nghĩa 5% có cho phép lô hàng
xuất khẩu đƣợc không?
Đ/s: Lô hàng đủ tiêu chuẩn xuất khẩu.
Bài 8.14. Tỷ lệ bệnh nhân khỏi bệnh T khi điều trị bằng thuốc A là
85%. Thí nghiệm dùng loại thuốc B để chữa bệnh thì trong số 900
ngƣời mắc bệnh T có 810 ngƣời đƣợc chữa khỏi bệnh. Nhƣ vậy có thể
139
kết luận thuốc B hiệu quả hơn thuốc A hay không? Yêu cầu kết luận ở
mức ý nghĩa 5%.
Đ/s: Có thể kết luận thuốc B hiệu quả hơn thuốc A.
Bài 8.15. Tỷ lệ phế phẩm của một nhà máy trƣớc đây là 5%. Năm
nay nhà máy áp dụng một biện pháp kỹ thuật mới. Để nghiên cứu tác
dụng của biện pháp kỹ thuật mới có làm giảm tỷ lệ phế phẩm hay
không ngƣời ta lấy một mẫu gồm 800 sản phẩm để kiểm tra và thấy có
24 phế phẩm trong mẫu này. Với mức ý nghĩa 5% hãy kết luận xem
biện pháp kỹ thuật mới này có thực sự làm giảm tỷ lệ phế phẩm của
toàn nhà máy không?
Đ/s: Biện pháp kỹ thuật mới thực sự có tác dụng làm giảm tỷ lệ
phế phẩm của nhà máy.
Bài 8.16. Tỷ lệ phế phẩm do một nhà máy tự động sản xuất là
5%. Kiểm tra ngẫu nhiên 300 sản phẩm thấy có 24 sản phẩm là
phế phẩm. Từ đó ý kiến cho rằng tỷ lệ phế phẩm do máy đó sản
xuất có chiều hƣớng tăng lên. Hãy kết luận về ý kiến trên với mức
ý nghĩa là 5%.
Bài 8.17. Nếu áp dụng phƣơng pháp công nghệ thứ nhất thì tỷ
lệ phế phẩm là 6%, còn nếu áp dụng phƣơng pháp công nghệ thứ
hai thì trong 100 sản phẩm có 5 phế phẩm. Vì vậy có thể kết luận
áp dụng phƣơng pháp công nghệ thứ hai thì tỷ lệ phế phẩm thấp
hơn tỷ lệ phế phẩm của phƣơng pháp công nghệ thứ nhất không?
với mức ý nghĩa 5%.
Bài 8.18. Để kiểm tra một loại súng thể thao, ngƣời ta cho bắn
1000 viên đạn vào 1 tấm bia thấy có 670 viên trúng mục tiêu. Sau
đó, bằng cải tiến kỹ thuật ngƣời ta nâng đƣợc tỉ lệ trúng của súng
này lên 70%. Hãy cho kết luận về việc cải tiến trên với mức ý
nghĩa 1%.
Bài 8.19. Tỷ lệ học sinh tốt nghiệp phổ thông năm ngoái của
tỉnh A là 94%. Trong kỳ thi năm nay trong 100 em đƣợc chọn
ngẫu nhiên có 87 em thi đỗ. Với mức ý nghĩa 5% có thể kết luận
rằng tỷ lệ học sinh thi đỗ của tỉnh A năm nay thấp hơn năm ngoái
không?
140
Bảng 1. Giá trị của hàm tích phân La-pla-ce
2
2
0
1( )
2
tu
u e dt
U 0,00 1 2 3 4 5 6 7 8 9
0.00 .0000 .0039 .0079 .0197 .0159 .0199 .0239 .0279 .0319 .0359
0.10 .0398 .0438 .0477 .0517 .0557 .0596 .0636 .0675 .0714 .0753
0.20 .0793 .0832 .0871 .0909 .0948 .0987 .1026 .1064 .1103 .1141
0.30 .1179 .1217 .1255 .1293 .1331 .1368 .1406 .1443 .1480 .1517
0.40 .1554 .1591 .1628 .1664 .1700 .1736 .1772 .1808 .1844 .1879
0.50 .1915 .1950 .1985 .2019 .2054 .2088 .2123 .2157 .2190 .2224
0.60 .2257 .2291 .2324 .2357 .2389 .2422 .2454 .2486 .2517 .2549
0.70 .2580 .2611 .2642 .2673 .2704 .2734 .2764 .2794 .2823 .2852
0.80 .2881 .2910 .2939 .2967 .2995 .3023 .3051 .3078 .3016 .3133
0.90 .3159 .3186 .3212 .3238 .3264 .3289 .3315 .3340 .3365 .3389
1.00 .3413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .3621
1.10 .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3779 .3810 .3730
1.20 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .4015
1.30 .4032 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .4177
1.40 .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319
1.50 .4332 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4429 .4441
1.60 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .4545
1.70 .4554 .4564 .4573 .4582 .4591 .4599 .4608 .4616 .4625 .4633
1.80 .4641 .4649 .4656 .4664 .4671 .4678 .4686 .4693 .4699 .4706
1.90 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767
2.00 .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .4812 .4817
2.10 .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .4857
2.20 .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 4890
2.30 .4893 .4896 .4898 .4901 .4904 .4906 .4909 .4911 .4913 .4916
2.40 .4918 .4920 .4922 .4925 .4927 .4929 .4931 .4932 .4934 .4936
2.50 .4938 .4940 .4941 .4943 .4945 .4946 4948 .4949 .4951 .4952
2.60 .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .4963 .4964
2.70 .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .4974
2.80 .4974 .4975 .4976 .4977 .4977 .4978 .4979 .7979 .7980 .7981
2.90 .4981 .4982 .4982 .4983 .4984 .4984 .4985 .4985 .4986 .4986
3.00 .4987 .4987 .4987 .4988 .4988 .4989 .4989 .4989 .4990 .499
141
Bảng 2. Giá trị phân vị Student ( )t n
Bậc
tự
do n
Mức ý nghĩa
0,1 0,05 0,025 0,01 0,005 0,001 0,0005
1 3,078 6,314 12,706 31,821 63,657 318,309 636,620
2 1,886 2,920 4,303 6,965 9,925 22,327 31,060
3 1,638 2,353 3,182 4,541 5,841 10,215 12,920
4 1,533 2,132 2,776 3,747 4,604 7,713 8,610
5 1,476 2,015 2,571 3,365 4,032 5,893 6,870
6 1,440 1,943 2,447 3,143 3,707 5,208 5,960
7 1,415 1,895 2,365 3,998 3,499 4,785 5,410
8 1,397 1,860 2,306 2,896 3,355 4,501 5,040
9 1,383 1,833 2,262 2,821 3,250 4,397 4,780
10 1,372 1,812 2,228 2,764 3,169 4,144 4,590
11 1,363 1,796 2,201 2,718 3,106 4,025 4,440
12 1,356 1,782 2,179 2,681 3,055 3,930 4,320
13 1,350 1,771 2,160 2,650 3,012 3,852 4,220
14 1,345 1,761 2,145 2,624 2,977 3,787 4,110
15 1,341 1,753 2,131 2,602 2,947 3,733 4,070
16 1,337 1,746 2,120 2,583 2,921 3,686 4,010
17 1,333 1,740 2,110 2,567 2,898 3,646 3,960
18 1,330 1,734 2,101 2,552 2,878 3,610 3,920
19 1,328 1,729 2,093 2,539 2,861 3,579 3,880
20 1,325 1,725 2,086 2,528 2,845 3,552 3,850
21 1,323 1,721 2,080 2,518 2,831 3,527 3,820
22 1,321 1,717 2,074 2,508 2,819 3,505 3,790
23 1,319 1,714 2,069 2,500 2,807 3,485 3,770
24 1,318 1,711 2,064 2,492 2,797 3,467 3,740
25 1,316 1,708 2,060 2,485 2,787 3,450 3,720
26 1,315 1,706 2,056 2,479 2,779 3,435 3,710
27 1,314 1,703 2,052 2,473 2,771 3,421 3,690
28 1,313 1,701 2,048 2,467 2,763 3,408 3,660
29 1,311 1,699 2,045 2,462 2,756 3,396 3,660
30 1,310 1,697 2,042 2,457 2,750 3,385 3,650
40 1,303 1,684 2,021 2,423 2,704 3,307 3,550
60 1,296 1,671 2,000 2,390 2,660 3,232 3,460
120 1,289 1,658 1,980 2,358 2,617 3,160 3,370
+ 1,282 1,645 1,960 2,326 2,576 3,090 3,290
Nếu n 30 thì ( ) .t n U
142
Bảng 3a. Giá trị phân vị 2 ( )n của phân phối 2
N 0,995 0,99 0,975 0,95 0,90 0,750
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100+
392704.10-10
0,010025
0,072
0,207
0,412
0,676
0,989
1,344
1,735
2,155
2,603
3,074
3,565
4,074
4,601
5,142
5,697
6,265
6,844
7,434
8,034
8,643
9,260
9,886
10,519
11,160
11,807
12,461
13,121
13,787
20,707
27,991
35,534
43,275
51,172
59,196
67,328
0,15708.10-3
0,0201007
0,115
0,297
0,554
0,872
1,239
1,646
2,087
2,558
3,033
3,570
4,106
4,660
5,229
5,812
6,408
7,015
7,633
8,260
8,897
9,542
10,196
10,856
11,524
12,198
12,879
13,565
14,256
14,954
22,164
29,707
37,485
45,442
53,540
61,754
70,065
0,982.10-3
0,0506
0,216
0,484
0,831
1,237
1,689
2,179
2,700
3,246
3,815
4,404
5,008
5,628
6,262
6,907
7,564
8,231
8,906
9,591
10,283
10,982
11,688
12,401
13,119
13,844
14,573
15,308
16,047
16,791
24,433
32,357
40,482
48,757
57,153
65,647
74,222
0,393.10-2
0,103
0,352
0,711
1,145
1,635
2,167
2,733
3,325
3,940
4,575
5,226
5,892
6,571
7,261
7,962
8,672
9,390
10,117
10,851
11,591
12,338
13,091
13,848
14,611
15,379
16,151
16,928
17,708
18,493
26,509
34,764
43,188
51,739
60,392
69,126
77,930
0.157908
0,207
0,584
1,063
1,610
2,204
2,833
3,489
4,168
4,865
5,579
6,304
7,042
7,790
8,547
9,312
10,085
10,865
11,651
12,443
13,239
14,041
14,848
15,659
16,475
17,292
18,114
18,939
19,768
20,599
29,050
37,688
46,459
55,329
64,278
73,291
82,358
0,1015308
0,575
1,212
1,923
2,675
3,455
4,255
5,071
5,899
6,737
7,584
8,438
9,299
10,165
11,036
11,912
12,792
13,675
14,562
15,452
16,344
17,239
18,137
19,037
19,939
20,843
21,749
22,657
23,566
24,477
33,660
42,942
52,294
61,698
71,144
80,625
90,133
143
Bảng 3b. Giá trị phân vị 2 ( )n của phân phối 2
n 0,50 0,25 0,10 0,05 0,025 0,01 0,005
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100+
0,455
1,386
2,366
3,356
4,351
5,348
6,346
7,344
8,342
9,342
10,341
11,340
12,339
13,339
14,339
15,338
16,338
17,338
18,338
19,337
20,337
21,337
22,337
23,337
24,337
25,337
26,337
27,337
28,337
29,337
39,337
49,335
59,335
69,334
79,334
89,334
99,334
1,323
2,772
4,108
5,385
6,625
7,840
9,037
10,218
11,388
12,549
13,701
14,845
15,984
17,117
18,245
19,368
20,488
21,605
22,712
23,828
24,934
26,039
27,141
28,241
29,339
30,435
31,528
32,621
33,711
34,799
45,616
56,333
66,981
77,576
88,130
98,649
109,141
2,705
4,605
6,251
7,779
9,236
10,644
12,011
13,362
14,684
15,987
17,275
18,549
19,812
21,064
22,307
23,542
24,769
25,989
27,204
28,412
29,615
30,813
32,006
33,196
34,382
35,563
36,741
37,916
39,087
40,356
51,805
63,167
74,397
85,527
96,578
107,565
118,498
3,841
5,991
7,814
9,487
11,071
12,592
14,067
15,507
16,919
18,307
19,675
21,026
22,362
23,685
25,996
26,296
27,587
28,869
30,143
31,410
32,671
33,924
35,173
36,415
37,653
38,885
40,113
41,338
42,557
43,772
55,758
67,505
79,092
90,531
101,879
113,145
124,324
5,023
7,377
9,348
11,143
12,832
14,449
16,012
17,534
19,022
20,483
21,920
23,336
24,735
26,119
27,488
28,845
30,191
31,526
32,852
34,169
35,478
36,780
38,075
39,364
40,646
41,923
43,194
44,460
45,722
46,979
59,341
71,420
38,297
95,023
106,629
118,136
129,561
6,634
9,210
11,344
13,276
15,086
16,811
18,475
20,090
21,666
23,209
24,725
26,217
27,688
29,141
30,577
31,999
33,408
34,805
36,190
37,566
38,932
40,289
41,638
42,979
44,314
45,641
46,963
48,278
49,587
50,892
63,690
76,153
88,379
100,425
112,329
124,116
135,807
7,979
10,596
12,838
14,860
16,749
18,547
20,277
21,950
23,589
25,188
26,756
28,299
29,819
31,319
32,801
34,267
35,718
37,156
38,582
39,996
41,401
42,795
44,181
45,558
46,927
48,289
49,644
50,993
52,335
53,672
66,765
79,490
91,951
104,215
116,321
128,299
140,169
144
TÀI LIỆU THAM KHẢO
1. Đặng Ngọc Dục, Nguyễn Ngọc Siêng (2010), Lý thuyết xác
suất và thống kê toán, Nxb Đà Nẵng.
2. Trần Doãn Phú, Nguyễn Thọ Liễn (2010), Xác suất và thống
kê toán, Nxb thống kê.
3. Trần Bá Nhẫn, Đinh Thái Hoàng (2006), Thống kê ứng dụng
trong quản trị, kinh doanh và nghiên cứu kinh tế, Nxb Thống kê.
4. Hoàng Ngọc Nhậm (2005), Bài tập xác suất thống kê, Đại học
kinh tế Tp. Hồ Chí Minh.
5. Đào Hữu Hồ (1996), Xác suất thống kê, Nxb Đại học quốc gia
Hà Nội.
6. Nguyễn Ngọc Siêng (2007), Xác suất và thống kê toán, Nxb Đà
Nẵng.
7. Nguyễn Cao Văn (2012), Giáo trình lý thuyết xác suất và thống
kê toán, Nxb Đại học kinh tế quốc dân.
8. Lê Đức Vĩnh (2014), Xác suất thống kê, Nxb Đại học Nông
Nghiệp.
9. Tống Đình Quỳ (1999), Giáo trình xác suất thống kê, Nxb Giáo
dục.
145
MỤC LỤC
CHƢƠNG 1. BIẾN CỐ NGẪU NHIÊN VÀ XÁC SUẤT ............. 4
1.1. BIẾN CỐ NGẪU NHIÊN ........................................................... 4
1.1.1. Phép thử ngẫu nhiên và các loại biến cố ngẫu nhiên ............... 4
1.1.2. Quan hệ giữa các biến cố .......................................................... 5
1.1.3. Các phép toán về biến cố .......................................................... 7
1.1.4. Các tính chất phép toán về biến cố ........................................... 8
1.2. XÁC SUẤT CỦA BIẾN CỐ ....................................................... 9
1.2.1. Định nghĩa cổ điển về xác suất ................................................. 9
1.2.2. Định nghĩa thống kê về xác suất ............................................. 11
1.3. CÁC ĐỊNH LÝ VỀ XÁC SUẤT .............................................. 12
1.3.1. Định lý cộng ........................................................................... 12
1.3.2. Định lý nhân ........................................................................... 15
1.3.3. Tính độc lập của các biến cố .................................................. 18
1.4. CÁC HỆ QUẢ CỦA ĐỊNH LÝ CỘNG, ĐỊNH LÝ NHÂN XÁC
SUẤT ................................................................................................ 20
1.4.1. Công thức xác suất từng phần (đầy đủ) ................................. 20
1.4.2. Định lý Bayes ......................................................................... 22
1.4.3. Công thức Bernoulli ............................................................... 23
BÀI TẬP CHƢƠNG 1 ..................................................................... 25
CHƢƠNG 2. ĐẠI LƢỢNG NGẪU NHIÊN VÀ QUY LUẬT
PHÂN PHỐI XÁC SUẤT .............................................................. 29
2.1. ĐỊNH NGHĨA VÀ PHÂN LOẠI ĐẠI LƢỢNG NGẪU NHIÊN
.......................................................................................................... 29
2.1.1. Định nghĩa.. ........................................................................... 29
2.1.2. Phân loại đại lƣợng ngẫu nhiên .............................................. 30
2.2. QUY LUẬT PHÂN PHỐI XÁC SUẤT .................................... 31
2.2.1. Bảng phân phối xác suất ......................................................... 31
2.2.2. Hàm phân phối xác suất .......................................................... 33
146
2.2.3. Hàm mật độ phân phối xác suất.............................................. 37
2.3. CÁC THAM SỐ ĐẶC TRƢNG CỦA ĐẠI LƢỢNG NGẪU
NHIÊN .............................................................................................. 39
2.3.1. Kỳ vọng .................................................................................. 39
2.3.2. Phƣơng sai .............................................................................. 42
2.3.3. Độ lệch chuẩn. ....................................................................... 45
2.3.4. Trung vị .................................................................................. 45
BÀI TẬP CHƢƠNG 2 ..................................................................... 48
CHƢƠNG 3. MỘT SỐ QUY LUẬT PHÂN PHỐI XÁC SUẤT
THƢỜNG GẶP ............................................................................... 53
3.1. MỘT SỐ QUY LUẬT PHÂN PHỐI XÁC SUẤT RỜI RẠC .. 53
3.1.1. Qui luật phân phối xác suất Không – Một .............................. 53
3.1.2. Quy luật phân phối xác suất nhị thức ..................................... 54
3.1.3. Quy luật phân phối xác suất Poisson ...................................... 55
3.2. MỘT SỐ QUY LUẬT PHÂN PHỐI XÁC SUẤT LIÊN TỤC 56
3.2.1. Quy luật phân phối đều U[a, b] ............................................. 56
3.2.1. Quy luật phân phối chuẩn ...................................................... 58
3.2.2. Quy luật phân phối – bình phƣơng ...................................... 62
3.2.3. Quy luật phân phối Student – T(n) ........................................ 63
BÀI TẬP CHƢƠNG 3 .................................................................... 63
CHƢƠNG 4. ĐẠI LƢỢNG NGẪU NHIÊN HAI CHIỀU .......... 66
4.1. ĐỊNH NGHĨA.. ........................................................................ 66
4.2. HÀM PHÂN PHỐI XÁC SUẤT CỦA ĐLNN HAI CHIỀU .... 66
4.2.1. Định nghĩa. ............................................................................. 66
4.2.2. Tính chất ................................................................................. 66
4.3. PHÂN PHỐI XÁC SUẤT CỦA ĐLNN HAI CHIỀU .............. 67
4.3.1. Bảng phân phối xác suất của ĐLNN hai chiều rời rạc ........... 67
4.3.2. Hàm mật độ phân phối xác suất của ĐLNN hai chiều liên tục ..
.......................................................................................................... 69
147
4.4. PHÂN PHỐI XÁC SUẤT CÓ ĐIỀU KIỆN CỦA ĐLNN HAI
CHIỀU .............................................................................................. 71
4.4.1. Phân phối có điều kiện của ĐLNN hai chiều rời rạc .............. 71
4.4.2. Phân phối có điều kiện của ĐLNN hai chiều liên tục ............ 73
4.5. KỲ VỌNG CÓ ĐIỀU KIỆN ..................................................... 74
4.5.1. Kỳ vọng có điều kiện của ĐLNN hai chiều rời rạc ................ 74
4.5.2. Kỳ vọng có điều kiện của ĐLNN hai chiều liên tục ............... 75
BÀI TẬP CHƢƠNG 4 ..................................................................... 76
CHƢƠNG 5. CÁC ĐỊNH LÝ GIỚI HẠN .................................... 78
5.1. ĐỊNH NGHĨA ........................................................................... 78
5.2. BẤT ĐẲNG THỨC TRÊ-BƢ-SÉP. .......................................... 78
5.3. ĐỊNH LÝ TRÊ-BƢ-SÉP ........................................................... 79
5.3.1. Định lý. .................................................................................. 79
5.3.2. Hệ quả. ................................................................................... 80
5.4. ĐỊNH LÝ BERNOULLI ........................................................... 80
5.5. ĐỊNH LÝ GIỚI HẠN TRUNG TÂM ....................................... 81
BÀI TẬP CHƢƠNG 5 ..................................................................... 83
CHƢƠNG 6. LÝ THUYẾT MẪU ................................................. 84
6.1. KHÁI NIỆM VỀ PHƢƠNG PHÁP MẪU ................................ 84
6.2. TỔNG THỂ VÀ MẪU .............................................................. 85
6.3. CÁC PHƢƠNG PHÁP CHỌN MẪU ....................................... 86
6.3.1. Phƣơng pháp chọn mẫu có lặp. .............................................. 86
6.3.2. Phƣơng pháp chọn mẫu không lặp. ....................................... 86
6.4. MẪU NGẪU NHIÊN VÀ MẪU CỤ THỂ ............................... 87
6.4.1. Định nghĩa.. ........................................................................... 87
6.4.2. Các ví dụ ................................................................................. 87
6.5. CÁC PHƢƠNG PHÁP SẮP XẾP MẪU CỤ THỂ ................... 88
6.5.1. Sắp xếp theo bộ số tăng dần hoặc giảm dần ........................... 88
6.5.2. Sắp xếp theo bảng phân phối tần số, tần suất thực nghiệm .... 88
6.6. CÁC ĐẶC TRƢNG MẪU ........................................................ 90
148
6.6.1. Hàm mẫu (thống kê). ............................................................. 90
6.6.2. Trung bình mẫu, phƣơng sai mẫu, phƣơng sai mẫu điều chỉnh .
.......................................................................................................... 90
6.7. LUẬT PHÂN PHỐI CỦA CÁC ĐẶC TRƢNG MẪU ............. 93
6.7.1. Phân phối của phƣơng sai mẫu hiệu chỉnh ............................. 93
6.7.2. Phân phối của trung bình mẫu ................................................ 94
BÀI TẬP CHƢƠNG 6 ..................................................................... 95
CHƢƠNG 7. BÀI TOÁN ƢỚC LƢỢNG THAM SỐ ................. 99
7.1. KHÁI NIỆM ƢỚC LƢỢNG.. .................................................. 99
7.2. HÀM ƢỚC LƢỢNG VÀ PHƢƠNG PHÁP ƢỚC LƢỢNG ĐIỂM
.......................................................................................................... 99
7.2.1. Ƣớc lƣợng không chệch ....................................................... 100
7.2.2. Ƣớc lƣợng vững .................................................................... 101
7.3. PHƢƠNG PHÁP ƢỚC LƢỢNG KHOẢNG .......................... 102
7.3.1. Mở đầu .................................................................................. 102
7.3.2. Ƣớc lƣợng khoảng tin cậy cho tỷ lệ của tổng thể ................. 103
7.3.3. Ƣớc lƣợng khoảng tin cậy cho kỳ vọng (trung bình) của tổng
thể ................................................................................................... 104
7.3.4. Ƣớc lƣợng phƣơng sai .......................................................... 109
BÀI TẬP CHƢƠNG 7 ................................................................... 112
CHƢƠNG 8. BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT ........... 118
8.1. KHÁI NIỆM CHUNG ............................................................. 118
8.1.1. Giả thuyết thống kê ............................................................... 118
8.1.2. Tiêu chuẩn kiểm định ........................................................... 118
8.1.3. Miền bác bỏ .......................................................................... 119
8.1.4. Giá trị quan sát của tiêu chuẩn kiểm định ............................ 119
8.1.5. Quy tắc kiểm định giả thuyết thống kê ................................. 119
8.1.6. Các sai lầm mắc phải khi thực hiện một bài toán kiểm định ......
........................................................................................................ 120
8.1.7. Quy tắc chung khi kiểm định giả thuyết thống kê ................ 120
149
8.2. KIỂM ĐỊNH THAM SỐ ......................................................... 121
8.2.1. Kiểm định về kỳ vọng của ĐLNN có phân phối chuẩn ....... 121
8.2.2. Kiểm định về phƣơng sai của ĐLNN có phân phối chuẩn ... 129
8.2.3. Kiểm định về tỷ lệ xác suất .................................................. 133
BÀI TẬP CHƢƠNG 8 ................................................................... 136
Bảng 1. Giá trị của hàm tích phân La-pla-ce
2
2
0
1( )
2
tu
u e dt
.... 140
Bảng 2. Giá trị phân vị Student ( )t n ........................................... 141
Bảng 3a. Giá trị phân vị 2 ( )n của phân phối 2 ..........................................
142
Bảng 3b. Giá trị phân vị 2 ( )n của phân phối 2 .........................................
143
TÀI LIỆU THAM KHẢO ............................................................ 144
MỤC LỤC ..................................................................................... 145