Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

61
CHỌN MẪU VÀ TÍNH TOÁN CỠ MẪU

description

Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu của Ts. Hà Anh Đức

Transcript of Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Page 1: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

CHỌN MẪU VÀ

TÍNH TOÁN CỠ MẪU

Page 2: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Chọn mẫu?

Nếu tất cả các cả thể của một quần thể đều

giống nhau, chúng ta có một quần thể thuần

nhất (homogenous). Khi đó, đặc tính của mỗi

cá thể cũng chính là của quần thể. Không có sự

khác nhau/ giao động tính chất giữa các cá thể.

Page 3: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Chọn mẫu? Khi các cá thể trong một quần thể khác nhau, chúng ta có

một quần thể hỗn tạp/ không thuần nhất (heterogeneous). Khi đó đặc tính của một cá thể bất kỳ không mang tính đại diện cho cả quần thể. Có sự khác nhau/ giao động giữa các cá thể.

Nếu muốn mô tả đặc tính quần thể, khi không thể quan sát được tất cả các cá thể, người ta phải chọn một số lượng cá thể ít hơn trong khả năng, đại diện “tốt” cho tất cả các cá thể của quần thể để quan sát.

Page 4: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Chọn mẫu?

Quần thể

Mẫu

Sử dụng dữ liệu/ thông tin của một số ít

tiếp cận được để nói về số đông mà

không thể tiếp cận hết

Chọn mẫu

Là cái

chúng ta

muốn biết

Là cái mà

chúng ta

quan sát

Suy ra

Page 5: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Chọn mẫu? Mẫu của một quần thể phải suy ra được những thông

tin hữu ích về quần thể đó. Do vậy, mẫu phải đảm bảo

có được những biến thiên cơ bản giữa các cá thể như

ở quần thể.

Một quần thể càng không đồng nhất…

Thì xác suất một mẫu khó có thể mô tả quần càng lớn

Sẽ là một sai lầm nếu suy đặc tính của mẫu thành đặc tính

của quần thể.

Và…

Thì số lượng cá thể của mẫu phải càng lớn để có thể mô

tả quần thể tốt Một mẫu phải có số lượng cá thể đủ lớn

để cho thể suy đặc tính của mẫu thành của quần thể

Page 6: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Chọn mẫu?

Chọn mẫu là một quy trình lựa chọn cá thể từ quần

thể cho quan sát, để có thể coi kết quả quan sát mẫu

thành kết quả quan sát quần thể, ở một mức độ chấp

nhận mà xác định được.

Mẫu là đại diện của một quần thể. Mức độ đại diện phải

được xác định/ đo lường được.

Có hai cách chọn mẫu:

Chọn mẫu không ngẫu nhiên

Chọn mẫu ngẫu nhiên

Page 7: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Các khái niệm cơ bản Toàn thể: Là tập hợp lý thuyết của tất cả các cá thể, không xác

định không gian và thời gian

Quần thể: Là tập hợp lý thuyết của tất cả cá thể theo một đặc

tính, trong một khoảng không gian và thời gian xác định.

Mẫu/ quần thể quan sát được: Là tập hợp một số lượng cá

thể, lựa chọn từ một quần thể trên một đặc tính mẫu quan tâm.

Đặc tính mẫu: Là cơ sở để xác định, lựa chọn cá thể của quần

thể vào một mẫu, có số lượng cá thể ít hơn, ví dụ cá thể một

quần thể người có thể là cá thể người, hộ gia đình, làng/ xóm

Danh sách/ khung mẫu: Là danh sách các cá thể của một

quần thể, giúp hỗ trợ kỹ thuật cho quá trình chọn mẫu

Cỡ mẫu: Là số lượng cá thể được lựa chọn từ một số lượng

xác định/ không xác định cá thể của quần thể vào một tập hợp

mẫu.

Sức mạnh mẫu: Là mức độ suy diễn kết quả thống kê trên mẫu

thành kết quả của quần thể

Page 8: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Phân loại các phương pháp

chọn mẫu

Chọn mẫu

Ngẫu nhiên

Ngẫu nhiên

đơn Theo cụm

Hệ thống Phân tầng

Không ngẫu

nhiên

Chỉ tiêu Chủ đích

Thuận tiện Ném bóng

tuyết

Page 9: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Chọn mẫu ngẫu nhiên

Chọn mẫu ngẫu nhiên đơn

Đảm bảo mỗi cá thể của quần thể được lựa chọn với xác suất như nhau vào mẫu

Ghép cặp mỗi cá thể với một số ngẫu nhiên, các cá thể được lựa chọn theo sự ngẫu nhiên của con số.

Xác suất lựa chọn = Cỡ mẫu

Tổng số cá thể của quần thể

Page 10: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Chọn mẫu ngẫu nhiên đơn

Khoảng cách giữa các cá thể là ngẫu nhiên, không có quy luật nào

Page 11: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Ưu điểm

Không cần nhiều thông tin về quần thể

Tính gía trị cao, xác định được sai số thống kê

Dễ dàng phân tích dữ liệu

Hạn chế

Tốn kém

Yêu cầu danh sách cá thể trong quần thể

Không cần chuyên môn của nghiên cứu viên

Nguy cơ sai số ngẫu nhiên

Page 12: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Chọn mẫu hệ thống

Cá thể đầu tiên được lựa chọn ngẫu nhiên trong quần thể, các cá thể tiếp theo được lựa chọn theo một khoảng cách xác định so với cá thể trước đó. Khoảng cách xác định được gọi là khoảng cách mẫu = Tổng số cá thể của quần thể/ cỡ mẫu

Page 13: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Chọn mẫu hệ thống

Khoảng cách giữa các cá thể bằng nhau

Mang tính quy luật

Page 14: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Ưu điểm

Chi phí hợp lý, hay được sử dụng

Tính gía trị cao, xác định được sai số thống kế

Các cá thể dễ tiếp cận

Hạn chế

Sai số chu kỳ do bản thân danh sách cá thể cũng có thể có tính chu kỳ

Yêu cầu danh sách cá thể của quần thể

Page 15: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Chọn mẫu phân tầng Chia quần thể theo một đặc tính cụ thể thành các

nhóm/ tầng (strata) (Ví dụ: Chia quần thể sinh

viên trường ĐHY Hà Nội thành 3 nhóm/ tầng: học

viên tiến sĩ, học viên thạc sĩ và học viên đại học).

Các cá thể trong mỗi tầng đồng nhất, nhưng

không đồng nhất giữa các tầng.

Có thể áp dụng chọn mẫu ngẫu nhiên đơn hay

chọn mẫu hệ thống ở mỗi tầng (strata). Số mẫu

mỗi tầng tham gia vào tổng mẫu có thể bằng

nhau (chọn mẫu phân tầng không cân xứng) hay

tỷ lệ với số cá thể của mỗi tầng (chọn mẫu phân

tầng cân xứng)

Page 16: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Tầng 1 Tầng 2

N= 2000 N = 6000

Chọn mẫu phân tầng không cân xứng

1000 1000

Page 17: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Tầng 1 Tầng 2

N= 2000 N = 6000

Chọn mẫu phân tầng cân xứng

1000 3000

Page 18: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Ưu điểm

Đảm bảo mỗi nhóm đều có tính đại diện trong tổng mẫu

Mỗi nhóm đều được thống kê và so sánh

Giảm sai số hệ thống

Hạn chế

Yêu cầu thông tin chính xác về tỷ lệ giữa các tầng

Chi phí để có được danh sách mỗi tầng

Page 19: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Chọn mẫu theo cụm/ chùm

Cụm đây là cụm địa lý nơi các các thể sinh sống. Đầu tiên là chọn cụm, sau đó mới chọn cá thể trong cụm.

Phương pháp hay được sử dụng khi không có danh sách cá thể của quần thể

Page 20: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Các loại chọn mẫu theo cụm/ chùm

Chọn mẫu theo cụm 2 bước:

Chọn cụm – chọn cá thể trong cụm

Chọn mẫu theo cụm nhiều bước:

Ví dụ: chọn 7 vùng sinh thái ở Việt Nam, chọn 1 tỉnh ở mỗi vùng sinh thái, chọn 1 huyện ở 1 tỉnh, chọn 1 xã ở 1 huyện, 1 thôn/ bản ở 1 xã, chọn 200 hộ gia đình ở 1 thôn/ bản theo cỡ mẫu.

Page 21: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Ưu điểm

Chí phí thấp/ hãy sử dụng

Không yêu cầu danh sách cá thể của cả quần thể, chỉ yêu cầu danh sách cụm, tiểu cụm, tiểu tiểu… cụm, và danh sách cá thể của đơn vị cụm cuối cùng

Xác định được đặc điểm của cả cụm và quần thể

Ưu tiên dùng khi quần thể quá lớn, ví dụ như cả một quốc gia.

Hạn chế

Sai số lớn hơn so với các phương pháp ngẫu nhiên khác

Page 22: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Phân loại các phương pháp

chọn mẫu

Chọn mẫu

Ngẫu nhiên

Ngẫu nhiên

đơn Theo cụm

Hệ thống Phân tầng

Không ngẫu

nhiên

Chỉ tiêu Chủ đích

Thuận tiện Ném bóng

tuyết

Page 23: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Chọn mẫu không ngẫu nhiên

Chọn mẫu thuận tiện

Cá thể được lựa chọn vào mẫu một cách “thuận tiện”, sẵn có và dễ tiếp cận.

Tại sao dùng: nhanh và chi phí thấp

Phải giải trình và đánh giá giá trị nếu chọn mẫu thuận tiện.

Page 24: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Ưu điểm

Chi phí rất thấp

Hay được sử dụng

Không cần danh sách cá thể trong quần thể

Hạn chế

Độ biến thiên và sai số không đo lường và kiểm soát được.

Khó giải trình việc suy luận kết quả thống kê trên mẫu ra của quần thể.

Page 25: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Chọn mẫu có chủ đích (Judgment or Purposive Sampling)

Chọn cá thể có một số đặc tính mong muốn vào mẫu với chủ đích của nghiên cứu viên.

Page 26: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Ưu điểm

Chi phí vừa phải

Hay được sử dụng

Mẫu lựa chọn đảm bảo được mục tiêu

Hạn chế

Sai số!

Khó giải trình việc suy luận kết quả thống kê trên mẫu ra của quần thể.

Page 27: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Chọn mẫu theo chỉ tiêu

Mẫu đảm bảo đặc tính của quần thể, đại diện ở một mức độ mà nghiên cứu viên mong muốn

Page 28: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Ưu điểm

Chi phí vừa phải

Rất hay sử dụng

Không yêu cầu danh sách cá thể trong quần thể

Có phần nào tính chất của chọn mẫu phân tầng

Hạn chế

Không đo lường và giải trình được biến thiên và sai số

Page 29: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Chọn mẫu “Ném bóng tuyết“ (Snowball sampling)

Chọn mẫu bắt đầu từ một cá thể, được chọn một cách ngẫu nhiên hay không ngẫu nhiên. Các cá thể tiếp theo được chọn từ cá thể ban đầu hay trước đó, giống như trò chơi ném bóng tuyết, ai trúng thì được lựa chọn.

Page 30: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Ưu điểm

Chi phí thấp

Hữu ích trong một số trường hợp cụ thể

Dùng để xác định những quần thể hiếm

Hạn chế

Sai số do cá thể lựa chọn không hoàn toàn độc lập

Khó giải trình việc suy diễn kết quả thống kê trên mẫu ra của quần thể.

Page 31: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Tính toán cỡ mẫu

Thông tin/ dữ liệu cần thiết Loại nghiên cứu

Các thuật toán thống kê sử dụng

Đắc tính của cá thể - Thể hiện qua biến số (khác biệt cơ

bản giữa biến liên tục – biến phân hạng). Kết quả các

nghiên cứu trước được đưa vào làm cơ sở tính toán

Độ tin cậy (95%, 90%)

Gía trị p chấp nhận kết quả kiểm định (0,05/ 0,001)

Mức độ biến thiên của kết quả mẫu so với kết quả thực

của quần thể (độ chính xác tương đối)

Sức mạnh của mẫu nói lên mức độ kết quả mẫu đại

diện cho kết quả của quần thể

Page 32: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Tính toán cỡ mẫu Tính toán cỡ mẫu đơn giản:

Dựa vào công thức cơ bản,

Không tính đến thiết kế nghiên cứu,

Không tính đến các thuật toán thống kê sử

dụng trong thiết kế

Tính toán đơn giản, bằng máy calculator

thông thường

Thường không chính xác, chỉ có tính chất giải

trình đủ đề mục chọn mẫu và tính cỡ mẫu

trong đề cương hay báo cáo nghiên cứu.

Page 33: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Tính toán cỡ mẫu Tính toán cỡ mẫu nâng cao:

Dựa vào một số phần mềm tính toán cỡ mẫu tốt

(Ví dụ: Sampling Size for Health Studies của

WHO)

Đã đề cập một số thiết kế nghiên cứu cơ bản +

thuật toán thống kê hay sử dụng cho thiết kế đó +

biến số/ dữ liệu liên qua

Có công thức tính cỡ mẫu cho giải trình, phải

chụp màn hình, lưu ở dạng jpg

Chính xác hơn tính toán cỡ mẫu đơn giản

Chưa toàn diện so với tính toán cỡ mẫu chuyên

nghiệp

Page 34: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Giao diện chọn các thiết kế nghiên cứu trong phần

mền tính cỡ mẫu nâng cao

Page 35: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Giao diện tính toán cỡ mẫu

Ô tính ra

cỡ mẫu

Nhập giá trị

mong muốn

cho mẫu

Công thức máy

tính tính cỡ mẫu

cho thiết kế

Page 36: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Tính toán cỡ mẫu chuyên nghiệp

Dựa vào phần mềm tính toán cỡ mẫu chuyên nghiệp,

trong gói SAS, hoặc chuyên nghiệp với n-query. Phần

mềm rất đắt (cỡ 1 triệu USD cho SAS, 1050 USD cho

nquery). Học viên có nhu cầu học thêm ứng dụng của

phần mềm nquery có thể liên hệ với giáo viên

Nghiên cứu viên nhập thiết kế nghiên cứu, thuật toán

thống kê sử dụng và các dữ liệu liên quan đến biến số

vào phần mềm để tính ra cỡ mẫu. Nghiên cứu viên có

thể phân tích độ nhạy mối liên quan giữa Sức mạnh mẫu

và cỡ mẫu. Nghiên cứu viên phải có kiển thức chuyên

sâu về thiết kế nghiên cứu và các thuật toán thống kê để

có thể sử dụng được phần mềm cũng như phiên giải kết

quả.

Page 37: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Loại

thiết kế

Bước 1: Nhập

dữ liệu về thiết

kế nghiên cứu,

tác động và

thuật toán thống

kê phân tích

4 bước sử dụng phần mền nquery tính toán cỡ mẫu chuyên nghiệp

Loại dữ

liệu đầu ra

Số nhóm

mẫu

Loại phân

tích thống

Cụ thể hóa

nhập liệu

thuật toán

thống kê

Page 38: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Nhập giá trị cụ thể của biến số

và mong muốn đặc tính mẫu

Bước 2: Xác

định giá trị cụ

thể của biến số

và mong muốn

đặc tính mẫu

4 bước sử dụng phần mền nquery tính toán cỡ mẫu chuyên nghiệp

Các ô tính ra

cỡ mẫu

Page 39: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Nhập giá trị cụ thể của biến số

và mong muốn đặc tính mẫu

Bước 3: Xác

định sức mạnh

mẫu từ các cỡ

mẫu và ngược

lại

4 bước sử dụng phần mền nquery tính toán cỡ mẫu chuyên nghiệp

Các ô kết

quả

Page 40: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Bước 4: Phân

tích độ nhạy của

mối quan hệ

Sức mạnh mẫu

– Cỡ mẫu

4 bước sử dụng phần mền nquery tính toán cỡ mẫu chuyên nghiệp

Biểu đồ của

phân tích độ

nhạy

Page 41: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Tính toán cỡ mẫu cơ bản 3 công thức cơ bản (phần in đậm là công thức gốc):

- Từ trung bình n = (ZS/E) 2= (Z(d-c)/E) 2

= N(ZS/E) 2/(N-1) =(ZS/E) 2

- Từ tỷ lệ n = Z2 p(1-p)/ E2 = Z2 Np(1-p)/ E2 (N-1)+ Z2 pq

- Từ phân vị n = pc(100-pc) Z2/ E2

- Z cho mức độ tin cậy 95% = 1.96, 99% = 2.58

- Công thức trên có thể mở rộng ra

- Quần thể có số lượng mẫu xác định và không xác định bằng

cách nhân hoặc không với hệ số N/(N-1),

- Tỷ lệ dự báo xác định và không xác định bằng cách nhân và

không với hệ số p*(1-p)

- Quần thể xác biến thiên hay không biến thiên bằng cách nhân

và không nhân với bình phương độ lệch chuẩn, bình phương

1/6 (hiệu giá trị lớn nhất – giá trị thấp nhất)

Page 42: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Công ty A quyết định tuyển sinh viên mới tốt nghiệp. Giám đốc cần quyết định mức lương cạnh tranh. Từ kinh nghiệm của các công ty khác cho thấy, lương sinh viên mới ra trường giao động từ 3,8 – 4,2 triệu, mức trung bình là 3,9 triệu. Độ lệch chuẩn ở vào mức 0,3 triệu.

Công ty muốn làm một nghiên cứu nhỏ, lựa chọn một số sinh viên làm mẫu, và muốn suy kết quả mức lương trung bình của nhóm sinh viên trong mẫu suy ra mức lương trung bình của tất cả sinh viên mới tốt nghiệp. Độ tin cậy: 95%, và giá trị xê địch trong khoảng +/- 50 nghìn.

Hãy tính cỡ mẫu cho nghiên cứu của công ty?

N = (1,96 x 0,3/ (2 x 0,05)) 2 = 34,57

Ví dụ 1

Page 43: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Ví dụ 2

VTV chuẩn bị phát sóng một chương trình giáo dục sức khỏe buổi sáng.

Kinh nghiệp từ VOV sức khỏe cho thấy, chương trình giáo dục sức khỏe chỉ thu hút được 2 trên 10 người xem truyền hình tại thời điểm buổi sáng.

VTV muốn làm một nghiên cứu nhỏ để xác định được tỷ lệ người xem chương trình của họ nếu phát sóng. Họ muốn chọn một số người xem truyền hình để phỏng vấn. Họ mong muốn kết quả thống kê trên mẫu phản ánh được kết quả thực sự ở mức xê dịch +/- 5% và với độ tin cậy 99%.

Cỡ mẫu mà VTV cần để khảo sát là bao nhiêu?

N = 2,58 2 x 0,2 x (1-0,2) / (2 x 0,05) 2 = 106,5

Page 44: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Ví dụ 3

Xác định cỡ mẫu cần thiết để điều tra phụ nữ tại

một xã X biết về việc khám thai đủ 3 lần trước

sinh là cần thiết. Khoảng tin cậy là 95% với sai

số 5%.

Một nghiên cứu tiến hành cách đây 2 năm cho

thấy 40% phụ nữ được hỏi nói biết khám thai đủ

3 lần trước sinh là cần thiết.

N = 0,4 x (1-0,4) x (1,96/ (2 x 0,05))2 = 92,19

Page 45: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Chọn mẫu từ quần thể

BN1 BN11 BN21 BN31 BN41 BN51 BN61 BN71 BN81 BN91

BN2 BN12 BN22 BN32 BN42 BN52 BN62 BN72 BN82 BN92

BN3 BN13 BN23 BN33 BN43 BN53 BN63 BN73 BN83 BN93

BN4 BN14 BN24 BN34 BN44 BN54 BN64 BN74 BN84 BN94

BN5 BN15 BN25 BN35 BN45 BN55 BN65 BN75 BN85 BN95

BN6 BN16 BN26 BN36 BN46 BN56 BN66 BN76 BN86 BN96

BN7 BN17 BN27 BN37 BN47 BN57 BN67 BN77 BN87 BN97

BN8 BN18 BN28 BN38 BN48 BN58 BN68 BN78 BN88 BN98

BN9 BN19 BN29 BN39 BN49 BN59 BN69 BN79 BN89 BN99

BN10 BN20 BN30 BN40 BN50 BN60 BN70 BN90 BN90 BN100

Có 100 bệnh nhân từ BN1 đến BN100

Page 46: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Bài tập chọn mẫu từ quần thể Hãy chọn 30 bệnh nhân một cách ngẫu nhiên từ 100 bệnh

nhân bằng 3 cách

Cách 1: Cắt 100 mạnh giấy, ghi tên 100 bệnh nhân, cho

vào 1 cái rọ, rồi nhắm mắt, thò tay vào rọ, lấy ra 30 tờ

Cách 2: In danh sách 100 bệnh nhân ra, mở bảng số ngẫu

nhiên, cho BN1 một số ngẫu nhiên bất kỳ trong bảng, 99

bệnh nhân tiếp theo cũng nhận được một số ngẫu nhiên

tiếp theo từ số ngẫu nhiên của BN1

Cách 3: Dùng hàm rand() trong Excel cho mỗi bệnh nhân

một số ngẫu nhiên, tráo bệnh nhân bằng sort, lựa chọn 30

bệnh nhân từ trên xuống dưới

Hãy chọn 30 bệnh nhân hệ thống từ 100 bệnh nhân

Page 47: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Tính toán cỡ mẫu nâng cao

- Học viên mang theo máy tính để thực

hành

- Học viên copy phần mềm “Sample Size

Determination in Health Studies”

Page 48: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Bài tập 1.1.1

Trung tâm y tế dự phòng huyện X muốn

xác định tỷ lệ hiện nhiễm của bệnh lao

trong nhóm trẻ em dưới 5 tuổi trên địa

bàn. Mẫu nghiên cứu cần bao nhiêu trẻ

khi kết quả của mẫu chỉ biến thiên dưới

10% so với giá trị thật của quần thể, với

95% độ tin cậy. Ngoài ra, tỷ lệ hiện nhiễm

được biết không vượt quá 10%.

Kết quả: 139

Page 49: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Bài tập 1.1.2

Viện vệ sinh dịch tễ trung ương muốn xác

định tỷ lệ trẻ em trong toàn quốc được

tiêm phòng đúng theo quy định. Mẫu

nghiên cứu cần bao nhiêu trẻ nếu muốn

kết quả của mẫu nghiên cứu xê dịch 5%

so với kết quả thực của quần thể, với độ

tin cậy là 95%

Kết quả: 385

Page 50: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Bài tập 1.3.1 Tỷ lệ thành công của một can thiệp tim mạch

ngoại khoa X được báo cáo trong y văn là 70%.

Một phương pháp mới Y được đề xuất mang

lại hiệu quả tương tự. Một cơ sở điều trị không

có năng lực ngoại khoa muốn áp dụng phương

pháp điều trị mới Y. Trước đó họ cần phải

nghiên cứu bao nhiêu bệnh nhân để kiểm định

giả thuyết phương pháp mới cũng có tỷ lệ

thành công là 70% với p = 0,05. Nghiên cứu

muốn có một sức mạnh 90% rằng giá trị xê

dịch +/- 5%.

Kết quả: 912

Page 51: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Bài tập 2.1.2

Một nghiên cứu với 50 công nhân đang tham

gia một dự án thủy lợi cho thấy 40% số họ bị

nhiễm sán máng. Một nghiên cứu tương tự

cũng với 50 công nhân nhưng không làm cho

dự án thủy lợi nào, tỷ lệ nhiễm sán máng chỉ là

32%. Một nhóm dịch tễ học muốn tiến hành

một nghiên cứu lớn hơn để có được kết quả

khác biệt giữa hai nhóm ở mức p=0,05, với

mức tin cậy 95% thì họ phải lựa chọn bao

nhiêu công nhân ở mỗi nhóm cho nghiên cứu.

Kết quả: 704

Page 52: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Bài tập 2.2.2 Ở một nghiên cứu, một nhóm dịch tễ học so sánh

50 bệnh nhân mắc một bệnh thần kinh với 50 bệnh

nhân không mắc bệnh làm nhóm chứng. 30 người

thuộc nhóm bệnh nhân (60%) và 25 người thuộc

nhóm chứng (50%) đi biển, đánh bắt cá. Giả định

tỷ lệ người làm nghề đi biển, đánh bắt cá trong

quần thể tương đương, và nhóm dịch tễ học muốn

làm một nghiên cứu lớn hơn ở cả hai nhóm bệnh

và chứng, để tính ra được sự khác biệt giữa hai

nhóm với mức tin cậy 90% và p = 0,05, thì mẫu họ

phải chọn ở mỗi nhóm là bao nhiêu?

Kết quả: 519

Page 53: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Bài tập 3.1.1

Tại thị trấn X, bệnh tả đang là một vấn đề sức khỏe

cộng đồng. Khoảng 30% người dân tin rằng họ

đang phải sử dụng nguồn nước ô nhiễm lây bệnh.

Một số nghiên cứu trong y văn cho thấy nguồn

nước ô nhiễm có nguy cơ làm người dân nhiễm

bệnh cao gấp 2 lần và với mức tin cậy 95%, xê

dịch trong 25%. Nhóm nghiên cứu đến thị trấn X

phải chọn bao nhiêu mẫu bệnh nhân và nhóm

chứng để xác định xem nguồn nước nơi đây có

phải là nguyên nhân dẫn đến sự lây lan của bệnh

tả hay không?

Kết quả: 408

Page 54: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Bài tập 4.1.1

Một nhóm nghiên cứu dịch tễ học lên kế hoạch

nghiên cứu xác định xác suất bệnh phổi X có liên

quan đến chất Y ô nhiễm trong không khí. Mẫu

nghiên cứu ở hai nhóm có và không tiếp xúc với

chất Y là bao nhiêu? nếu nghiên cứu muốn xác

định nguy cơ tương đối tới 50% giá trị thực của

quần thể và với độ tin cậy 95%. Từ trong y văn,

bệnh phổi X đang phối biến ở mức 20% trong

nhóm người không phới nhiễm với chất Y.

Kết quả: 44

Page 55: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Bài tập 4.2.1 Hai phương pháp điều trị một bệnh ung thư được đánh giá

trong một nghiên cứu thuần tập thử nghiệm lâm sàng.

Người bệnh được lựa chọn ngẫu nhiên cho mỗi phương

pháp điều trị và được theo dõi tình trạng tái phát bệnh trong

5 năm. Phương pháp điều trị A là một phương pháp mới

giảm một nửa nguy cơ tái phát trong 5 năm đầu. 35% người

bệnh được điều trị bằng phương pháp điều trị B tái phát

trong 5 năm đầu. Mẫu bệnh nhân mỗi nhóm điều trị A và B

là bao nhiêu nếu nhóm nghiên cứu muốn có mức tin cậy

90% để có thể loại trừ giả thuyết Ho (Nguy cơ tương đôi =1).

Nếu không thì kiểm định được chấp nhận ở độ tin cậy

p=0,05.

Kết quả: 131

Page 56: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Bài tập 6.1.1

Mẫu bệnh nhân là bao nhiêu nếu nhóm

nghiên cứu muốn xác định tỷ lệ mắc mới

của một bệnh xê dịch trong khoảng 10%

giá trị thực của quần thể, mức tin cậy

95%.

Kết quả: 385

Page 57: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Bài tập 6.2.2

Trên cơ sở số liệu 5 năm của BV X, theo dõi

một số lượng nhỏ bệnh nhân mắc bệnh X, tỷ lệ

mắc mới bệnh này được báo cáo là 40%.

Nhóm dịch tế học cần nghiên cứu trên bao

nhiêu bệnh nhân để kiểm định xem tỷ lệ mắc

mới bệnh X trên cộng đồng có đúng là 40% với

p=0,05 hay không? Nghiên cứu được mong

muốn có một sức mạnh 80% xác định tỷ lệ mới

thực hàng năm là 50%.

Kết quả: 146

Page 58: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Bài tập 6.3.2

Để biết về tác động lâu dài của tiếng ồn tới sức khỏe,

nhóm nghiên cứu A lên kế hoạch theo dõi dọc, so sánh

hai nhóm công nhân làm việc trong môi trường có tiếng

ồn và ít tiếng ồn. Y văn có nếu tỷ lệ suy giảm thính lực

hàng năm của công nhân làm trong môi trường ồn ào

là 25%. Mẫu nghiên cứu phải là bao nhiêu ở mỗi nhóm

để kiểm định loại bỏ Ho (giữa hai nhóm không có sự

khác biệt). Gỉa thuyết Ha là tỷ lệ giảm thính lực hàng

năm ở công nhân làm việc trong môi trường ít tiếng ồn

là 10%. Độ mạnh của kiểm định là 80%, p=0,05

Kết quả: 23

Page 59: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Bài tập 7.2.2

Y văn có một bài ghi nam giới cao huyết áp có cân

nặng trung bình là 70kg. Tuy nhiên, người ta cho rằng,

nam giới ở Việt Nam cao huyết áp không nặng như vậy

và muốn làm một nghiên cứu để kiểm tra điều đó. Cỡ

mẫu phải là bao nhiêu nếu muốn kiểm định với giá trị

p=0,05 và sức mạnh của mẫu là 90%, giá trị cân nặng

chấp nhận sai lệch ở mức 5 kg, sự biến thiên/độ lệch

chuẩn là 20 kg.

Kết quả: 169

Page 60: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Bài tập 8.1.1

Y văn có nói tỷ lệ trẻ em nhiễm giun đũa ở các nước

phát triển là 30%. Trung tâm y tế huyện A có 4000 trẻ

dưới 5 tuổi, muốn làm một nghiên cứu, chọn một số trẻ

để kiểm tra phân. Họ muốn kết quả nghiên cứu trên

mẫu nghiên cứu của họ chỉ chênh lệch 5% so với cả

quần thể 4000, ở mức tin cậy 95%. Số trẻ mà Trung

tâm chọn từ 4000 cháu phải là bao nhiêu?

Kết quả: 977

Page 61: Bài giảng và bài tập chọn mẫu và tính toán cỡ mẫu

Bài tập 8.2.1

3 huyện miền núi A, B, C có số hộ gia đình là 2000,

3000 và 5000. Một đoàn đánh giá nhanh của Bộ NN &

PTNN cho thấy tỷ lệ hộ gia đình sử dụng nước sạch

hợp vệ sinh là 10% ở 1 xã huyện A, 15% ở 1 xã huyện

B và 20% ở 1 xã huyện C. Sở Y tế nghi ngờ kết quả

này và muốn làm một nghiên cứu để xác định tỷ lệ thực

sự hộ gia đình sử dụng nước sạch ở 3 huyện là bao

nhiêu. Họ có một tí tiền tiếp cận hộ gia đình để khảo

sát, muốn chọn mẫu và muốn kết quả thống kê trên

mẫu chỉ xê dịch 2 % so với toàn bộ quần thể 10000 hộ

ở 3 huyện, độ tin cậy 95% cho các kết quả thống kê.

Kết quả: 1158