§4. ĐO LƯỜNG SỰ XUẤT HIỆN BỆNH · PDF filelâm sàng ở một...
-
Upload
duongxuyen -
Category
Documents
-
view
214 -
download
0
Transcript of §4. ĐO LƯỜNG SỰ XUẤT HIỆN BỆNH · PDF filelâm sàng ở một...
1
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
§4. ĐO LƯỜNG SỰ XUẤT HIỆN BỆNH
1. Các dạng số liệu
Số liệu lâm sàng bao gồm 3 dạng: hạng mục (nominal hay categorical), thứ tự (ordinal)
và khoảng cách (interval).
Số liệu dạng hạng mục có thể là các đặc tính di truyền của động vật (loài, giống, giới
tính và màu lông) hoặc là các biến cố rời rạc (tình trạng gãy xương, sinh, chết). Kết quả của số
liệu loại này thường được diễn đạt ở dạng tỷ lệ (proportion, rate), chẳng hạn tỷ lệ bệnh của thú
đực và của thú cái.
Số liệu dạng thứ tự có thể được xếp hạng nhưng khoảng cách giữa các số không nhất
thiết phải đồng đều. Thí dụ của số liệu dạng thứ tự là mức độ đau, mức độ mất nước, mức độ
mất khả năng điều phối cơ thể và độ trầm trọng của âm thanh hô hấp. Trong một nghiên cứu về
tình trạng tiêu chảy của heo con, sự thay đổi của dạng phân được đánh giá bằng 3 mức: 1 (bình
thường), 2 (sền sệt) và 3 (lỏng). Loại số liệu này thường được dùng trong bản điều tra
(questionaire) và được tính trung vị (median) mà không tính trung bình (mean).
Số liệu dạng khoảng cách (có thể liên tục hay rời rạc) gồm các trị số đo lường như thân
nhiệt, trọng lượng, hoặc gồm các dạng tỷ số (ratio) như hàm lượng các chất trong máu. Số liệu
dạng này được tính trung bình. Trong thú y, người ta có thể phân lớp số liệu dạng hạng mục
hoặc số liệu dạng khoảng cách, chẳng hạn phân tuổi thú hoặc trọng lượng thành các mức không
đồng đều (hoặc đồng đều) về khoảng cách (tuổi: 0-2 tuần, 2 tuần đến 2 tháng; trọng lượng: 0-1
kg, 1-2 kg). Cách phân lớp này thuận tiện trong việc gom lượng lớn thông tin vào từng hạng
mục có ý nghĩa về mặt lâm sàng. Tuy nhiên vài thông tin hữu ích có thể bị mất do cách gom
thông tin. Thí dụ trong nghiên cứu theo dõi yếu tố gây nguy cơ hoặc tiên lượng cho một bệnh,
nếu không ghi nhận và xử lý bệnh theo tuổi chính xác, kết quả có thể sai lệch. Bảng 4.1 tóm tắt
thí dụ về sự khác nhau giữa 3 dạng số liệu trong đánh giá lâm sàng về tình trạng thiếu máu ở chó
mèo.
Bảng 4.1: Đánh giá lâm sàng về tình trạng thiếu máu ở chó mèo
Số liệu dạng hạng mục
Số liệu dạng thứ tự
Số liệu dạng khoảng cách
Giống, giới tính, khẩu phần, quá trình dùng thuốc hoặc
tình trạng nhiễm trùng gần đây, âm thanh rì rào (murmur)
của tim, xuất huyết
Khởi đầu của bệnh (mãn tính hay cấp tính), màu sắc của
màng niêm, màu phân, mức độ yếu ớt
Tuổi, nhịp tim, hàm lượng protein huyết tương
Mức giá trị (validity) và độ tin cậy (reliability)
Mức giá trị và độ tin cậy là hai từ ngữ dùng để diễn đạt phẩm chất của các đo lường lâm
sàng. Giá trị (hoặc độ chính xác - accuracy) diễn tả khả năng phản ánh tình trạng thật có đang
được đo lường. Độ tin cậy là khả năng lập lại (repeatability) cho thấy sự giống nhau của kết quả
đo lường sau nhiều lần lập lại. Đôi khi độ tin cậy được gọi là tính đúng (precision).
2
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
Giá trị và độ tin cậy tương đối dễ xác định khi các đo lường được so sánh với các tiêu
chuẩn đã được chấp nhận. Thí dụ, giá trị và độ tin cậy của các xét nghiệm huyết học có thể được
xác định bằng cách dùng kỹ thuật phân lập hoặc mổ khám.
Tuy nhiên, giá trị và độ tin cậy không dễ xác định ở những đo lường dựa vào cảm giác
của thú y viên hoặc không có tiêu chuẩn cụ thể. Thí dụ, giá trị của việc ước lượng mức độ trầm
trọng ở bệnh viêm phổi dựa vào thính chẩn mà không mổ khám. Giá trị của chẩn đoán bằng X
quang hoặc huyết thanh học của bệnh giun tim ở chó thường được xác định bằng cách đánh giá
đáp ứng của thú đối với liệu pháp trong khi cách đánh giá tốt nhất phải là mổ khám.
Giá trị và độ tin cậy có thể độc lập nhau. Một xét nghiệm huyết thanh học được lập lại
trên cùng một mẫu huyết thanh có thể cho những kết quả giống nhau (tin cậy) nhưng hiệu giá có
thể biến động rất lớn so với trị số thật (không chính xác).
Hệ số biến động (coefficient of variation, CV) thường được dùng để diễn đạt tính đúng
(độ tin cậy) của đo lường lâm sàng. CV tượng trưng cho tỷ số biến động chung quanh trị số
trung bình của một dãy số liệu đo lường và nó được xem là chỉ số để so sánh độ tin cậy của các
thiết bị, cá nhân hay phòng xét nghiệm khác nhau.
Hình 4.1: Mức giá trị và độ tin cậy trong các kết quả xét nghiệm
3
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
Sự biến động (variation)
Đo lường lâm sàng thường biến động do bởi hai nguồn. Đó là nguồn biến động từ dụng
cụ hoặc cách đo lường và sự biến động sinh học ở mỗi cá thể. Biến động sinh học biểu lộ ở
nhiều mức độ trong một quần thể. Chẳng hạn xét nghiệm bệnh lý mô của một mẫu sinh thiết có
thể biến động tùy vùng có bệnh tích hoặc tùy theo bộ phận được lấy mẫu. Ngoài ra, đo lường
lâm sàng ở một cá thể có thể thay đổi qua thời gian. Trong vài trường hợp, sự biến động này có
thể theo chu kỳ, chẳng hạn hàm lượng kích thích tố, số lượng microfilaria của giun tim hoặc
thân nhiệt.
Thú y viên đối phó với bệnh trên cả 2 phương diện: cá thể thú và đàn thú. Ảnh hưởng
của biến động sinh học lên số liệu của đàn thú có thể được hạn chế bằng cách lấy dung lượng
mẫu lớn. Tuy nhiên khó có thể làm giảm ảnh hưởng của biến động sinh học khi xét nghiệm trên
từng cá thể. Do đó theo đúng quy trình xét nghiệm là biện pháp quan trọng duy nhất để làm
giảm mức biến động chung của số liệu.
Trong cố gắng làm giảm độ biến động, cũng cần phân biệt biến động ngẫu nhiên và biến
động hệ thống (sai số do thiên vị). Biến động ngẫu nhiên là do bởi sự phân bố ngẫu nhiên của số
liệu đo lường, chẳng hạn số hồng cầu ở mỗi vi trường kính hiển vi phân bố không giống nhau.
Sự không chính xác của phân bố ngẫu nhiên có thể giảm bằng cách lấy dung lượng mẫu lớn.
Tuy nhiên biến động hệ thống có thể làm sai lệch kết quả, thí dụ mỗi kỹ thuật viên báo cáo số
lượng hồng cầu khác nhau dù xét nghiệm trên một mẫu máu.
Các trị số đo lường lâm sàng nên được diễn đạt ở các mức tuổi cho từng loài. Chẳng hạn
hàm lượng protein huyết tương rất thấp ở chó sơ sinh, tăng dần đến gần bằng hàm lượng protêin
huyết tương của thú mẹ khi nó bắt đầu bú sữa mẹ, sau đó giảm dần trong vòng 6 tháng đầu sau
khi sanh và lại tăng lên đến 1 năm tuổi. Hàm lượng tối đa đạt được khi chó khoảng 7-10 năm
tuổi, sau đó lại giảm đi. Công thức bạch cầu ở bò cũng biến động tương tự ở chó mèo từ sơ sinh
đến cai sữa, sau đó công thức bạch cầu của bò thay đổi rất nhiều và lâm ba cầu hiện diện nhiều
nhất ở máu ngoại biên.
Phân bố của số liệu
Số liệu dạng khoảng cách, dù là liên tục hay rời rạc, có thể được diễn tả dưới dạng phân
bố tần số (histogram). Hai đặc tính cơ bản của sự phân bố số liệu mà ta có thể dùng để tóm tắt số
liệu là sự tập trung về giữa (central tendency) và phân tán (dispersion).
Về hình dạng của đường phân bố, cần lưu ý tính đối xứng (symmetry) và độ lệch
(skewness). Tính đối xứng và độ lệch phản ảnh mối quan hệ giữa trung bình, trung vị và số lập
lại nhiều nhất. Khi phân bố đối xứng thì ba trị số này bằng nhau. Khi phân bố lệch dương, trung
bình lớn hơn trung vị bởi vì trị số lớn nhất nằm lệch ở phần trên của phân bố (thường gọi là lệch
về phía phải). Khi phân bố lệch âm, trung bình nhỏ hơn trung vị (lệch về phía trái). Yếu tố ảnh
hưởng đến độ lệch của đường phân bố trong đo lường lâm sàng thường là tuổi, giới tính, dinh
dưỡng và thời kỳ sản xuất của thú.
4
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
Trong phần này, cần lưu ý đến phân bố Gauss - loại phân bố được dùng như phân bố
chuẩn mà số liệu sinh học thường được cho là phân bố theo kiểu này. Phân bố chuẩn (Biểu đồ
4.1) là mô hình toán học diễn tả sự phân bố của các số liệu đo lường lập lại trên cùng một chỉ
tiêu bởi cùng một loại trang thiết bị. Sự phân bố của số liệu là do bởi biến động ngẫu nhiên mà
thôi (không do biến động hệ thống) với trị số trung bình = trung vị = số lập lại nhiều nhất. Đây
là phân bố đối xứng; nghĩa là trong bất kỳ trị số nào của SD, tỷ lệ của các trị số phân bố theo
chiều hướng dương cũng đều giống như tỷ lệ của các trị số phân bố theo chiều hướng âm.
Hình 4.2: Trung bình và các trị số tới hạn (±1,96SD) với khoảng tin cậy 95% dùng trong trắc
nghiệm 2 đuôi (trị số bất thường là trị số cao hơn hoặc thấp hơn trị số tới hạn, chẳng hạn như số
lượng bạch cầu trong 1 ml máu)
Hình 4.2: Phân bố số
liệu (tỷ lệ) ở các mức
độ lệch chuẩn khác
nhau dưới đường cong
chuẩn (đường cong
Gauss)
5
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
2. Đo lường sự xuất hiện bệnh
Như đã được đề cập ở chương 1 về dịch tễ học mô tả, đây là những nghiên cứu dùng để
mô tả thực trạng một bệnh hay dịch bệnh nào đó xảy ra trong quần thể. Như vậy để mô tả thì cần
phải đáp ứng đủ các thông tin sau: con thú nào mắc bệnh, số lượng mắc bệnh, tỷ lệ nhiễm bệnh,
nhóm thú mắc bệnh, phân bố bệnh ở đâu... Tùy thuộc vào điều kiện thực tế mà sự phân chia
nhóm thú có thể khác nhau khi mô tả bệnh. Ví dụ người ta có thể mô tả bệnh theo khu vực, theo
nhóm tuổi, theo giới tính, theo giống... Trong đó đại lượng thường được sử dụng để mô tả là tỷ
lệ bệnh; ngoài ra người ta còn dùng nhiều đại lượng khác (sẽ được thảo luận kỹ ở chương này).
Trước khi tìm hiểu các đại lượng cụ thể, chúng ta cần biết các nhóm thuật ngữ được dùng trong
đo lường về mặt dịch tễ học.
- Tần số (frequency): là số lượng cá thể có cùng một tính chất nào đó. Đơn vị có thể là
con, cái, vật...
- Tỷ số (ratio): khi so sánh 2 nhóm nào đó về tần số hoặc một chỉ số nào đó người ta có
thể dùng tỷ số, ví dụ trong đàn có 50 con đực và 500 con cái thì có thể nói tỷ số giữa đực
và cái là 50/500. Tỷ số được dùng trong dịch tễ học phổ biến nhất là chỉ số OR khi so
sánh nguy cơ có bệnh của 2 nhóm thú nào đó. OR sẽ được đề cập ở những chương sau.
- Tỷ lệ (proportion): khi đề cập đến tần số bệnh hay một tính chất nào đó của thú chiếm
bao nhiêu phần trong tổng số thì người ta dùng tỷ lệ. Lưu ý tỷ lệ khác với tỷ số là phần
mẫu số của chúng có chứa luôn phần của tử số. Thí dụ tỷ số là a/b trong khi đó tỷ lệ là
a/c trong đó c = a + b.
- Mức độ (rate) (đôi khi dùng là tốc độ): mức độ bệnh không chỉ về diễn tả số lượng mà
còn liên quan đến tốc độ lây lan nhanh hay chậm của một bệnh, nên nhớ là đại lượng này
luôn đi kèm với thời gian.
2.1. Tỷ lệ bệnh (prevalence)
Tỷ lệ bệnh đôi khi được dùng với tên tỷ lệ nhiễm, hay tỷ lệ có bệnh. Tỷ lệ này được định
nghĩa là số con thú có cùng tính chất đang khảo sát (bệnh, nhiễm bệnh, mang trùng, có rối loạn
bất thường về sức khỏe...) trong một quần thể tại một thời điểm nhất định chia cho tổng số thú
trong quần thể đó. Đại lượng này thường được tính theo phần trăm.
Ví dụ, muốn biết tỷ lệ nhiễm một loại ký sinh trùng nào đó trên chó thuộc một địa bàn
nào đó (một quần thể xác định) thì phải đến từng hộ nuôi chó (tất cả chó của khu vực), lấy mẫu
phân xét nghiệm. Số chó cho kết quả dương tính sẽ là tử số của công thức và tổng số chó trong
quần thể sẽ là mẫu số. Lưu ý việc lấy mẫu và phân tích mẫu phải được thực hiện cùng một thời
điểm để kết quả khảo sát có giá trị.
Trong các nghiên cứu về y học, người ta thường dùng 2 loại thuật ngữ về tỷ lệ nhiễm, đó
là tỷ lệ nhiễm theo thời điểm (point prevalence) và tỷ lệ nhiễm theo khoảng thời gian (period
P (%) = Số thú mắc bệnh x 100
Tổng số thú trong quần thể tại một thời điểm nhất định
P (%) = Số thú mắc bệnh x 100
Tổng số thú trong quần thể tại một thời điểm nhất định
P (%) = Số thú mắc bệnh x 100
Tổng số thú trong quần thể tại một thời điểm nhất định
P (%) = Số thú mắc bệnh x 100
Tổng số thú trong quần thể tại một thời điểm nhất định
P(%) = Số thú mắc bệnh x 100
Tổng số thú trong quần thể tại một thời điểm nhất định
6
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
prevalence). Sự phân loại này dựa theo thời gian thu thập số liệu và phân tích mẫu. Nếu thời
gian phân tích mẫu hay kết quả khảo sát trong một khoảng thời gian ngắn thì có thể được coi là
tỷ lệ nhiễm theo thời điểm còn nếu thời gian khảo sát kéo dài theo đơn vị năm thì thường được
dùng là tỷ lệ nhiễm theo khoảng thời gian.
Tỷ lệ nhiễm cho kết quả tổng quát về sự phổ biến, sự lưu hành của một bệnh, một tính
chất khảo sát nào đó trong quần thể. Nó có giá trị nhất định trong việc đánh giá mức độ gánh
nặng mà người chăn nuôi phải chịu về một bệnh nào đó. Từ đó có những chiến lược thích hợp
trong phòng bệnh.
Tuy nhiên đôi khi tỷ lệ nhiễm không thể hiện rõ diễn tiến nhanh hay chậm của bệnh,
không phân biệt được bệnh mới hay bệnh cũ, bệnh một lần hay nhiều lần. Đặc biệt trong các
bệnh được chẩn đoán bằng phản ứng huyết thanh học, kết quả tỷ lệ nhiễm có thể cao hơn nhiều
so với thực tế. Ví dụ đối với bệnh viêm phổi địa phương trên heo thịt thì tỷ lệ nhiễm có thể đạt
tới 100% khi dùng phản ứng huyết thanh học để chẩn đoán.
2.2. Xác định tỷ lệ nhiễm trong quần thể
Khi muốn xác định tỷ lệ nhiễm trong quần thể, người ta không thể lấy tất cả các cá thể
trong quần thể để xét nghiệm hay phân tích ngoại trừ một số quần thể nhỏ. Trong trường hợp đó,
việc chọn mẫu và và dung lượng mẫu khảo sát hết sức quan trọng. Kết quả phân tích từ các mẫu
đã chọn được sử dụng làm cơ sở để ước tính tỷ lệ nhiễm của cả quần thể. Để thực hiện điều này
có thể dùng phương pháp ước lượng thống kê như sau:
Tỷ lệ nhiễm của quần thể (P) = tỷ lệ nhiễm của dung lượng mẫu được chọn ± (Z(1-α)× SE)
Trong đó Z(1-α) là hệ số tin cậy và SE (Standard Error) là sai số chuẩn.
7
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
Hình 4.3: Lấy mẫu để xác định tỷ lệ bệnh của quần thể
Gọi n là số mẫu lấy từ quần thể và a là số cá thể có tính chất khảo sát; p là tỷ lệ nhiễm
của mẫu (p = a/n); ước tính tỷ lệ nhiễm trong quần thể ở độ tin cậy 95% như sau:
P = p ± 1,96 × p)/np(1
Việc xác định tỷ lệ bệnh cho quần thể tùy thuộc rất nhiều vào dung lượng mẫu. Để ước
tính số lượng cá thể cần thiết người ta phải dựa vào các dự đoán về tỷ lệ và sai số mong muốn.
Công thức tính dung lượng mẫu để xác định tỷ lệ bệnh như sau:
n = p)p(1z1)(Nd
p)p(1Nz22
2
Trong đó z là giá trị phân phối chuẩn ở độ tin cây nhất định, chẳng hạn như z = 1,96 với
độ tin cậy 95%. Trị số “d” được gọi là khoảng giới hạn cho phép, được tính là một nửa của
khoảng biến thiên giới hạn trên và giới hạn dưới của tỷ lệ ước tính, ví dụ ước tính tỷ lê nhiễm là
20-30% thì d = (0,3 - 0,2)/2 = 0,05. Giá trị p là tỷ lệ nhiễm theo mong muốn. Có nghĩa là người
nghiên cứu phải giả định tỷ lệ nhiễm để có thể dự kiến số mẫu khảo sát. Số liệu ước tính này có
8
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
thể dựa vào các nghiên cứu trước đây hoặc những khảo sát ở những quần thể tương tự khác. Đôi
khi số liệu liên quan không có thì người nghiên cứu cần làm một khảo sát thử để đánh giá sơ bộ
tình hình nhiễm, kết quả này sẽ làm tham khảo cho việc tính toán dung lượng mẫu. N là tổng
đàn thú khảo sát. Bên cạnh đó, chúng ta cũng rất thường khảo sát quần thể rất lớn (n/N ≤5%)
hoặc không biết chính xác số lượng cá thể trong quần thể, trong trường hợp đó có thể dùng theo
công thức sau:
n = 2
2
d
p)p(1z
Nếu muốn biết đàn thú có bệnh hay không (không phải xác định tỷ lệ bệnh), chúng ta có
thể tính dung lượng mẫu tối thiểu cần khảo sát. Vấn đề này thường được quan tâm trong các
chương trình thanh toán hay kiểm soát bệnh. Chúng ta cần giảm bớt lỗi loại II (Pb), đó là xác
suất cho rằng đàn thú không bệnh trong khi nó thật sự có bệnh (âm tính giả).
Giả sử một đàn heo có 10% nhiễm virus giả dại và bệnh được phát hiện bằng huyết
thanh học. Nếu một mẫu huyết thanh được lấy từ một heo chọn ngẫu nhiên trong đàn, xác suất
mà heo đó ở trong nhóm không nhiễm virus là 0,9. Như thế Pb = 0,9 và chúng ta có đến 90% cơ
hội không phát hiện được tình trạng nhiễm bệnh trong đàn. Nếu hai heo được lấy mẫu, xác suất
mà hai heo đó từ nhóm không nhiễm virus là 0,9 × 0,9 = 0,81. Công thức tổng quát để ước tính
Pb trong thí dụ này là:
Pb = (1 - tỷ lệ bệnh ước tính)n
Với Pb là cơ hội mà những thú lấy mẫu không mang bệnh và n là dung lượng mẫu. Công
thức này có thể được sắp xếp lại để tính dung lượng mẫu với bất kỳ Pb:
log (Pb)
n = -------------------------------
log (1 - tỷ lệ bệnh ước tính)
Trong đó, n là dung lượng mẫu lấy từ quần thể lớn (hoặc quần thể rất lớn so với dung
lượng mẫu được lấy, lượng mẫu lấy dưới 10% dân số thì lượng mẫu đó là nhỏ). Trong thí dụ
trên, nếu muốn Pb = 0,05 thì phải lấy máu của khoảng 29 heo để 95% chắc chắn là có ít nhất 1
heo được phát hiện mang mầm bệnh giả dại, từ đó có thể kết luận là đàn heo có bệnh. Công thức
trên chỉ dùng cho quần thể lớn. Trong các chương trình thanh toán hay kiểm soát bệnh của tỉnh
hay quốc gia, cách tính dung lượng mẫu phải được điều chỉnh theo tổng đàn gia súc. Dung
lượng mẫu còn tùy thuộc vào độ nhạy (sensitivity) và độ chuyên biệt (specificity) của xét
nghiệm chẩn đoán. Yếu tố quan trọng nhất trong việc xác định dung lượng mẫu vẫn là mức độ
chính xác của tỷ lệ bệnh (prevalence) được ước tính. Vì dung lượng mẫu tăng khi tỷ lệ bệnh
thấp, chúng ta nên ước đoán một tỷ lệ thấp nhất có thể xảy ra.
Công thức có thể áp dụng cho một quần thể nhất định là:
n = {1 - (1 - P1)1/d
} {N - d/2} + 1
với N : tổng đàn thú
9
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
d : số thú mắc bệnh trong đàn
n : dung lượng mẫu
P1 : xác suất có được 1 con bệnh trong mẫu lấy.
Thí dụ, trong một chương trình kiểm soát bệnh dịch bò ở châu Phi, người ta thực hiện
phản ứng huyết thanh trên nhiều đàn để biết rằng liệu những thú không chủng ngừa có mắc bệnh
tự nhiên. Thông thường, trong một đàn bị nhiễm bệnh thì ít nhất 5% thú có huyết thanh dương
tính. Do đó số mẫu sẽ được lấy sao cho có thể phát hiện bệnh ở mức tỷ lệ huyết thanh dương
tính 5%. Nếu P1 = 0,95 và quần thể có 200 bò, dung lượng mẫu là:
n = {1 - (1 - 0,95)1/10
} {200 - 10/2} + 1 = 51
(d = 10 vì là 5% của 200)
Như thế, nếu tỷ lệ huyết thanh dương tính là 5%, 51 thú phải được lấy mẫu để phát hiện
1 thú có huyết thanh dương tính với xác suất 0,95.
Ví dụ:
* Khảo sát 591 heo có nguồn gốc từ 1 tỉnh nào đó tại lò mổ, kết quả xét nghiệm cho thấy
204 con nhiễm giun đũa. Như vậy tỷ lệ nhiễm giun đũa trên heo thịt tại tỉnh X được ước tính
như sau:
p = 204/591 = 0,3452
Se = p)/np(1 = 10,3452)/590,3452(1 = 0,01956
P = 0,3452 ± 1,96 (0,01956) = 0,3452 ± 0,0383
= (0,3069 ; 0,3835)
* Căn cứ vào kết quả khảo sát này (giả sử p = 35%), một nghiên cứu ở địa bàn khác
muốn làm một khảo sát tương tự. Như vậy cần dung lượng mẫu là bao nhiêu nếu muốn kết quả
sai biệt của chúng ta không quá 5% (có nghĩa là d = 0,05). Chúng ta có thể dùng công thức tính
toán sau:
n = 2
2
d
p)-p(1z =
2
2
)05,0(
)35,01)(35,0()96,1( = 349,6
Nói cách khác, dung lượng mẫu cần thiết là 350.
4.3. Tỷ lệ mắc bệnh (incidence)
Như phần trên đã đề cập, tỷ lệ nhiễm chỉ đánh giá sơ bộ tình hình bệnh nào đó trong
quần thể, tỷ lệ này không phân biệt được những trường hợp bệnh cũ, bệnh mới hay bệnh nhiều
10
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
lần. Trong các nghiên cứu dịch tễ học, để đánh giá chính xác sự xuất hiện bệnh, người ta định
nghĩa thêm một thông số khác, đó là tỷ lệ mắc bệnh. Có 2 loại tỷ lệ mắc bệnh: tỷ lệ mắc bệnh
tích lũy (cumulative incidence) và tốc độ mắc bệnh (incidence density rate).
Tỷ lệ mắc bệnh tích lũy (CI) là tỷ lệ giữa số thú mới mắc bệnh trong một khoảng thời
gian nhất định và số con thú khỏe có nguy cơ mắc bệnh trong quần thể ở đầu thời gian khảo sát.
Như vậy CI là một đại lượng đặc trưng cho nguy cơ mắc bệnh của quần thể trong thời gian khảo
sát. Đây là đại lượng thường được dùng trong các nghiên cứu dịch tễ học phân tích. CI có giá trị
từ 0 đến 1.
Khi khảo sát tỷ lệ mắc bệnh tích lũy, khoảng thời gian khảo sát nhất định phải được đề
cập vì có ảnh hưởng đến giá trị của CI. Tất cả những thú khỏe (có nguy cơ) phải được đưa vào
khảo sát cùng một thời điểm bắt đầu khảo sát. Những quần thể thú như vậy được gọi là quần thể
tĩnh. Tuy nhiên trên thực tế các quần thể khảo sát thời ở dạng quần thể động, có nghĩa là có
những thú mới đưa vào thêm quần thể, có những thú loại ra khỏi quần thể. Trong trường hợp đó,
để có giá trị CI đối với một bệnh nào đó cho quần thể, người ta dùng giá trị quần thể trung bình
làm mẫu số cho việc tính CI. Giá trị trung bình này được tính là tổng số con thú khỏe ở đầu khảo
sát và cuối thời gian khảo sát chia cho 2.
Ví dụ: Quan sát một đợt dịch bệnh giả dại xảy ra trên đàn heo con sau cai sữa gồm 100 con, kết
quả ghi nhận số heo con mắc bệnh theo ngày và tỷ lệ mới bệnh được tính theo bảng sau:
Bảng 4.2 Khảo sát thú bệnh giả dại trong đàn để tính CI
Tuần Số thú
bệnh
Số thú có nguy cơ
trong từng giai
đoạn khảo sát
Tỷ lệ mắc
bệnh
theo tuần
Số thú bệnh
tích lũy
Tỷ lệ mắc
bệnh tích
lũy
1 20 100 0,2 20 0,2
2 15 80 0,19 35 0,35
3 10 65 0,15 45 0,45
4 5 55 0,09 50 0,5
5 1 50 0,02 51 0,51
Có thể kết luận là tỷ lệ mắc bệnh tích lũy trong thời gian 5 tuần của quần thể là 0,51.
Hay nói cách khác, 51% là xác suất mà một con trong đàn có thể mắc bệnh trong giai đoạn 5
tuần.
Tốc độ mắc bệnh (Incidence Density Rate: IR) là tỷ số giữa số ca bệnh mới của một quần
thể có nguy cơ trong suốt một khoảng thời gian xác định và tổng số đơn vị thời gian có nguy cơ
của tất cả những thú trong quần thể đó. Người ta đưa ra khái niệm này với mục đích mô tả mức
độ bệnh, chẳng hạn như bệnh lập đi lập lại nhiều lần hay không, bệnh kéo dài hay không.
Đơn vị thời gian ở đây thường dùng là năm, tháng, hay tuần của động vật khảo sát.
Trong thí dụ trên, tổng số ca mắc bệnh trong suốt thời gian khảo sát là 51 ca. Tổng số tuần có
nguy cơ được tính như sau:
- Trong tuần đầu tiên, 20 heo bị bệnh, như vậy tổng số tuần có nguy cơ mà chúng đóng
góp cho quần thể sẽ là 20/2 = 10 tuần (trung bình phát bệnh ở giữa tuần khảo sát)
11
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
- Tiếp tục 15 con phát bệnh trong tuần thứ hai sẽ đóng góp 15+15/2 = 22,5 tuần
- Tương tự tuần thứ ba có 10+10+10/2 = 25 tuần
- Tuần thứ tư: 5+5+5+5/2 = 17,5
- Tuần thứ năm 1+1+1+1+1/2 = 4,5 tuần
- Có tất cả 49 con khỏe mạnh sẽ đóng góp 49 x 5 = 245 tuần
Vậy tổng cộng số tuần có nguy cơ của cả quần thể là 10 + 22,5 + 25 + 17,5 + 4,5 + 245 =
324,5 tuần. Áp dụng công thức tính tốc độ bệnh mới ta có kết quả là 51/324,5 = 0,157 (heo
con/tuần heo con có nguy cơ). Giá trị này thể hiện độ mạnh của bệnh và tốc độ của bệnh trong
quần thể có giá trị trong các nghiên cứu dịch tễ về bệnh học có liên quan đến thời gian, đặc biệt
là các nghiên cứu trên các quần thể động (dynamic population). Lưu ý giá trị này biến đổi từ 0
đến ∞ tùy theo giá trị thời gian đề cập, ví dụ 0,157 (heo con/tuần heo con có nguy cơ) = 8,164
(heo con/năm heo con có nguy cơ).
Về mặt lý thuyết có thể ước tính CI từ IR bằng công thức sau:
CI(t) = 1 - e(-IR×t)
Trong đó t là thời gian khảo sát. Ví dụ từ kết quả trên ta có IR = 0,157 (con/tuần heo con
có nguy cơ), tính CI trong 5 tuần ta được kết quả là 0,54 (trong khi thực tế là 0,51).
2.4. Mối liên quan giữa tỷ lệ bệnh và tỷ lệ mắc bệnh
Các chỉ số thể hiện sự xuất hiện bệnh trong quần thể bệnh vừa trình bày trên có giá trị
nhất định cho chăn nuôi. Một số vấn đề cần lưu ý như sau:
- Tỷ lệ bệnh chỉ liên quan đến sự phổ biến của bệnh.
- Tỷ lệ mắc bệnh cho thấy diễn tiến của bệnh, cho thấy cái gì sẽ xảy ra trong tương lai
cũng như cho biết nguy cơ có bệnh của quần thể.
Diễn biến bệnh tùy thuộc cách theo dõi tỷ lệ bệnh. Nếu tỷ lệ bệnh được tính dựa trên sự
hiện diện của dấu hiệu bệnh thì tỷ lệ bệnh có thể giảm dần qua thời gian; điều này không phải do
bởi giảm nguy cơ bệnh mà do số thú nhạy cảm đã ít đi. Mặt khác, nếu tỷ lệ bệnh được tính dựa
vào sự hiện diện của một kháng thể đặc hiệu, tỷ lệ bệnh có thể tăng dần qua thời gian bởi vì tăng
số thú có chuyển đổi huyết thanh.
Thí dụ, virút gây viêm não và viêm khớp ở dê là nguyên nhân đưa đến viêm đa khớp trên
dê trưởng thành hoặc thỉnh thoảng gây viêm chất trắng của não trên dê con. Điều tra huyết thanh
học với phương pháp khuếch tán miễn dịch trên agar-gel (agar-gel immunodiffusion test) cho
thấy tỷ lệ huyết thanh dương tính là 81% ở Hoa Kỳ (Crawford and Adams, 1981). Tác nhân gây
bệnh có thể truyền qua sữa đầu và sữa. Do đó vài nhà chăn nuôi dùng sữa đầu đã xử lý nhiệt và
sữa thanh trùng cho dê con để giảm nhiễm trùng. Dùng những loại sữa này đã giảm sự truyền
bệnh (huyết thanh dương tính giảm ở nhóm dùng sữa thanh trùng). Tuy nhiên huyết thanh học
cho thấy huyết thanh dương tính (tỷ lệ bệnh) tăng khi tuổi tăng ở cả nhóm dùng sữa thanh trùng
và nhóm dùng sữa không thanh trùng. Điều này có thể do sự truyền ngang của virút và xảy ra
12
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
trong quá trình vắt sữa. Điều quan trọng cần ghi nhận là gia tăng tỷ lệ huyết thanh dương tính
theo tuổi không có nghĩa là nguy cơ nhiễm trùng xảy ra nhiều trên thú lớn tuổi. Gia tăng tỷ lệ
huyết thanh dương tính chỉ phản ánh rằng có thêm thú mới nhiễm bệnh trong đàn đã mắc bệnh.
Tỷ lệ mới mắc bệnh của mỗi nhóm tuổi có thể được ước tính sơ khởi bằng cách trừ tỷ lệ huyết
thanh dương tính của nhóm tuổi này với nhóm tuổi ngay trước đó.
- Có một mối liên quan tương đối giữa các đại lượng này thông qua công thức sau:
P = IR × D trong đó D là thời gian kéo dài trung bình của một bệnh.
Từ công thức này, có thể tính tỷ lệ mới mắc bệnh. Thí dụ, đàn bò sữa có tỷ lệ viêm vú là
4,5% bằng phương pháp California Mastitis Test (CMT). Nếu khoảng thời gian bệnh là 3 tháng
(0,25 năm), tỷ lệ mới mắc bệnh viêm vú hằng năm sẽ là 4,5%/0,25 hoặc 18% mỗi năm. Nói cách
khác, 18% số bò trong đàn sẽ mắc bệnh viêm vú trong một năm, nhưng chỉ 4,5% bò được phát
hiện bệnh (tỷ lệ bệnh) ở bất kỳ thời điểm. Sự chính xác của cách ước tính này cho tỷ lệ mới mắc
bệnh tùy thuộc phần lớn vào độ chính xác trong ước tính thời gian bệnh.
Bảng 4.3: So sánh sự khác nhau giữa các chỉ số đo lường xuất hiện bệnh
Tỷ lệ bệnh (P) Tỷ lệ mắc bệnh
tích lũy (CI)
Tốc độ mắc bệnh (IR)
Tử số Tất cả những cá thể
cho kết quả dương
tính trong khảo sát
Những con bệnh
trong suốt thời gian
khảo sát của quần
thể có nguy cơ
Những ca bệnh xuất hiện
trong suốt thời gian khảo
sát của quần thể có nguy
cơ
Mẫu số Tất cả những cá thể
trong quần thể khảo
sát bao gồm bệnh lẫn
không bệnh
Tất cả những thú
nhạy cảm khi bắt
đầu thời điểm khảo
sát
Tổng số thời gian mà cá
thể có thể mắc bệnh (có
nguy cơ)
Thời gian Một thời điểm hay
một khoảng thời gian
Khoảng thời gian
Thời gian mà mỗi cá thể
được quan sát từ đầu cho
đến khi mắc bệnh
Đánh giá Xác suất để lấy được
con thú có bệnh ở
một thời điểm
Nguy cơ diễn tiến
bệnh trong một
khoảng thời gian
nhất định
Tốc độ diễn tiến ca bệnh
trong khoảng thời gian
nhất định
Ứng dụng
Đánh giá thực trạng,
định hướng phòng
bệnh
Nghiên cứu các yếu
tố nguy cơ
Nghiên cứu các yếu tố
nguy cơ
13
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
Hình 4.4: Mối quan hệ giữa tỷ lệ bệnh và tỷ lệ mắc bệnh
Ví dụ: Một khảo sát về tình hình bệnh viêm phổi truyền nhiễm trên heo ở giai đoạn 60 - 120
ngày tuổi. Giả sử quần thể gồm 10 con khỏe mạnh khi đưa vào khảo sát và tình hình bệnh được
ghi nhận theo bảng 6.3 (màu tối thể hiện thời gian bệnh của thú).
Bảng 4.3: Ví dụ về khảo sát diễn biến bệnh viêm phổi
Tuần 1 Tuần 2 Tuần 3 Tuần 4 Tuần 5 Tuần 6 Tuần 7 Tuần 8
Con A
Con B
Con C
Con D
Con E
Con F
Con G Bị chết !!!!!!!!!!!!!!!!!!!!!!!
Con H
Con I
Con J
Với kết quả khảo sát trên, các giá trị đo lường sự xuất hiện bệnh được tính như sau:
- Tỷ lệ nhiễm ở tuần thứ 3 sẽ là P = 2/10 = 20%; trong khi đó tỷ lệ nhiễm ở tuần thứ 7 sẽ
là 2/9 = 22,22%.
- Tỷ lệ nhiễm trong thời gian khảo sát (từ tuần 6 - tuần 8) sẽ là P = 2/9 = 22,22%
- Tỷ lệ mắc bệnh tích lũy từ tuần 2 đến tuần 3 sẽ là CI = 1/8 = 0,125
- Tỷ lệ mắc bệnh tích lũy của toàn giai đoạn 8 tuần sẽ là CI = 5/10 = 0,5
- Tốc độ mắc bệnh trong 8 tuần khảo sát sẽ là IR = 6/(6+8+7+8+5+8+5+6+8+7) = 0,0882
(ca bệnh/tuần heo có nguy cơ).
14
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
3. Các dạng tỷ lệ chết
Việc đo lường sự xuất hiện bệnh cũng có thể được dùng để đánh giá tử số trong quần thể
vì chết cũng là một “sự kiện” liên quan về sức khỏe gia súc. Tuy nhiên về mặt sức khỏe cộng
đồng, ngoài các thông số dịch tễ trên người ta còn đưa ra nhiều khái niệm khác có liên quan đến
tử số mà chúng ta đôi khi vẫn sử dụng trong thú y. Các khái niệm đó bao gồm:
Tỷ lệ chết thô (Crude mortality) là tỷ lệ chết nói chung (bất cứ vì lí do nào đó) của một
quần thể. Trong lĩnh vực sức khỏe cộng đồng, người ta dùng chỉ số này để đánh giá về tình hình
chung của quần thể chẳng hạn như vấn đề về an ninh, dịch vụ y tế công cộng... còn trong thú y
thì có thể được dùng để đánh giá về trình độ chăn nuôi, mức độ quan tâm của người dân về thú
y...
Tỷ lệ chết do bệnh X (case-fatality for disease X) là tỷ lệ dùng để đánh giá mức độ của
bệnh X, đây là bệnh thuộc dạng cấp tính hay không, tỷ lệ chết khi mắc bệnh này là bao nhiêu.
Tỷ lệ chết chuyên biệt của bệnh X (cause - specific mortality for disease X) là tỷ lệ chết
do bệnh X trong quần thể. Điều này có nghĩa là trong quần thể có bao nhiêu con chết vì bệnh
này.
Tử suất tương ứng của bệnh X (proportionate mortality for disease X) là tỷ lệ giữa con
thú chết vì bệnh X so với số lượng chết chung. Đây là chỉ số cho thấy tầm quan trọng của bệnh
X trong quần thể. Cách tính các tỷ lệ trên được cụ thể theo hình dưới đây.
Hình 4.5: Sơ đồ thể hiện mối liên quan giữa các dạng tỷ lệ chết
4. Tỷ lệ thô và tỷ lệ hiệu chỉnh
Các thông số và tỷ lệ vừa tính trên thường được gọi là tỷ lệ thô vì chúng ta xem như tất
cả cá thể trong quần thể là như nhau. Tuy nhiên tỷ lệ thô thường chứa đựng trong nó hai bản
* Tỷ lệ chết thô = D/A
* Tỷ lệ chết trong bệnh X = C/B
* Tỷ lệ chết chuyên biệt của
bệnh X = C/A
* Tử suất tương ứng của bệnh X
= C/D
A B
C D
A: Cả quần thể khảo sát
B: Số ca bệnh khảo sát
C: Số lượng chết vì bệnh
khảo sát
D: Số lượng chết vì bất cứ
lý do nào
15
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
chất: bản chất về bệnh học và bản chất về nhóm cá thể. Bản chất về bệnh học có nghĩa là bệnh
lây lan nhiều hay ít trong quần thể, bệnh nặng hay nhẹ, kéo dài hay không; còn bản chất nhóm
cá thể có nghĩa là trong quần thể luôn luôn không đồng nhất, chúng chia thành những nhóm
khác nhau ví dụ như nhóm giống, tuổi, giới tính... Mỗi nhóm này đáp ứng với bệnh khác nhau.
Chính vì vậy mà tỷ lệ thô sẽ bị ảnh hưởng bởi hai tính chất này.
Khi khảo sát dịch tễ trong quần thể chúng ta phải so sánh những thông số có được với
một mức chuẩn nào đó hoặc so sánh các quần thể với nhau. Như vậy, nếu các nhóm cá thể trong
từng quần thể khác nhau sẽ làm cho giá trị thô không thích hợp để so sánh.
Để hiệu chỉnh, người ta dùng phương pháp trực tiếp bằng cách dùng tổng số thú trong
quần thể chuẩn. Ví dụ sau đây sẽ giúp hiểu được cách hiệu chỉnh trực tiếp.
Ví dụ: Người ta nhận thấy tỷ lệ chết của bê khá cao ở giai đoạn 0-60 ngày tuổi. Một khảo sát về
tỷ lệ chết trong giai đoạn này (CI) ở 2 trại (quần thể) A và B. Kết quả ghi nhận như sau:
Bảng 4.4: Tỷ lệ chết thô và tỷ lệ chết theo các nhóm tuổi bê của hai trại A và B
Các nhóm tuổi Trại A (không dùng kháng sinh) Trại B (dùng kháng sinh)
Số thú có nguy cơ Tỷ lệ chết Số thú có nguy cơ Tỷ lệ chết
0 - 14 ngày
15 - 60 ngày
105
307
10,5
4,2
118
40
7,6
2,5
Tổng cộng 412 5,8 158 6,3
Đây là quần thể động nên thành phần các nhóm tuổi ở mỗi trại có khác nhau. Nếu không
điều chỉnh chúng ta sẽ dễ dàng nhận thấy tỷ lệ chết thô của trại A thấp hơn trại B hay nói cách
khác là việc dùng kháng sinh trong trại ở giai đoạn này không làm giảm tỷ lệ chết. Kết luận này
có đúng hay không? Dễ dàng nhận thấy trại B có số bê ở giai đoạn đầu (0 - 15 ngày tuổi) khá
cao, về bản chất sinh học thì giai đoạn này là giai đoạn thú còn non, rất dễ chết. Do đó, nên điều
chỉnh sao cho nhóm tuổi sẽ phân bố đồng đều như nhau ở 2 trại. Điều chỉnh được tiến hành bằng
cách tính quần thể chuẩn (là tổng của 2 quần thể) và tử số sẽ hiệu chỉnh theo quần thể chuẩn của
mỗi trại. Căn cứ vào kết quả bảng 6.5, sau khi điều chỉnh thì tỷ lệ chết của trại A cao hơn trại B,
hay nói cách khác, dùng kháng sinh có thể làm giảm tỷ lệ chết trên bê.
5. Các vấn đề về cách lấy mẫu trong điều tra
Nếu toàn bộ thú trong một quần thể được lấy mẫu, đó là cuộc điều tra tổng thể. Điều tra
tổng thể là phương cách duy nhất để đo lường chính xác sự phân bố của một biến số nào đó. Vài
cuộc điều tra về tỷ lệ bệnh đã được tiến hành gần giống điều tra tổng thể. Chẳng hạn cuộc điều
tra về tỷ lệ bệnh viêm vú do Mycoplasma ở bò sữa của 2.400 trại trong tổng số 2.800 trại tại
bang California của Hoa Kỳ (1979). Điều tra tổng thể có thể tốn kém và đôi lúc không thể thực
hiện được. Tuy nhiên, nếu cuộc điều tra bằng phương cách lấy mẫu được tổ chức và tiến hành
tốt, một biến số nào đó có thể được ước tính đáng tin cậy từ mẫu của quần thể được nghiên cứu.
Bảng 4.4: Tỷ lệ chết thô và tỷ lệ chết hiệu chỉnh trên bê của hai trại A và B
Quần Trại A Trại B
16
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
Các nhóm
tuổi
thể
chuẩn
(không dùng kháng sinh) (dùng kháng sinh)
n CI
(%)
Tử số hiệu
chỉnh
n CI
(%)
Tử số hiệu
chỉnh
0 - 14 ngày
15 - 60 ngày
223
347
105
307
10,5
4,2
23,4
14,6
118
40
7,6
2,5
16,9
8,7
Tổng cộng 570 412 5,8 38 158 6,3 25,6
Tỷ lệ chết
hiệu chỉnh 38/570 = 6,7(%) 25,6/570 = 4,5(%)
5.1. Đơn vị mẫu
Mẫu nghiên cứu gồm các đơn vị khảo sát (unit). Đơn vị khảo sát là những đơn vị độc lập
nhỏ nhất và không thể được phân chia nhỏ hơn nữa. Trong nghiên cứu thú y, đơn vị khảo sát
thường là cá thể thú. Khi các đơn vị khảo sát được phân nhóm dựa vào một đặc tính chung thì
nhóm đó gọi là lớp (stratum). Như thế, một trại bò sữa là có thể một lớp bao gồm các bò sữa.
Trước khi mẫu được lấy, các thành viên của quần thể nghiên cứu phải được nhận diện
bằng cách liệt kê một bảng bố trí lấy mẫu. Bảng bố trí lấy mẫu này bao gồm các đơn vị mẫu.
Bảng bố trí lấy mẫu trong thú y thường là danh sách của các lò mổ, trại hay bệnh xá. Bảng bố trí
lấy mẫu có thể làm lệch lạc kết quả nếu:
- Danh sách của các thành viên trong bảng không được liệt kê đầy đủ.
- Thông tin đã lỗi thời.
- Vài phần của bảng không thể truy tìm được.
- Thiếu sự hợp tác giữa vài thành viên trong bảng.
- Tiến trình lấy mẫu không ngẫu nhiên.
Các nguồn gây lệch lạc này được gọi là sai sót không bù trừ vì chúng không thể được
làm giảm bằng phương cách tăng dung lượng mẫu.
5.2. Đặc tính của đơn vị mẫu
Đơn vị mẫu có thể là cá thể thú (đơn vị khảo sát) hoặc là một tập hợp như đàn, trại hay
vùng hành chánh. Tỷ lệ bệnh sẽ được tính cho cá thể (tỷ lệ cá thể nhiễm bệnh) hoặc cho đàn (tỷ
lệ đàn nhiễm bệnh).
Điều quan trọng là phân biệt đơn vị dịch tễ và đơn vị mẫu khi phân tích những bệnh
truyền nhiễm như bệnh dịch tả. Đơn vị dịch tễ là nhóm thú có tầm quan trọng về phương diện
dịch tễ (truyền bệnh và duy trì tình trạng nhiễm trùng) và do đó là nhóm có tầm quan trọng về
kiểm soát bệnh. Nếu hai loại đơn vị này đồng nhất thì dễ dàng hơn. Như thế, trong một trại,
nhiều đàn lớn có thể được quản lý theo các cách khác nhau và mỗi đàn bao gồm các đơn vị dịch
tễ khác nhau. Những đơn vị dịch tễ này cũng là đơn vị mẫu. Ngược lại, ở các nước đang phát
triển, nhiều đàn của một số làng nhỏ có thể được chăn thả trên các cánh đồng chung và tất cả các
đàn được xem là một đơn vị dịch tễ. Khi ấy làng được xem là đơn vị mẫu.
17
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
5.3. Phân loại cách lấy mẫu
Có hai loại lấy mẫu:
- Lấy mẫu không theo xác suất: cách chọn mẫu tùy thuộc nhà nghiên cứu.
- Lấy mẫu theo xác suất: mẫu được lấy theo một tiến trình cẩn thận và không thiên lệch,
nhờ thế mỗi đơn vị mẫu trong một nhóm có cùng xác suất được chọn. Đây là cơ sở của lấy mẫu
ngẫu nhiên. Lấy mẫu ngẫu nhiên thường được thực hiện bằng bảng số ngẫu nhiên (tham khảo ở
môn Thống kê).
(1) Phương pháp lấy mẫu không theo xác suất
Lấy mẫu tiện lợi
Lấy mẫu tiện lợi là phương cách lấy các mẫu dễ lấy nhất. Phương cách này sẽ đưa đến
kết quả sai lệch. Thí dụ, mẫu được lấy từ 10 bò đầu tiên trong số 100 bò đang đi vào hành lang
vắt sữa.
Dù có nhược điểm, phương cách này có thể được chấp nhận nếu mẫu được dùng để cung
cấp thông tin kịp thời và rẻ tiền. Tuy nhiên, thông tin từ mẫu này không thể được dùng để ước
tính cho quần thể.
Chọn lựa có mục đích
Chọn lựa có mục đích là cách chọn mẫu sao cho trung bình của vài biến số lượng (trọng
lượng, chiều cao....) hoặc phân bố của vài biến chất lượng (giới tính, giống...) của mẫu gần
giống như của quần thể nghiên cứu. Mẫu lấy từ cách chọn lựa có mục đích sẽ có trị số không
khác biệt nhiều so với trị số trung bình của quần thể. Chẳng hạn, một thú y viên thực hiện thử
lao tố trên vài đàn bò và phòng xét nghiệm đề nghị anh ta lấy mẫu máu của một số bò sao cho
hiệu giá kháng thể của những bò đó gần bằng trung bình của quần thể đang nghiên cứu. Mẫu
này vẫn không thể đại diện cho quần thể.
(2) Phương pháp lấy mẫu theo xác suất
Lấy mẫu ngẫu nhiên đơn giản
Mẫu được lấy ngẫu nhiên đơn giản (simple random sampling) bằng cách viết danh sách
của tất cả thú hoặc tất cả các đơn vị mẫu thích hợp (đàn) trong quần thể nghiên cứu. Sau đó đơn
vị mẫu được chọn ngẫu nhiên từ danh sách.
Lấy mẫu theo hệ thống
Lấy mẫu theo hệ thống (systematic sampling) bao gồm việc chọn lựa đơn vị mẫu ở các
khoảng cách bằng nhau, thú đầu tiên sẽ được chọn ngẫu nhiên. Thí dụ, nếu cứ 100 bò thì chọn 1
con, như thế con bò đầu tiên sẽ được chọn từ 100 con đầu tiên. Nếu con đó là con 63 thì mẫu sẽ
gồm các con 63, 163, 263, 263... Lấy mẫu theo hệ thống thường được áp dụng trong kiểm soát
chất lượng công nghệ, chẳng hạn lấy mẫu hàng hóa từ băng tải vận chuyển.
Phương pháp lấy mẫu hệ thống không đòi hỏi hiểu biết về tổng đàn của quần thể nghiên
cứu trong khi lấy mẫu ngẫu nhiên đơn giản chỉ thực hiện khi tất cả các cá thể của quần thể được
18
Giáo trình môn Dịch tễ học – TS. Lê Thanh Hiền – ĐH Nông Lâm TpHCM
Lưu hành nội bộ
nhận diện. Tuy nhiên lấy mẫu theo hệ thống sẽ có sai lệch khi quần thể biến động định kỳ.
Chẳng hạn, nếu nhà chăn nuôi chở heo đến lò mổ vào ngày thứ ba mà mẫu được lấy từ lò mổ lại
vào ngày thứ tư, như thế đàn thú của nhà chăn nuôi đó sẽ không có trong số mẫu được lấy ở lò
mổ.
Lấy mẫu theo lớp
Lấy mẫu ngẫu nhiên theo lớp (stratified sampling) được thực hiện bằng cách chia quần
thể nghiên cứu thành những nhóm (lớp) riêng biệt và rồi đơn vị mẫu được lấy ngẫu nhiên từ tất
cả các lớp. Phương pháp này chính xác hơn phương pháp lấy mẫu ngẫu nhiên đơn giản. Chẳng
hạn, nếu chia quần thể thành các lớp theo tổng đàn thì đàn có số thú ít vẫn được lấy mẫu.
Số đơn vị mẫu của mỗi lớp có thể được xác định bởi nhiều phương pháp. Phương pháp
thông thường nhất là lấy theo tỷ lệ; số đơn vị mẫu tỷ lệ với số thú trong mỗi lớp. Chẳng hạn, các
vùng trong một quốc gia là lớp và số đơn vị mẫu của mỗi vùng chiếm 5% của tổng đàn trong
mỗi vùng.
Lấy mẫu theo cụm
Thỉnh thoảng, lớp được xác định theo vị trí địa lý (chẳng hạn quốc gia, quận, làng), hoặc
theo các hạng mục khác như bệnh xá và khoảng thời gian mà trong đó mẫu được lấy. Khi ấy lớp
được gọi là cụm (cluster). Nếu lấy mẫu từ tất cả thú của các cụm thì chi phí cao và tốn thời gian.
Do đó có thể chọn vài cụm và chọn đơn vị mẫu từ những cụm đã được chọn này. Đó là chọn
mẫu theo cụm (Cluster sampling). Thông thường tất cả thú trong mỗi cụm sẽ được lấy mẫu (lấy
mẫu theo cụm đơn kỳ, one-stage cluster sampling).
Mẫu có thể được chọn qua nhiều kỳ. Chẳng hạn chọn vài cụm và sau đó chỉ lấy mẫu từ
vài thú trong cụm. Phương cách này được gọi là lấy mẫu theo cụm nhị kỳ (Two-stage cluster
sampling). Khi ấy cụm được gọi là đơn vị thứ nhất và thành viên trong mẫu phụ của cụm được
gọi là đơn vị thứ nhì. Mẫu có thể được lấy theo phương cách đa kỳ, khi ấy có nhiều mẫu phụ
trong cụm.
Phương cách lấy mẫu theo cụm thường được áp dụng khi không có bảng danh sách đầy
đủ về các thành viên trong quần thể nghiên cứu. Khi ấy chỉ cần danh sách của đơn vị thứ nhất và
chỉ cần liệt kê đơn vị thứ nhì của cụm được chọn. Tuy nhiên, kết quả có thể không chính xác
bằng phương pháp lấy mẫu ngẫu nhiên hoặc phương pháp lấy mẫu theo hệ thống vì tỷ lệ bệnh
có khuynh hướng khác nhau giữa các cụm.