C2- Cac Dai Luong Thong Ke

14
1 Chương 2 CÁC ĐẠI LƯỢNG THỐNG KÊ (Descriptive statistics) Đối với các phép phân tích lặp lại từ mẫu ban đầu, có hai loại đại lượng dùng để chỉ sự phân bố các gía trị trong tập số liệu là giá trị trung bình và độ phân tán của các giá trị dưới dạng độ lệch chuẩn. Các đại lượng thống kê thường sử dụng như giá trị trung bình, trung vị, phương sai, độ lệch chuẩn, độ lệch chuẩn tương đối, hệ số biến thiên… Sau đây chúng ta lần lượt xét các khái niệm này 2.1. Các đại lượngchỉ sự phân bố của các giá trị đo lặp lại * Trung bình số học ( x ) (mean, arithmetic mean, average) là đại lượng dùng để chỉ giá trị đạt được khi chia tổng các kết quả thí nghiệm lặp lại cho số thí nghiệm lặp lại. Giả sử có tập số liệu thí nghiệm lặp lại gồm n giá trị, ký hiệu từ x1, x2,, xn thì giá trị trung bình số học của tập số liệu gồm n thí nghiệm lặp lại là: x = n x x x n ... 2 1 = n x N i i 1 (2.1) Giá trị trung bình có tính chất sau: - Tổng độ lệch giữa các giá trị riêng rẽ và giá trị trung bình bằng không. 0 ) ( x x i - Tổng các bình phương độ lệch nhỏ hơn tổng bình phương của bất cứ độ lệch nào giữa giá trị đơn lẻ và giá trị a nào đó không phải giá trị trung bình. 2 ) ( x x i < 2 ) ( a x i ( với a x ) * Trung bình bình phương ( x bp): với tập số liệu gồm N số liệu lặp lại x1, x2,,xn ta có: x bp = n x x x n 2 2 2 2 1 ... (2.2) * Trung bình hình học hay trung bình nhân (geometric average) với các phép đo có hàm lượng cần tìm dưới dạng logarit thì: lg x hh= ) lg ... lg (lg 1 2 1 n x x x n Do đó x hh= n n x x x .... . 2 1 ( 2.3) Trong các đại lượng trung bình kể trên, thường sử dụng trung bình số học * Trung vị (median) : Nếu sắp xếp n giá trị lặp lại trong tập số liệu theo thứ tự tăng dần hoặc giảm dần từ x1, x2, , xn thì số nằm ở giữa tập số liệu được gọi là trung vị. - Nếu n là số lẻ thì trung vị chính là số ở giữa dãy số. - Nếu n là số chẵn thì trung vị là trung bình cộng của 2 giá trị nằm ở giữa dãy số.

description

các đại lượng thống kê trong hóa phân tích

Transcript of C2- Cac Dai Luong Thong Ke

Page 1: C2- Cac Dai Luong Thong Ke

1

Chương 2 CÁC ĐẠI LƯỢNG THỐNG KÊ

(Descriptive statistics)

Đối với các phép phân tích lặp lại từ mẫu ban đầu, có hai loại đại lượng dùng để chỉ sự phân bố các gía trị trong tập số liệu là giá trị trung bình và độ phân tán của các giá trị dưới dạng độ lệch chuẩn. Các đại lượng thống kê thường sử dụng như giá trị trung bình, trung vị, phương sai, độ lệch chuẩn, độ lệch chuẩn tương đối, hệ số biến thiên… Sau đây chúng ta lần lượt xét các khái niệm này

2.1. Các đại lượngchỉ sự phân bố của các giá trị đo lặp lại

* Trung bình số học ( x ) (mean, arithmetic mean, average) là đại lượng dùng để chỉ giá trị đạt được khi chia tổng các kết quả thí nghiệm lặp lại cho số thí nghiệm lặp lại.

Giả sử có tập số liệu thí nghiệm lặp lại gồm n giá trị, ký hiệu từ x1, x2,…, xn thì giá trị trung bình số học của tập số liệu gồm n thí nghiệm lặp lại là:

x = n

xxx n ...21 = n

xN

ii

1 (2.1)

Giá trị trung bình có tính chất sau:

- Tổng độ lệch giữa các giá trị riêng rẽ và giá trị trung bình bằng không.

0)( xxi

- Tổng các bình phương độ lệch nhỏ hơn tổng bình phương của bất cứ độ lệch nào giữa giá trị đơn lẻ và giá trị a nào đó không phải giá trị trung bình.

2)( xxi < 2)( axi ( với a x )

* Trung bình bình phương ( x bp): với tập số liệu gồm N số liệu lặp lại x1, x2,…,xn ta có:

x bp = n

xxx n22

221 ...

(2.2)

* Trung bình hình học hay trung bình nhân (geometric average) với các phép đo có hàm lượng cần tìm dưới dạng logarit thì:

lg x hh= )lg...lg(lg1

21 nxxxn

Do đó x hh= nnxxx ..... 21 ( 2.3)

Trong các đại lượng trung bình kể trên, thường sử dụng trung bình số học

* Trung vị (median) : Nếu sắp xếp n giá trị lặp lại trong tập số liệu theo thứ tự tăng dần hoặc giảm dần từ x1, x2, …, xn thì số nằm ở giữa tập số liệu được gọi là trung vị.

- Nếu n là số lẻ thì trung vị chính là số ở giữa dãy số.

- Nếu n là số chẵn thì trung vị là trung bình cộng của 2 giá trị nằm ở giữa dãy số.

Page 2: C2- Cac Dai Luong Thong Ke

2

Chú ý: Giá trị trung bình hay trung vị của tập số liệu được gọi là các giá trị trung tâm của tập số liệu. Các tập số liệu khác nhau có cùng giá trị trung bình có thể rất khác nhau về gía trị riêng lẻ và số thí nghiệm. Vì vậy, trung bình và trung vị không cho ta cái nhìn tổng quát về sự phân bố các số trong tập số liệu. Trong trường hợp đó cần xét đến độ phân tán (độ lệch khỏi gía trị trung bình).

* Điểm tứ phân vị (quartile): Nếu sắp xếp các số liệu trong tập số liệu từ nhỏ đến lớn thì mỗi tập số liệu có 3 điểm tứ phân vị: 25 % các số trong tập số liệu đã sắp xếp có giá trị nhỏ hơn hoặc bằng điểm tứ phân vị thứ nhất, 75 % các số trong tập số liệu đã sắp xếp có giá trị nhỏ hơn hoặc bằng điểm tứ phân vị thứ ba, 50% các số trong tập số liệu đã sắp xếp có giá trị nhỏ hơn hoặc bằng trung vị (điểm tứ phân vị thứ hai). Khoảng giữa điểm tứ phân vị (interquartile) biểu thị sự khác nhau giữa điểm tứ phân vị thứ nhất và thứ ba.

Có thể hình dung điểm tứ phân vị theo sơ đồ sau:

Trung vị

giá trị 0% 25% 50% 75% 100% giá trị cao

thấp điểm tứ phân vị thứ nhất điểm tứ phân vị thứ ba.

* Số trôi (mode): là số có tần số xuất hiện là lớn nhất trong tập số liệu lặp lại.

Chú ý: Giá trị bất thường có ảnh hưởng đáng kể tới giá trị trung bình nhưng không ảnh hưởng đến số trung vị. Do vậy, với những tập số liệu rất nhỏ, (thường N<10) như chỉ phân tích lặp 2 hoặc 3 lần thì nên sử dụng giá trị trung vị thay cho giá trị trung bình vì sẽ tránh được giá trị bất thường.

Thí dụ 2.1. Kết quả phân tích lặp lại hàm lượng Selen (g/g) trong thực phẩm sau 9 lần thí nghiệm như sau: 0,07; 0,07; 0,08; 0,07; 0,07; 0,08; 0,08; 0,09; 0,08. Tìm các giá trị trung bình, trung vị, số trội và điểm tứ phân vị thứ nhất và thứ ba.

Giải: áp dụng công thức tính được giá trị trung bình là 0,07677= 0,077 g/l

Sắp xếp theo thứ tự từ thấp đến cao thì số chính giữa là số thứ 5 và là 0,08g/l

Số có tần số xuất hiện lớn nhất là 0,07g/l ( 4 lần) và 0,08g/l (4 lần).

Điểm tứ phân vị thứ nhất là 0,07g/l (sau 2 số), điểm tứ phân vị thứ ba là 0,08g/l (số thứ 6)

- Mẫu thống kê và mẫu tổng thể (statistical sample and population).

Trong thống kê, một số xác định các quan sát thực nghiệm (hay kết quả của phép đo các mẫu phân tích riêng rẽ từ mẫu ban đầu) được gọi là mẫu thống kê. Gộp tất cả những mẫu thống kê đó gọi là mẫu tổng thể. Như vậy có thể xem phân tích mẫu tổng thể là thực hiện tất cả những phép đo có thể có và vô cùng lớn (n).

Thí dụ: Cần điều tra mức độ thiếu iot trong học sinh tiểu học thành phố A. Tiến hành lấy mẫu nước tiểu ở học sinh một số trường tiểu học trong thành phố để phân tích hàm lượng iôt. Như vậy nước tiểu của một số học sinh tiểu học ở mỗi trường được lấy mẫu là các mẫu thống kê. Mẫu tổng thể ở đây sẽ là mẫu nước tiểu của học sinh tiểu học thành phố A nói chung.

- Trung bình mẫu x và trung bình tập hợp .

Page 3: C2- Cac Dai Luong Thong Ke

3

+ Trung bình mẫu ( sampling fluctuation) ( x ) là giá trị trung bình của một mẫu thống kê giới hạn được rút ra từ tập hợp gồm n số liệu lặp lại và được xác định theo

công thức: n

x

x

n

ii

1 .

+ Trung bình tập hợp (population average) () là giá trị trung bình của tập hợp gồm N số liệu lặp lại trong mẫu tổng thể, cũng được xác định theo phương trình (2.1) nhưng với N rất lớn, gần đạt tới ∞. Khi không có sai số hệ thống thì trung bình tập hợp cũng là giá trị thật của phép đo.

N

xN

ii

1 khi N ∞. Thông thường khi N > 30 có thể xem như x

2.2. Các đại lượng đặc trưng cho độ phân tán của tập số liệu đo lặp lại

* Khoảng biến thiên hay quy mô biến thiên R (spread, range): là hiệu số giữa giá trị lớn nhất và giá trị nhỏ nhất trong một tập số liệu.

R = xmax - xmin (2.4)

Độ lớn của R phụ thuộc vào kích thước mẫu. Với cùng sai số ngẫu nhiên, khi số phép đo tăng, R sẽ tăng. Do đó, khoảng biến thiên được dùng để đặc trưng cho độ phân tán của tập số liệu khi số phép đo nhỏ.

* Phương sai (variance) ( 2 và S2): là giá trị trung bình của tổng bình phương sự sai khác giữa các giá trị riêng rẽ trong tập số liệu so với giá trị trung bình. Phương sai không cùng thứ nguyên với các đại lượng đo.

Nếu tập số liệu lớn (N ∞) thì phương sai mẫu tổng thể được ký hiệu là 2 và được

tính theo công thức

N

xxN

ii

1

2

2

Nếu tập số liệu nhỏ thì phương sai mẫu thống kê được ký hiệu là S2 và được tính theo

công thức

11

2

2

n

xx

S

n

ii

=

n

i

n

ii

in

x

xn 1

2

12

1

1 (2.5)

với n-1=f được gọi là số bậc tự do ( degree of freedom).

Khi có m tập số liệu của m mẫu thống kê, mỗi tập số liệu có chứa k kết quả của k thí nghiệm lặp lại đối với cùng một mẫu như sau:

x11, x12, x13,…, x1k

x21, x22, x23,…, x2k ………… xj1, xj2, xj3,…, xjk xm1, xm2, xm3,…., xmk

Page 4: C2- Cac Dai Luong Thong Ke

4

thì phương sai chung của m mẫu thống kê này là:

mN

xx

S

m

j

k

iiij

1 1

2

2

(2.5)

với N là tổng tất cả các thí nghiệm N=m.k

(Khái niệm này ít dùng trong hoá học)

Nếu phương sai càng lớn thì độ tản mạn của các giá trị đo lặp lại càng lớn hay độ lặp lại của phép đo kém.

* Độ lệch chuẩn (Standard deviation)

- Độ lệch chuẩn tập hợp (Population standard deviation): () đặc trưng cho độ phân tán các số liệu trong tập hợp các giá trị đo của mẫu tổng thể so với giá trị trung bình và được xác định theo phương trình:

N

xxN

ii

1

2

hay 2 (2.6)

với N là số thí nghiệm lặp lại của tập hợp, thực tế trong Hóa phân tích thường xem các tập các số liệu lặp lại khi N>30 là tập hợp.

- Độ lệch chuẩn mẫu ước đoán (Sample estimate standard deviation): (S)

11

2

n

xx

S

n

ii

hay 2SS (2.7)

với n là số thí nghiệm trong một mẫu thống kê được rút ra từ mẫu tổng thể. Số bậc tự do trong trường hợp này là f =n-1.

Như vậy, khi N ∞ thì x và S . Nói cách khác khi N>30 có thể xem S .

So với phương sai, độ lệch chuẩn thường được dùng để đo độ lặp lại hơn do có cùng thứ nguyên với đại lượng đo.

Nếu trường hợp có m mẫu thống kê, mỗi mẫu làm k thí nghiệm lặp lại thì:

mkm

xx

S

m k

ij

.1 1

2

bậc tự do f=m(k-1) (giả thiết Sj khác nhau không đáng

kể).

* Khái niệm bậc tự do: Bậc tự do có thể coi là số phép đo kiểm tra cần thiết để có thể xác định được kết quả trong một tập số liệu. Một cách khác, bậc tự do được hiểu là số các quan sát trong một mẫu thống kê có thể tự do thay đổi do đó bằng tổng số các giá trị trong tập số liệu trừ đi 1 bậc tự do cho mỗi giá trị trung bình được tính.

Như vậy với 1 tập số liệu mẫu thống kê (có 1 giá trị trung bình) thì bậc tự do là f= n-1. Với hai mẫu thống kê khi tính phương sai chung thì bậc tự do là f= n1+n2-

Page 5: C2- Cac Dai Luong Thong Ke

5

2 vì có hai gía trị trung bình được tính. Với mẫu tổng thể, khi số thí nghiệm vô cùng lớn thì giá trị trung bình chính là giá trị thực nên không xét bậc tự do.

Một cách khác, có thể hiểu bậc tự do xuất hiện trong biểu thức tính phương sai của mẫu thống kê. Ở biểu thức tính phương sai (2.5) giá trị phương sai tức là trung bình của tổng bình phương thì chỉ có n-1 giá trị tổng bình phương được tính nên f= n-1.

Thuật ngữ bậc tự do còn được giải thích qua chỉ số độ chệch bình phương

( )xxi 2 ) độc lập dùng trong phép tính phương sai như sau:

Giả sử có ba kết quả phân tích lặp lại hàm lượng As trong nước ngầm là 18,5; 17,3 và 19,2 g/l. Do đó giá trị trung bình ước tính là 18,33 g/l.

Như vậy các giá trị độ chệch bình phương lần lượt là

d12= (18,5-18,33)2= 0,0289; d2

2= (17,3-18,33)2= 1,0609; d32= (19,2-18,33)2=

0,7569

Các giá trị độ chệch bình phương này không phải là các số độc lập vì khi thay đổi ít nhất 1 giá trị trong 3 kết quả đo thì giá trị trung bình thay đổi và kéo theo các giá trị độ chệch thay đổi, do đó không thể có 3 bậc tự do. Nói cách khác, nếu chúng ta có giá trị trung bình và hai giá trị kia thì chúng ta sẽ tính được giá trị thứ ba. Như vậy, bậc tự do trong trường hợp này là f=3-1=2.

Khi tính toán chú ý không làm tròn số liệu của độ lệch chuẩn cho đến khi kết thúc phép tính toán và giá trị cuối cùng phải được ghi dưới dạng số có nghĩa.

Đối với tập số liệu nhỏ (N<10) thì độ lệch chuẩn thường được tính bằng cách nhân khoảng biến thiên với hệ số k (k factor).

SR =R.kR

Giá trị kR tuỳ thuộc vào số thí nghiệm lặp lại n, được tính theo bảng 2.1.

Bảng 2.1: Giá trị k (theo số thí nghiệm) dùng để tính nhanh độ lệch chuẩn .

n 2 3 4 5 6 7 8 9 10

k 0,89 0,59 0,49 0,43 0,39 0,37 0,35 0,34 0,32

* Đô lệch chuẩn hợp nhất (hay độ lệch chuẩn gộp) (Pooled standard deviation)

Nếu có nhiều dãy số liệu lặp lại (hay nhiều mẫu thống kê), mỗi dãy có n số liệu được lấy ngẫu nhiên từ tập hợp các số liệu lặp lại trong mẫu tổng thể (ví dụ phương sai do mỗi kỹ thuật viên/ PTN làm thí nghiệm với cùng mẫu phân tích ban đầu), nói cách khác sự khác nhau của các phương sai trong mỗi mẫu thống kê được xem như không có nghĩa thì có thể tính độ lệch chuẩn gộp như sau:

mnnn

xxxxxx

S

n

i

n

j

n

kkji

pooled

...

....

321

1 1 1

2

33

2

22

2

11

1 2 3

Với n1 là số các số liệu lặp lại trong tập số liệu thứ nhất, n2 là số các số liệu trong tập số liệu thứ hai…, m là số các tập số liệu được hợp nhất.

Page 6: C2- Cac Dai Luong Thong Ke

6

* Độ sai chuẩn (độ lệch chuẩn của trung bình) (standard deviation of a mean/ standard error):

Nếu có nhiều dãy số liệu lặp lại (hay nhiều mẫu thống kê), mỗi dãy có n số liệu được lấy ngẫu nhiên từ tập hợp các số liệu lặp lại thì sự phân tán của trung bình tập hợp (với N thí nghiệm) được đặc trưng bằng độ sai chuẩn m thay cho độ lệch chuẩn trong tập hợp. Sự phân tán này giảm khi N tăng.

m là độ lệch chuẩn trung bình hay độ sai chuẩn và được tính như sau :

m=N

Tuy nhiên, đối với tập số liệu hữu hạn (n<30) ta chỉ thu được số ước lượng x

S thay

cho m.

1

2

12

nn

xx

n

S

n

SS

n

ii

x

Độ sai chuẩn thường được dùng để đặc trưng cho độ không đảm bảo của giá trị trung bình. Độ sai chuẩn m được dùng để đặc trưng cho sai số ngẫu nhiên của phương pháp phân tích. Tuy nhiên, để độ sai chuẩn đặc trưng cho sai số ngẫu nhiên của phương pháp phân tích cần tiến hành các phép xác định song song, không phụ thuộc nhau (như thời gian phân tích khác nhau…) để đánh giá độ tái lặp của phương pháp phân tích và dùng kết quả phân tích không làm tròn (với 1 chữ số cuối cùng là số không có nghĩa).

* Độ lệch chuẩn tương đối (Relative standard devition) (RSD%) và hệ số biến thiên (coefficient variation) (CV%).

Độ lệch chuẩn tương đối (RSD) là tỷ số giữa độ lệch chuẩn và giá trị trung bình. Nó thường được biểu thị bằng phần nghìn (nhân với 1000 ppt) hay phổ biến hơn là phần trăm độ lệch chuẩn tương đối (nhân với 100%).

RSD(%)= 100.x

S% hay RSD= 1000.

x

S (ppt)

RSD(%) còn được gọi là hệ số biến thiên (CV%). Đại lượng này được dùng để đo độ chụm của phép phân tích.

Người ta thường sử dụng độ lệch chuẩn tương đối (RSD) hơn là độ lệch chuẩn (S) do có thể đánh giá được độ lệch chuẩn chiếm bao nhiêu phần trăm giá trị trung bình và có cái nhìn rõ hơn về độ chụm của các số liệu trong tập số liệu lặp lại.

Thí dụ 2.2. (a) Một sinh viên phân tích lặp lại 4 lần để xác định hàm lượng Sn trong một mẫu quặng thiếc được các kết quả như sau: 51,3%, 55,6%, 49,9% và 52,0%. Tính giá trị trung bình, độ lệch chuẩn và độ lệch chuẩn tương đối Giải: áp dụng các công thức ta có

Giá trị trung bình: x = (51,3 + 55,6 + 49,9 + 52,0)/4=208,8/4= 52,2 (%) Độ lệch chuẩn

Page 7: C2- Cac Dai Luong Thong Ke

7

S=3

(-0,2) (-2,3) (3,4) (-0,9)

14

52,2) - (52,0 52,2) - (49,9 52,2) - (55,652,2) - (51,3 222222

22

S= 9,53

0,04 5,29 11,56 0,81

=2,43

Độ lệch chuẩn tương đối %RSD = 100.S / x =4,65 (%)

(b). Cho kết quả phân tích lặp lại 35 lần hàm lượng nitrat (g/ml) trong mẫu nước chuẩn như sau :

0,51 0,51 0,49 0,51 0,51 0,51 0,52 0,48 0,51 0,50 0,51 0,53 0,46 0,51 0,50 0,50 0,48 0,49 0,48 0,53 0,51 0,49 0,49 0,50 0,52 0,49 0,50 0,50 0,50 0,53 0,49 0,49 0,51 0,50 0,49

Hãy tính giá trị trung bình, độ lệch chuẩn, độ sai chuẩn và độ lệch chuẩn tương đối của tập số liệu trên. Giải: Với tập số liệu trên khi N>30 thì có thể xem như đây là tập hợp các số liệu khi phân tích mẫu tổng thể. Do vậy sẽ có giá trị trung bình tập hợp, độ lệch chuẩn tập hợp, độ sai chuẩn tính như sau:

N

xN

ii

1 = 4

35

1 50,0504113,035

i

ix

(g/ml)

N

xxN

ii

1

2

= 0,0154 (g/ml) m=

35

= 0,0026(g/ml)

%RSD=100./=3,06%.

* Độ lệch chuẩn lặp lại và độ lệch chuẩn tái lặp: Để phân biệt độ lệch chuẩn của các thí nghiệm song song trong cùng điều kiện và khác điều kiện, người ta đưa ra hai khái niệm độ lệch chuẩn lặp lại (Sr) và độ lệch chuẩn tái lặp (SR).

- Trong một tập số liệu lặp lại (ví dụ có n thí nghiệm lặp lại) do cùng một kỹ thuật viên trong 1 PTN tiến hành trên cùng trang thiết bị, hóa chất.. trong khoảng thời gian ngắn thì độ lệch chuẩn lặp lại là:

1

)(1

2

n

xx

S

n

ii

r

- Nếu có nhiều tập số liệu lặp lại như của k kỹ thuật viên (KTV) hay có k PTN thì cần thiết tính độ lệch chuẩn tái lặp. Để tính giá trị này trước tiên cần tính phương sai trung bình đặc trưng cho tổng bình phương sự sai khác của k PTN này đó chính là trung bình của k giá trị phương sai riêng rẽ (gọi là phương sai chung trong PTN-

(within laboratories) ký hiệu là MSwithin hoặc rS 2

Ta có: phương sai trong cùng mẫu thống kê: (cùng PTN, cùng KTV…)

1

)(1

21

2

1

n

xx

S

n

ii

r …1

)(1

2

2

n

xx

S

n

ikki

k

Page 8: C2- Cac Dai Luong Thong Ke

8

Mỗi mẫu thống kê hay mỗi người thí nghiệm làm n thí nghiệm lặp lại, do đó có n-1 bậc tự do. Tổng số mẫu thống kê là k mẫu. Vậy bậc tự do đại diện cho tất các các mẫu là f0 =k(n-1).

Do vậy, phương sai trong cùng mẫu (within-sample estimation of variance/ within-sample mean square) sẽ là:

rS 2 = )1(

)(1 1

2

1

2

nk

xx

k

S

MS

k

j

n

i

jij

k

ji

within

Khi lấy k giá trị trung bình của k KTV hay k PTN thì các giá trị trung bình này sẽ khác với giá trị trung bình chung hay còn gọi là trung bình tập hợp nên phương sai giữa các mẫu thống kê (hay giữa các KTV, các PTN…) ký hiệu là MSbetween hay S2

L (between-sample estimation of variance) được tính như sau:

Trung bình tập hợp là k

x

x

k

ji

1

Khi đó phương sai giữa các mẫu (hay phương sai gộp giữa các nhóm):

1

)(1

2

k

xxn

MS

k

jj

between

Khi đó phương sai tái lặp là tổng phương sai của hai thành phần phương sai giữa các nhóm và trung bình phương sai trong một nhóm. Từ giá trị này, lấy căn bậc hai của phương sai sẽ thu được độ lệch chuẩn tái lặp và độ lệch chuẩn tái lặp tương đối (%RSDR).

S2R= S2

L +

rS 2 = MSwithin + MSbetween

Và %RSDR = 100.SR/ x (%)

Thí dụ 2.3: Một PTN thuộc hệ thống công nhận các PTN Việt nam VILAS ( PTN được công nhận chất lượng của Văn phòng công nhận chất lượng thuộc Tổng Cục đo lường chất lượng) cần đánh giá độ lệch chuẩn lặp lại và độ lệch chuẩn tái lặp để tiến hành xác nhận giá trị sử dụng của phương pháp thử một loại thuốc trừ sâu trong mẫu rau. Bốn KTV khác nhau, mỗi người làm lặp 10 lần với một mẫu rau thêm chuẩn (là mẫu rau sạch, không chứa chất cần phân tích và được thêm chất chuẩn) có nồng độ 100,0 ppb trên cùng thiết bị, dụng cụ và hóa chất có sẵn trong cùng PTN.. Kết quả hàm lượng thuốc trừ sâu tìm lại được trong mẫu thêm chuẩn này như sau:

STT KTV-1 KTV-2 KTV-3 KTV-4

1 99,07 99,68 99,51 99,55

2 99,06 99,69 99,54 99,62

3 99,03 99,74 99,51 99,56

4 99,06 99,61 99,54 99,62

Page 9: C2- Cac Dai Luong Thong Ke

9

5 99,07 99,73 99,53 99,57

6 99,07 99,68 99,54 99,58

7 99,06 99,74 99,53 99,57

8 99,05 99,76 99,54 99,56

9 99,06 99,64 99,51 99,58

10 99,06 99,74 99,49 99,54 - So sánh độ chính xác trong các thí nghiệm mỗi KTV, kết luận về sai số ngẫu

nhiên hay sai số hệ thống. - Hãy tính độ lệch chuẩn lặp lại và độ lệch chuẩn tái lặp của PTN này. Giải: + Trước tiên tính 4 giá trị trung bình hàm lượng của 4 KTV, độ lệch chuẩn

lặp lại và độ lệch chuẩn tương đối của mỗi KTV, ta được các kết quả lần lượt như sau :

KTV-1 KTV-2 KTV-3 KTV-4

x 99,06 99,70 99,52 99,58

Sr 0,0120 0,0493 0,0178 0,0268

%RSD 0,012 0,049 0,018 0,027

ER(%) -0,94 -0,30 -0,48 -0,42

Như vậy, căn cứ vào các giá trị %RSD của mỗi TKV có thể kết luận, độ chụm hay độ lặp lại của KTV-1 là tốt nhất và của KTV-2 là kém nhất. Tuy nhiên, các giá trị RSD là nhỏ (<1%) nên có thể nói mỗi KTV làm thí nghiệm đều cho độ chụm tốt.

Dựa vào sai số tương đối giữa giá trị trung bình tìm được và giá trị đúng = 100,0 ppb ban đầu có thể kết luận kết quả phân tích của cả 4 KTV đều mắc sai số hệ thống âm. Độ đúng đánh giá qua sai số tương đối cho thấy kết quả phân tích của KTV-2 là nhỏ nhất và KTV-1 là lớn nhất. Tuy nhiên, cả 4 giá trị sai số tương đối đều thấp (<1%) chứng tỏ các KTV làm đúng. Nói cách khác số liệu của 4 KTV đều chính xác (độ chụm tốt, độ đúng cao). + Tính độ lệch chuẩn tái lặp của PTN. Dùng các công thức như đã nêu phần trên sẽ tính được MSwithin= 0,000902 ; MSbetween = 0,787043, phương sai tái lặp S2

R= 0,787945 Độ lệch chuẩn tái lặp là SR= 0,88766= 0,8877 với giá trị trung bình chung là

x = 99,465 ppb Độ lệch chuẩn tái lặp tương đối % RSDR= 0,89%

Cách tính toán các đại lượng thống kê sử dụng phần mềm MINITAB:

Phần mềm MINTAB là phần mềm thống kê điển hình, được sử dụng rộng rãi trong xử lý thống kê số liệu phân tích, thích hợp các bảng số liệu được copy từ word, excel hoặc chuyển các file số liệu dạng ASCII sang.

Để tìm các đại lượng đặc trưng thống kê của tập số liệu lặp lại cần nhập số liệu dưới dạng cột (mỗi tập số liệu trong một cột) và copy vào cột trong cửa sổ làm việc của MINITAB, chọn Stat Basic Statistics Display Descrative Statistics, chọn cột chứa tập số liệu và trong mục Statistics chọn các đại lượng mong muốn. Khi đó kết quả sẽ được hiển thị trong cửa sổ của Session. Thí dụ 2.4.: Tính các đại lượng thống kê đặc trưng của tập số liệu các PTN A, B, C, D, E.

Page 10: C2- Cac Dai Luong Thong Ke

10

Sau khi nhập số liệu, kết quả tính bằng phần mềm MINTAB thu được như sau: PTN Số TN Giá trị TB Độ Sai chuẩn Độ lệch chuẩn Phương sai %CV Trung vị Khoảng biến thiên A 6 41,9 0,202 0,494 0,244 1,18 42,0 1,4 B 6 41,9 0,697 1,708 2,916 4,08 42,0 4,1 C 6 43,2 0,171 0,420 0,176 0,97 43,2 1,1 D 6 39,1 1,330 3,250 10,58 8,32 38,8 8,0 E 6 41,5 0,526 1,288 1,659 3,10 41,9 3,6 Chú ý: * Các đại lượng trung bình, độ chệch và sai số tương đối biểu diễn độ đúng của tập số liệu, kiểm tra có xuất hiện sai số ngẫu nhiên hay hệ thống thì độ lệch chuẩn tương đối hay hệ số biến thiên được dùng để đánh giá độ chụm.

* Đối với các phương pháp phân tích, tùy theo nồng độ chất phân tích mà ISO qui định CV(%) của một phương pháp phân tích. Với các mẫu có nền phức tạp, giá trị CV(%) lớn nhất được phép cho ở bảng 3.3.

Bảng 2.1: Quan hệ giữa nồng độ chất phân tích và CV(%) cho phép với phương pháp phân tích.

Hàm lượng

100

g/kg

10

g/kg

1

g/kg

100

mg/kg

10

mg/kg

1

mg/kg

100

g/kg

10

g/kg

1

g/kg

0,1

g/kg

CVmax (%)

2 3 4 5 7 11 15 21 30 43

Cũng theo ISO, sai số tương đối dùng để đánh giá qua độ đúng của phương pháp phân tích lượng vết như sau :

- Nếu làm lượng chất phân tích 1 ppb thì sai số tương đối cho phép từ -50 % đến +30 %

- Nếu làm lượng chất phân tích từ 1 ppb đến 10 ppb thì sai số tương đối cho phép từ -30% đến +10%

- Nếu làm lượng chất phân tích nhỏ hơn1 ppm thì sai số tương đối cho phép từ -20% đến +10%.

2.3. Lan truyền độ không đảm bảo đo khi có sai số ngẫu nhiên

Chúng ta đều biết, kết quả định lượng thu được từ thực nghiệm trong rất nhiều phép đo không phải là kết quả của phép đo trực tiếp mà có thể được tính toán từ một hay nhiều phép đo trực tiếp. Khi không có sai số hệ thống thì tất cả các kết quả phân tích định lượng thu được từ thực nghiệm đều có chứa sai số ngẫu nhiên. Như đã đề cập các giá trị được báo cáo phải được viết dưới dạng giá trị trung bình (đúng số có nghĩa kèm theo) độ không đảm bảo đo. Khi chỉ có sai số ngẫu nhiên thì độ không đảm bảo đo có thể là độ lệch chuẩn, độ sai chuẩn, dung sai, hoặc khoảng tin cậy khi sử dụng chuẩn thống kê nào đó (sẽ xét sau). Mặt khác, mỗi số liệu thu được trong các phép tính đều được hoặc làm lặp lại nhiều lần hoặc có nhiều yếu tố sai số gây nên và có độ lệch chuẩn riêng, vì vậy phải xét đến lan truyền sai số ngãu nhiên gây ra cho kết quả cuối cùng.

Trong phần này, chúng ta sẽ xét lan truyền độ không đảm bảo đo theo độ lệch chuẩn.

Page 11: C2- Cac Dai Luong Thong Ke

11

Giả sử các kết quả thực nghiệm thu được a, b, c, ... là các số liệu thu được từ các phép đo trực tiếp M1, M2 , M3…. Gọi x là giá trị cuối cùng tính toán được từ các kết quả riêng rẽ a, b, c….Khi đó x là hàm số phụ thuộc vào các tham số a, b, c…

Gọi cba ,, … là độ lệch chuẩn của các phép đo trực tiếp khi xác định a, b, c,

và giả thiết là sai số trong các phép đo này độc lập lẫn nhau thì độ lệch chuẩn của đại lượng x là :

2/12

2

2

2

...][

b

b

xa

a

xx

(theo định luật lan truyền sai số, biểu thức

này đúng khi x là hàm tuyến tính của các phép đo a, b,c…).

Cách tính độ lệch chuẩn của đại lượng x này tuỳ thuộc vào dạng công thức tính đem sử dụng. Kết quả đo của đại lượng x sẽ được biểu diễn dưới dạng : x Sx

Ví dụ trong tập số liệu thể tích dung dịch chuẩn dùng cho quá trình chuẩn độ, các giá trị thể tích thu được là 10,09; 10,11; 10,09; 10,10; 10,12 ml, Như vậy, thể tích dung

dịch chuẩn đã dùng sẽ là Sx = 10,10 0,01 (với N=5 thí nghiệm lặp lại),

* Độ lệch chuẩn của tổng và hiệu:

Nếu x = a1. a( Sa) + b 1.b( Sb) – c1 .c( Sc) với a1,b1, c1 là các hằng số thì độ lệch chuẩn của x là

...... 22

122

122

1 cbax ScSbSaS

* Độ lệch chuẩn của phép nhân và chia:

Nếu x = 1

11 .c

ba

c

ba thì ......

2

2

1

22

1

2

2

1

c

Sc

b

Sbb

a

Sa

x

S cax

* Độ lệch chuẩn của phép tính logarit:

Nếu x= k.lna với k là hằng số thì Sx=

a

Sk a.

Nếu x= k.loga thì Sx=

a

Sk a.30,2

Các giá trị độ lệch chuẩn trong phép đo ở trên được gọi là độ không đảm bảo đo

tuyệt đối của phép đo. Đại lượng

a

Sa gọi là độ không đảm bảo đo tương đối.

Thí dụ 2.5: a) Tính giá trị biểu thức:

x=(65,06±0,07) +(16,13±0,01)-(22,68±0,02)= 58,51±?

ta có xS 073,002,001,007,0 222 và biểu diễn x = 58,51 0,07

Độ lệch chuẩn tương đối của phép đo là %1,0%100.51,58

07,0

b) x= 2,0164(0,0008)+1,233(0,002)-2,61(0,01)= ?

x= 0,6394= 0,64

Page 12: C2- Cac Dai Luong Thong Ke

12

Sx= 222 01,0002,00008,0 = 0,01023.

Viết theo đúng số có nghĩa cho x và Sx sẽ là : x= 0,640,01

( vì trong 3 số hạng thì số có ít số có nghĩa nhất sau dấu phảy là 2 số)

c) ?0,356006,0623,4

)2,04,120).(02,067,13(

x

ta có 222

623,4

006,0

4,120

2,0

67,13

02,0

x

Sx =0,0026

do vậy Sx=356,0.0,0026=0,93

Kết quả cuối cùng sẽ là x = 356,0±0,9

d) The quantum yield of fluorescence, φ, is calculated from the expression:

φ = If /kclI0ε

where the quantities involved are defined below, with an estimate of their

relative standard deviations in brackets:

I0 = incident light intensity (0.5%)

If = fluorescence intensity (2%)

ε = molar absorptivity (1%)

c = concentration (0.2%)

l = path-length (0.2%)

k is an instrument constant.

From equation (2.13), the relative standard deviation of φ is given by:

RSD = √22 + 0.22 + 0.22 + 0.52 + 12 = 2.3%

Thí dụ 2.6 : Tính độ lệch chuẩn số mmol Cl- trong 250,0 ml dung dịch mẫu, nếu lấy 25,00 ml dung dịch mẫu này chuẩn độ bằng dung dịch chuẩn AgNO3 có nồng độ ( 0,1167±0,0002) M. Thể tích dung dịch AgNO3 tiêu tốn sau 3 lần chuẩn độ lặp lại là 36,78; 36,82 và 36,75 ml.

Giải : - thể tích dung dịch chuẩn AgNO3 trung bình là: 36,78 ml

- áp dụng công thức tính độ lệch chuẩn thể tích chuẩn độ ta có S= 0,035

- Vậy 04,078,363

AgNOV (ml)

- Số mmol Cl- đã được chuẩn độ trong 250 ml mẫu :

X= (0,1167±0,0002).((36,78±0,04).10= 42,92± ?

Page 13: C2- Cac Dai Luong Thong Ke

13

Ta có : 019,010).78,36

04,0

1167,0

0002,0( 2

22

x

Sx

Do đó Sx= 42,92.0,019=0,082

Kết quả số mmol Cl- trong 250 ml mẫu là (42,92±0,08) mmol

Chú ý: Trong quá trình tính toán vì có sự lan truyền sai số nên cần tránh làm tròn số khi việc tính toán chưa kết thúc.

Số có nghĩa trong các phép tính phức tạp có ghi kèm độ không đảm bảo đo:

- Qui tắc: Số đầu tiên trong độ lệch chuẩn là số có nghĩa cuối cùng trong kết quả nhận được.

+Cho phép tính )0002,0(1066,0)00005,0(02500,0

)000003,0(002664,0

Trong phép tính trên, ở độ lệch chuẩn, số có nghĩa là số 2, khi đó giá trị 0,0002 có 4 chữ số sau dấu phảy nên kết quả được ghi với 4 số sau dấu phảy (con số này có 4 số có nghĩa).

+Với phép tính sau

)004,0(022,1)002,0(803,0

0020,0(8210,0

thì kết quả được biểu diễn tới

4 chữ số có nghĩa mặc dù số có nghĩa ít nhất trong số chia là 3 số vì kết quả tính độ lệch chuẩn cuối cùng với 1 số có nghĩa đã tạo ra số có 3 chữ số sau dấu phảy.

+Trong phép tính ?619,0)02,0(89,1

)02,0(59,0)03,0(76,10

Kết quả tính lấy đến 2 chữ số có nghĩa sau dấu phảy cho kết quả của tử số nhưng 3 số có nghĩa vì cả hai số trong phép chia tiếp theo đều có 3 chữ số có nghĩa.

Để tính Sx, sử dụng công thức lan truyền sai số từng phần như sau

Độ lệch chuẩn của tử số: 22 02,003,0 = 0,036 nên tử số viết là 1,17(0,036)

Nên Sx= 0,6190.22

6

89,1

02,0

17,1

03,0

=0,020135

Vì độ không đảm bảo đo của các số thành phần chỉ 2 chữ số sau dấu phảy nên Sx phải được viết là 0,020. Do vậy kết quả cuối cùng phải biểu diễn thành 0,62(0,02) vì trong độ không đảm bảo đo chỉ có 2 số có nghĩa sau dấu phảy.

Thí dụ 2.7: a) Dung dịch HCl đặc có nồng độ phần trăm là 37,0(0,5)%, khối lượng riêng 1,18(0,01) g/ml. Để có dung dịch chứa 0,050 mol HCl cần 4,18 ml dung dịch HCl đặc. Nếu độ lệch chuẩn tương đối của 0,050 mol HCl là 2% thì độ không đảm bảo đo của 4,18 ml HCl đặc là bao nhiêu? Biết khối lượng nguyên tử của H là 1,00794(0,00007) và Cl là 35,453(0,002)

Giải: Từ giá trị độ lệch chuẩn tương đối của số mol HCl là 2% dùng công thức đổi ra độ lệch chuẩn tuyệt đối S= 0,02.0,050= 0,001

số mol HCl trong 4,18 ml dung dịch HCl đặc là:

Page 14: C2- Cac Dai Luong Thong Ke

14

mol HCl= M

CdmlV

.100

%.).( do đó V(ml)=

%.

.100.

Cd

MmolHCl

Ta có 4,18(x)= )005,0(370,0).01,0(18,1

)]002,0(453,35)00007,0(00794,1).[001,0(050,0

=)005,0(37,0).01,0(18,1

)0002,0(4609,36).001,0(050,0

Ta có 94318 =

x= 4,18.2222

4609,36

0002,0

37,0

005,0

18,1

01,0

050,0

001,0

=4,18.0,118258=0,40,49 (ml)

b)Để xác định nồng độ dung dịch HCl sau khi pha loãng, người ta chuẩn độ lại bằng dung dịch chuẩn Na2CO3 với chỉ thị phenolphtalein. Để chuẩn độ hết 27,350,04 ml dung dịch HCl cần 0,9674 0,0009 gam Na2CO3 (khối lượng mol phân tử là 105,9880,001). Tính nồng độ mol của dung dịch HCl.

Giải: Phương trình phản ứng với chỉ thị phenolphtalein là

2H+ + Na2CO3 2Na+ + H2O + CO2

Công thức tính nồng độ mol HCl là: C= )(.

.2lVM

m

Do đó C= 56674,0)04,0(35,27).001,0(988,105

1000).0009,0(9674,0.2

SC= 0,66745. 222

35,27

04,0

988,105

001,0

9674,0

0009,0

= 0,00116136

Tuy các giá trị tính toán có ít nhất 4 chữ số có nghĩa nhưng độ không đảm bảo cuối cùng được tính bắt đầu từ số thứ ba sau dấu phảy nên kết quả cuối cùng được viết cso 3 chữ số có nghĩa là 0,667(0,001) mol/l.

BÀI TẬP CHƯƠNG 2