prob distribution nk2557 - KKU Web Hosting · 1...
Transcript of prob distribution nk2557 - KKU Web Hosting · 1...
1
การแจกแจงความนาจะเปน
(Probability Distribution)
ผศ. นคม ถนอมเสยง
ภาควชาชวสถตและประชากรศาสตร
คณะสาธารณสขศาสตร ม.ขอนแกน
Email: [email protected]
After studying this chapter,
1. understand selected discrete distributions and how to
use them to calculate probabilities in real-world problems.
2. understand selected continuous distributions and how to
use them to calculate probabilities in real-world problems.
3. be able to explain the similarities and differences between
distributions of the discrete type and the continuous type
and when the use of each is appropriate.
2
การแจกแจงความนาจะเปน
-การแสดงความนาจะเปนของคาทเปนไปไดทกคา
ของตวแปรสม
-แสดงในรป ตาราง, กราฟ, ฟงกชนทางคณตศาสตร
ตวแปรทสนใจของหนวยสงเกต เชนเพศของบคคล
เมอ หนวยสงเกตถกสม ตวแปรทสนใจเรยกวา “ตวแปรสม”
ตวแปรสม x 1=male
0=female
การแสดงความนาจะเปนเชน
สมมต มประชากร 2 คน เปนโรคฟนพ 1 คน D+
ไมผ 1 คน D-
-สมแลวใสคน 2 ครง
โอกาสทสมแตละครง ไดคนฟนพ =1/2 ฟนไมผ =1/2
เมอสม 2 ครง โอกาสพบฟนผ, ไมผ ไดแก
D+D+, D+D-, D-D+, D-D-
กฎความนาจะเปน
Pr(A and B) = Pr(A) x Pr(B)
Pr(A or B) = Pr(A) + Pr(B)
3
P(X=2) = P(D+D+) =
P(X=1) = P(D+D-)+P(D-D+) =
P(X=0) = P(D-D-) =
41
21
x21
4
2
2
1x2
1
2
1x2
1
41
21
x21
ความนาจะเปนในการเกดเหตการณ
ตวแปรสมทสนใจ คอ ฟนผ (X)
ถาใหการสมไดผปวยฟนผทงสองคน =2 (X=2)
หนงคน=1 (X=1) ศนยคน=0 (X=0)
ความนาจะเปน
กฎความนาจะเปน
Pr(A and B) = Pr(A) x Pr(B)
Pr(A or B) = Pr(A) + Pr(B)
แสดงในรปตาราง X ความนาจะเปน
0 1/4
1 2/4
2 1/4
กราฟ
ฟงกชนทางคณตศาสตร
2;4
1
1,0;4
1
xx
xx
f(x)
4
การแจกแจงความนาจะเปน
1. การแจกแจงความนาจะเปนไมตอเนอง
ไดแก การแจกแจงแบบทวนาม (binomial distribution)
การแจกแจงแบบปวซงค (Poisson distribution)
การแจกแจงแบบ Multinomial distribution
ฯลฯ
2. การแจกแจงความนาจะเปนตอเนอง
เชน การแจกแจงแบบปกต (Normal distribution)
การแจกแจงแบบท (t distribution)
การแจกแจงแบบเอฟ (F distribution)
การแจกแจงแบบไครสแควร (Chi-Square distribution)
ฯลฯ
ประเภทการแจกแจงความนาจะเปนการเกดเหตการณ
1. การแจกแจงความนาจะเปนตวแปรไมตอเนอง
เชน ปวย ไมปวย, หาย ไมหาย
2. การแจกแจงความนาจะเปนตวแปรตอเนอง
เชน อาย นาหนก ความดนโลหต sysBP
5
การแจกแจงความนาจะเปนตวแปรไมตอเนอง
คณสมบต
1. f(x) = P(X=x)
คาฟงกชนของตวแปรสม x มคาเทากบ
ความนาจะเปนท X มคาเทากบ x
2. ทกคาของ x
3. xall xall
x)P(Xf(x) 10)( xf
การแจกแจงความนาจะเปนตวแปรไมตอเนอง
-การแจกแจงแบบทวนาม
-การแจกแจงแบบปวซงค
nxppx
nxXPxf xnx ...,,2,1,0;)1()()(
...,2,1,0;!
)()(
xx
exXPxf
x
6
การแจกแจงความนาจะเปนตวแปรไมตอเนอง
1. f(x) = P(X=x) คาฟงกชนของตวแปรสม x มคาเทากบ
ความนาจะเปนท X มคาเทากบ x
ตวอยาง อบตการณของฟนผในเดกมคาเทากบ 10% บรษทยาสฟน
ตองการทดสอบยาสฟนวาไดผลในการปองกนฟนผ โดยให
ทดลองใชยาสฟนกบเดกกลมหนง 20 คนหลงจากนน 1 ป พบ
เดกฟนผ 1 คน บรษทยาสฟนจะโฆษณาวายาสฟนไดผลด
หรอไม
-การเกดฟนผ มการแจกแจงแบบทวนาม
nxppx
nxXPxf xnx ...,,2,1,0;)1()()(
-การเกดฟนผ มการแจกแจงแบบทวนาม
392.270.122.
)90)(.10(.1
2090.
)10.1()10(.1
20)10.1()10(.
0
20
)1()0()1()(
1220
12010200
xPxPXPxf
การเกดฟนผ หลงใชยาสฟน 1 ปมความนาจะเปนเทากบ .39 หรอ
39% (มากกวาการเกดฟนผ ตามปกต)
7
X f(x)=P(X=x)0 .121571 .270172 .285183 .190124 .0897795 .0319216 .0088677 .00197058 .00035589 .000052710 6.44e-0611 6.51e-0712 5.42e-0813 3.71e-0914 2.06e-1015 9.15e-1216 3.18e-1317 8.22e-1518 2.22e-1619 020 0Total 1
1. f(x) = P(X=x)
คาฟงกชนของตวแปรสม x มคาเทากบ
ความนาจะเปนท X มคาเทากบ x
2. ทกคาของ x
3. xall xall
x)P(Xf(x) 10)( xf
0.1
.2.3
Pr(
y)
0 5 10 15 20x
pi = 0.1
X f(x)=P(X=x)0 .121571 .270172 .285183 .190124 .0897795 .0319216 .0088677 .00197058 .00035589 .000052710 6.44e-0611 6.51e-0712 5.42e-0813 3.71e-0914 2.06e-1015 9.15e-1216 3.18e-1317 8.22e-1518 2.22e-1619 020 0Total 1
0.1
.2.3
Pr(
y)
0 5 10 15 20x
pi = 0.1
. di binomial(20,0,.1)
.12157665
. di binomial(20,1,.1)-binomial(20,0,.1)
.27017034
. di binomial(20,2,.1)-binomial(20,1,.1)
.28517981
. di binomial(20,3,.1)-binomial(20,2,.1)
.19011987
8
. bitesti 20 1 0.10N Observed k Expected k Assumed p Observed p
------------------------------------------------------------20 1 2 0.10000 0.05000
Pr(k >= 1) = 0.878423 (one-sided test)Pr(k <= 1) = 0.391747 (one-sided test)Pr(k <= 1 or k >= 3) = 0.714820 (two-sided test)
วเคราะหโดย STATA
- ความนาจะเปนทพบฟนผ อยางนอย 1 คน
392270122
(.10)(.90)1
20.90
.10)(1(.10)1
20.10)(1(.10)
0
20
101
1220
12010200
...
)P(x)P(x)P(Xf(x)
การแจกแจงความนาจะเปนตวแปรไมตอเนอง
การแจกแจงทวนาม (binomial)
1. การเกดเหตการณเปนอสระตอกน
2. การเกดเหตการณ ใหผลลพธ อยางใดอยางหนง
สาเรจหรอไมสาเรจ
3. ความนาจะเปนของความสาเรจมคาคงทเทากบ p
ความนาจะเปนของความไมสาเรจมคาคงทเทากบ 1- p
ฟงกชนการแจกแจงทวนาม (binomial)
เขยนฟงกชน ดวยสญลกษณ X ~ b(n,p) หรอ X ~ b(x; n, p)
,...n,,;xp)(px
nf(x) xnx 2101
9
ลกษณะการแจกแจงทวนาม (binomial)
1. มพารามเตอร 2 ตวไดแก N, 2. คาเฉลย = N3. ความแปรปรวน = N(1-)
4. สวนเบยงเบนมาตรฐาน =
5. ลกษณะการแจกแจงขนอยกบ N, เมอ n นอย ลกษณะการแจกแจงทพบ
นอย การแจกแจง เบทางบวก
= .5 การแจกแจงสมมาตร
มาก การแจกแจง เบทางลบ
เมอ N มาก ลกษณะการแจกแจงแบบสมมาตร
)1( N
0.1
.2.3
.4F
(x)
0 1 2 3 4 5x
pi = 0.3
0.1
.2.3
F(x
)
0 1 2 3 4 5x
pi = 0.5
0.1
.2.3
.4F
(x)
0 1 2 3 4 5x
pi = 0.7
0.0
5.1
.15
.2F
(x)
0 5 10 15 20x
pi = 0.3
0.0
5.1
.15
.2F
(x)
0 5 10 15 20x
pi = 0.5
0.0
5.1
.15
.2F
(x)
0 5 10 15 20x
pi = 0.7
0.0
5.1
.15
F(x
)
0 10 20 30 40 50x
pi = 0.3
0.0
5.1
F(x
)
0 10 20 30 40 50x
pi = 0.5
0.0
5.1
.15
F(x
)
0 10 20 30 40 50x
pi = 0.7
n=5 n=20 n=50
10
การแจกแจงปวซอง (Poisson Distribution)
-การแจกแจงปวซอง ตงชอตามนกคณตศาสตรชาวฝรงเศส
ชอ Simeon Denis Poisson
ถาให x เปนจานวนเหตการณทเกดขนในชวงเวลาใดเวลาหนง
ความนาจะเปนของเหตการณทเกดขนไดแก
71822210 .,...;e,,;xx!
λef(x)
nλ
= คาเฉลยของจานวนครงของเหตการณทเกดขนในชวงเวลา
เขยนสญลกษณ X ~ p( ) หรอ X ~ P(x; )
ลกษณะของการแจกแจงแบบปวซอง
1. เหตการณทเกดขนเปนอสระตอกน โดยทเหตการณท
เกดขนในชวงใดชวงหนงหรอเวลาใดเวลาหนง
จะไมมผลตอความนาจะเปนของการเกดเหตการณ
ในชวงอนๆ หรอเวลาอนๆ
2. ในชวงใดชวงหนงมจานวนเหตการณทเกดขนอยางไมจากด
3. ความนาจะเปนของการเกดเหตการณในชวงใดๆ
เปนสดสวนกบความยาวของชวงทงหมด
4. ในชวงเวลาสน ความนาจะเปนของการเกดเหตการณ
จะมคานอย
11
ลกษณะของการแจกแจงแบบปวซอง
1. มพารามเตอร 1 ตวไดแก
2. คาเฉลย = ความแปรปรวน =
3. สวนเบยงเบนมาตรฐาน =
0.1
.2.3
.4P
r(y)
0 5 10 15 20y
Lambda = 1
0.0
5.1
.15
.2.2
5P
r(y)
0 5 10 15 20y
Lambda = 3
0.0
5.1
.15
Pr(
y)
0 5 10 15 20y
Lambda = 9
ตวอยาง การเกดอบตเหตถนนมตรภาพ ชวงระหวางประตเขา
มหาวทยาลยขอนแกน กบโรงพยาบาลศรนครนทร
โดยรถจกรยานยนตในชวง 1 สปดาห พบวาเกด
อบตเหต 2 ครง
1. ใหหาคาความนาจะเปนของการไมเกดอบตเหตในชวง 1 สปดาห
วธทา
จากโจทยมคา = 2
1. ใหหาคาความนาจะเปนของการไมเกดอบตเหตในชวง 1 สปดาห
p(x) =
p(0) = = .1353
!x
e n
!0
2 20 e
.display 1-gammap(0+1,2) หรอ
.display poissonp(2,0).13533528
12
2. ใหหาคาความนาจะเปนการเกดอบตเหต 3 ครงในชวง 2 สปดาห
ชวง 2 อาทตยมการเกดอบตเหตเทากบ 2(2) = 4
ดงนนความนาจะเปนเทากบ p(x 3) = p(0) + p(1) + p(2) + p(3)
.19543!e4
p(3) .1465;2!e4
p(2)
.07331!e4
p(1) ; .01830!e4
p(0)
4342
4140
ดงนน p(x 3) = p(0) + p(1) + p(2) + p(3)
= .0183 + .0733 + .1465 + .1954
= .4335
.display 1-gammap(4,4) หรอ
.display poisson(4,3)
.43347012
การแจกแจงความนาจะเปนตวแปรตอเนอง
คณสมบต
1. ทกคาของ x
2. พนทใตโคง f(x) ทงหมดคอ
ความนาจะเปนของทกคาของ x มคาเทากบ 1
3. P(X=a) =0 เมอ a=คาคงท
ความนาจะเปนของ X ทมคาเทากบคาคงท
มคาเทากบ 0
1f(x)dx
b)XP(ab)XP(a
b)XP(ab)XP(a
0)( xf
13
F(x)
a bX
b)XP(a
พนทใตโคง f(x) ทงหมดคอความนาจะเปนของทกคาของ x
มคาเทากบ 1 ( ถง )
การแจกแจงความนาจะเปนของตวแปรตอเนอง-การแจกแจงแบบปกต (Normal Distribution)
-คดโดย Abraham De Moivre
-Karl Friedrick Gauss (1774-1855) เผยแพร
และใชอยางกวางขวาง เรยกชอ Gaussian
x
14
การแจกแจงความนาจะเปนของตวแปรตอเนองฟงกชนการแจกแจงแบบปกต
และ e เปนคาคงทมคา 3.1459 และ 2.71828
คาเฉลย
สวนเบยงเบนมาตรฐาน
เขยนสญญลกษณ X ~ n( )
2/22)(xe
2
1f(x)
σμπ
μσ
2,
คณสมบตการแจกแจงแบบปกต
-รปโคงระฆงควาดานซายและขวาของ มความเทากน
(mirror image) (สมมาตรรอบคาเฉลย )
-ปลายทงสองขางของโคงคอยๆ ลาดลงสแกน x จรดแกน x
ทอนนท
-มจดเปลยนเวาท
-คาเฉลย มธยฐาน ฐานนยม มคาเทากน เมอลากเสนจาก
ยอดโคงตงฉากกบแกน x
-พนททงหมดใตโคงเหนอแกน x หรอ
คาความนาเปนของพนทเทากบ 1
μ
x
15
x
-เมอแบงโคงโดยลากเสนตงฉากจากยอดถงแกน x
ระยะหางจากคาเฉลยทงสองขางเปนดงน
1 หนวย SD พนทใตโคงเทากบ 68.26%
2 หนวย SD พนทใตโคงเทากบ 95.45%
3 หนวย SD พนทใตโคงเทากบ 99.73%
2 2
.zdemo -1 -2 -3 0 +1 +2 +3
16
-ความแตกตางของการแจกแจงแบบปกต ขนอยกบ
คา และ
เมอคา แตกตางกน ตาแหนงบนแกน x แตกตาง
μ σ
μ
1μ
2μ x
zdemo2 50 10 60 10
zdemo2 50 10 50 5 zdemo2 50 10 50 10
17
ถาคา ตางกน ความแบนราบและความโดงแตกตางσ
1σ
2σ
3σ
4σ5σ6σ
x
การแจกแจงปกตมาตรฐาน
Standard Normal Distribution
-เปนการแจกแจงปกตทมคาเฉลยเทากบ 0
และสวนเบยงเบนมาตรฐานเทากบ 1
-บางครงเรยก unit normal distribution
Z
0
σ=1Z~N(0,1)
18
การแจกแจงปกตมาตรฐาน แปลงไดจาก
คาตวแปรสมดงน
σ
μxz i
μσ
X Z
50 -1.55
60 -0.77
70 0.00
80 0.77
90 1.55
70.00 0.00
12.91 1
ฟงกชนการแจกแจงปกตมาตรฐาน
/22ze2π
1f(x)
และ e เปนคาคงทมคา 3.1459 และ 2.71828
Z คามาตรฐาน
ใชคานวณความนาจะเปนใตโคงปกต
Z~N(0,1)
19
คา Z มความสาคญ เพราะเมอทราบคา Z
สามารถหาคาความนาจะเปนได
เชน Z = 1.96 มคาความนาจะเปนเทากบ 0.025
Z = -1.96 มคาความนาจะเปนเทากบ 0.025
-1.96 1.96
การเปดหาคาความนาจะเปนจากตาราง
Normal Distribution
(A) (B) (C)
Z Area Between Mean & Z Area Beyond Z
1.9500 0.4744 0.0256
1.9600 0.4750 0.0250
1.9700 0.4756 0.0244
Z-1.96 1.96
20
การใชโปรแกรม STATA หาคาความนาจะเปน
Normal Distribution
. display normprob(1.96) หรอ
. di normal(1.96)
.9750021
. display 1-normprob(1.96) หรอ
. di 1-normal(1.96)
.0249979
. display normprob(-1.96) หรอ
. di normal(-1.96)
.0249979
0 1.96di normal(0).5
ตวอยาง คา CHOL ประชากร ~N(0,1)
ม = 200 mg/100ml = 20 mg/100ml
จงหาความนาจะเปนทคน คนหนงคนจากประชากร
มคา CHOL
1. x ระหวาง 180 ถง 200
2. x>225
3. x<150
μ σ
21
1. ระหวาง 180 ถง 200
P(180<X<200) = P[(180-200)/20]<Z< [(200-200)/20]
=P(-1<Z<0) = 0.3414
. di normal((200-200)/2)
.5
. di normal((180-200)/20)
.15865525
. di .5-.15865525
.34134475
. di normal((200-200)/20)-normal((180-200)/20)
.34134475
นามาลบกน
2. x> 225 mg/100ml
P(X>225) = P[Z> [(225-200)/20]
=P(Z>1.25) = 0.1056
. di 1-normal((225-200)/20)
.10564977
22
3. X< 150 mg/100ml
P(X<150) = P[Z< [(150-200)/20]
=P(Z<-2.5) = 0.0062
. di normal((150-200)/20).00620967
การหาคา Z เมอทราบคา Probability Value
1. P(Z>Z1) = 0.1056
2. P(Z<Z1) = 0.025
3. P(Z>Z1) = 0.05
1. P(Z>Z1) = 0.1056
. di invnormal(1-.1056)1.2502726
23
2. P(Z<Z1) = 0.025
. di invnormal(.025)-1.959964
3. P(Z>Z1) = 0.05
. di invnormal(1-0.05)1.6448536