Binomna, Poissonova i normalna raspodela
Transcript of Binomna, Poissonova i normalna raspodela
1
BinomnaBinomna, Poissonova i , Poissonova i normalna raspodelanormalna raspodela
Goran Trajković
februar, 2009. godine
BinomnaBinomna rraaspodelaspodela
Bernoullijev ogled – ogled sa binomnim (dihotomnim) međusobno isključivim ishodima:
1. ishod od interesa, povoljan ishod, “uspeh” (sa verovatnoćom p)
2. nepovoljan ishod, “neuspeh” (sa verovatnoćom q=1- p)
Bernoullijev proces:1. Ponavljanje jednog ogleda sa dva ishoda2. Ogledi su nezavisni3. Verovatnoća ishoda u pojedinačnim ogledima je jednaka
Raspodela verovatnoća diskretne slučajne promenljive za broj ostvarenih događaja od interesa u ogledu koji se sastoji od fiksnog broja Bernoullijevih ogleda. Slučajna promenljiva može imati celobrojne nenegativne vrednosti x=0, 1, 2, ..., n koje predstavljaju:(1) broja “povoljnih” ishoda posle n pokušaja, ili (2) broja
jedinica sa datom karakteristikom u uzorku veličine n.
BinomnaBinomna rraaspodelaspodela Binomni keoficijent – broj kombinacija x povoljnih ishoda u n ogleda:
Npr. broj kombinacija za dva ostvarena povoljna ishoda (x=2) u sekvenci od 4 nezavisnih ogleda (n=4) iznosi 6:
( )!!!
xnxn−
( ) 6!24!2
!4=
−
Ako je A povoljan, a B nepovoljan ishod, specifične kombinacije za dva “povoljna” ishoda u 4 ogleda imaće izgled:
AABB ABAB ABBA BAAB BABA BBAA
Binomna verovatnoća – verovatnoća da će se ostvariti xpovoljnih ishoda u sekvenci od n nezavisnih ogleda
x – broj “uspeha”n – broj dihotomnih ogleda (veličina uzorka)p – verovatnoća “uspeha”q – verovatnoća “neuspeha”
n i p – parametri binomne raspodele
( ) ( )xnxqp
xnxnxP −⋅−
=!!
!
Očekivanje
Standardna devijacija
pn ⋅=μ
qpn ⋅⋅=σ
Primer:Ako je učestalost krvne grupe A u datoj populaciji 42% (p=0.42), verovatnoća da će slučajan uzorak veličine 7 osoba (n=7), izabran iz te iste populacije, sadržati 2 osobe sa krvnom grupom A (x=2) iznosi:
( ) ( )( ) 243.058.042.0
!27!2!7 272 =⋅⋅−
= −xP
2
U istom primeru, verovatnoće za svih 8 mogućih rezultata, da u uzorku neće biti nijedne, pa sve do toga će svih 7 osoba imati krvnu grupu A (x= 0, ... 7) iznose (tabelarno i grafički):
1.000Σ0.00270.02260.09250.21340.29430.24320.11210.0220
pBroj osoba sa krvnom grupom A
0
0.1
0.2
0.3
0.4
0 1 2 3 4 5 6 7
Broj osoba sa krvnom grupom A
Vero
vatn
oća
PPoissonovaoissonova raspodelaraspodela
Poissonova raspodela definiše verovatnoće brojaretkih slučajnih događaja u konstatnoj jednici prostora ili vremena.
Za ove događaje važi:1. Događaji su nezavisni. Pojava jednog događaja ne
utiče na verovatnoću drugog događaja (slučajnost događaja)
2. U teorijskom smilsu, moguć je beskonačan broj događaja u konstantnoj jedinici prostora ili vremena
3. U bilo kom malom intervalu ili prostoru verovatnoća pojave događaja proporcionalna je veličini intervala
PPoissonovaoissonova raspodelaraspodela
Primeri moguće primene u analizi:•Slučajne raspodele retkih bolesti u različitim delovima zemlje•Broja zahteva za hitnu medicinsku intervenciju•Broja mutacija u lancu DNA za dati nivo radijacije•Broj bakterijskih kolonija, ili broja bakterija u preparatu•Broja krvnih ćelija u komori za prebrojavanje•Broja nesreća
Funkcija verovatnoFunkcija verovatnoćća a PPoissonovoissonoveeraspodelraspodelee
Funkcija verovatnoća Poissonove raspodele definisana je formulom:
x - broj ostvarenih događaja u konstatnoj jednici prostora ili vremena,λ- parametar Puasonove raspodele i predstavlja prosečan broj događaja u jednici prostora ili vremena,e ≈ 2.72 (osnova prirodnih logaritama)Očekivana vrednost, varijansa i standardna devijacija:
λσμ == 2 λσ =
( )!x
exPxλλ−=
Verovatnoća za nula događaja (x=0) dobija se iz tablice ili pomoću formule:
Verovatnoće za jedan, dva ili više (x=1, 2, ...) događajamogu se dobiti rekurzivnim formulama:
( )!0
00λλ−= eP
( ) ( )
( ) ( )
( ) ( )3
23
212
01
λ
λλ
PP
PP
PP
=
=
=
Primer:Broj porođaja po danima u jednoj opštini u vremesnkom periodu od 110 dana iznosio je:
broj porođaja 0 1 2 3 4 5 6 7 8 9 10u jednom danu
broj dana 2 10 18 23 22 16 10 5 3 0 1
Kolika je verovatnoća da u jednom danu budu dva porođaja? Kolika je verovatnoća da u jednom danu bude manje od 3 porođaja? Kolika je verovatnoća da u jednom danu bude više od 2 porođaj?
3
Prosečan broj porođaja po jednom danu iznosio je: λ=412/110=3.75
Verovatnoća da u jednom danu ne bude porođaja iznosi:P(0) = 0.024
Verovatnoća da u jednom danu budu dva porođaja oznosi: P(2) = 0.166
Verovatnoća da u jednom danu bude manje od 3 porođaja iznosi:P(X<3) = P(0) + P(1) + P(2) = 0.024 + 0.088 + 0.166 = 0.278
Verovatnoća da u jednom danu bude više od 2 porođaja iznosi: P(X>4) = 1 – (P(0) + P(1) + P(2)) == 1 – 0.024 + 0.088 + 0.166 = 0.722
Normalna raspodelaNormalna raspodelaKontinuirana raspodela verovatnoća. Definisana formulom:
2
2
2)(
21)( σ
μ
πσ
−−
=x
exf
μ – sredina, σ2 – varijansa, π – 3.14, e – 2.72
X
f(X)
μ
σ
•Kompletno opisana parametrima μ i σ.•Dobra aproksimacija za mnoge biološke varijable.•Osnova u procesu statističkog zaključivanja
OsobineOsobine nnormalnormalnee raspodelraspodelee
• U intervalu od μ-σ do μ+σ nalazi se 68% vrednosti
• U intervalu od μ-2σ do μ+2σ nalazi se 95% vrednosti
• U intervalu od μ-3σ do μ+3σ nalazi se 99.7% vrednosti
StandardStandardna na normalnormalnana raspodelaraspodela
-2 -1 0 1 2 3
0.1
0.2
0.3
0.4
Standardna normalna raspodela ima μ=0 i σ=1.
Sve normalne raspodele mogu biti konvertovane u standardnu normalnu raspodelu oduzimanjem aritmetičke sredine od svake vrednosti i deljenjem sa standardnom devijacijom čime se dobijaju standardni skorovi ili z-skorovi:
σμ−
=XZ
Tabele povrTabele površšine ispod ine ispod krivekrivesstandardtandardne ne normalnormalnene rraspodeleaspodele
Tabele pokazuje površine odnosno verovatnoće da neka vrednost bude veća ili manja od specifikovane standardne vrednosti. Ako tabela pokazuje površine od -∞ do z0 onda vrednosti u toj tabeli pokazuju verovatnoće: P(z≤z0).Uz pomoć tabela se može izračunati verovatnoća da se neka vrednost nađe između dve specifikovane standardne vrednosti.
Tabele povrTabele površšine ispod ine ispod krivekrivesstandardtandardne ne normalnormalnene rraspodeleaspodele
Primer:Telesna masa određene populacije dece je normalno raspoređena sa aritmetičkom sredinom 15kg i SD 3kg. Kolika je verovatnoća da će slučajno izabrano dete imati telesnu masu između 11kg i 17kg?
33.131511
1 −=−
=z 66.031517
2 =−
=z
P(11≤x ≤17)=P(-1.33≤z ≤0.66)= 0.4082+0.2454=0.6536
4
Provera normalnosti raspodele1. CV>50% ukazuje na odstupanje od normalne
raspodele2. Vrednosti skjunisa i kurtosisa od -1 do 1 ukazuju na
normalnu raspodelu. Vrednosti skjunisa i kurtosisa veće od 3 i manje od -3 ukazuju na odstupanje od normalne raspodele. Kod pozitivno iskošene raspodele aritmetička sredina je veća od medijane. Kod negativno iskošene raspodele aritmetička sredina je manja od medijane
3. Statističko testiranje normalnosti: Kolmogorov-Smirnov test i Shapiro-Wilk test. Ako je p<0.05 u ovim testovima, empirijska raspodela statistički značajno odstupa od normalne.
Provera normalnosti raspodeleGrafičke metode:4. Histogram – vizuelna procena da li je empirijska
raspodela slična zvonastoj simetričnoj raspodeli5. Normalni Q–Q grafikon. Ako je raspodela normalna
tačke će biti na pravoj liniji. Odstupanje tačaka od prave linije ukazuje na odstupanje raspodele od normalne.
6. Detrendovani normalni Q–Q grafikon. Ako je raspodela normalna tačke će biti ravnomerno raspoređene iznad i ispod horizontalne linije. Ako raspodela nije normalna raspored tačaka će imati neki oblik kao npr. slovo J
Provera normalnosti raspodele8. Grafikon kutije (“boxplot”). Ako postoji nekoliko
ekstremnih vrednosti ili neobičnih vrednosti na bilo kom kraju raspodele to ukazuje na odstupanje od normalne raspodele. Ako medijana nije u centru grafikona kutije već je znatno bliža jednom od krajeva kutije, to ukazuje na odstupanje od normalne raspodele
BinomnaBinomna, Poissonova i , Poissonova i normalna raspodelanormalna raspodela
Goran Trajković
februar, 2009. godine
BinomnaBinomna rraaspodelaspodela
Bernoullijev ogled – ogled sa binomnim (dihotomnim) međusobno isključivim ishodima:
1. ishod od interesa, povoljan ishod, “uspeh” (sa verovatnoćom p)
2. nepovoljan ishod, “neuspeh” (sa verovatnoćom q=1- p)
Bernoullijev proces:1. Ponavljanje jednog ogleda sa dva ishoda2. Ogledi su nezavisni3. Verovatnoća ishoda u pojedinačnim ogledima je jednaka
Raspodela verovatnoća diskretne slučajne promenljive za broj ostvarenih događaja od interesa u ogledu koji se sastoji od fiksnog broja Bernoullijevih ogleda. Slučajna promenljiva može imati celobrojne nenegativne vrednosti x=0, 1, 2, ..., n koje predstavljaju:(1) broja “povoljnih” ishoda posle n pokušaja, ili (2) broja
jedinica sa datom karakteristikom u uzorku veličine n.
BinomnaBinomna rraaspodelaspodela
Binomni keoficijent – broj kombinacija x povoljnih ishoda u n ogleda:
Npr. broj kombinacija za dva ostvarena povoljna ishoda (x=2) u sekvenci od 4 nezavisnih ogleda (n=4) iznosi 6:
( )!!!
xnxn−
( ) 6!24!2
!4=
−
Ako je A povoljan, a B nepovoljan ishod, specifične kombinacije za dva “povoljna” ishoda u 4 ogleda imaće izgled:
AABB ABAB ABBA BAAB BABA BBAA
Binomna verovatnoća – verovatnoća da će se ostvariti xpovoljnih ishoda u sekvenci od n nezavisnih ogleda
x – broj “uspeha”n – broj dihotomnih ogleda (veličina uzorka)p – verovatnoća “uspeha”q – verovatnoća “neuspeha”
n i p – parametri binomne raspodele
( ) ( )xnxqp
xnxnxP −⋅−
=!!
!
Očekivanje
Standardna devijacija
pn ⋅=μ
qpn ⋅⋅=σ
Primer:Ako je učestalost krvne grupe A u datoj populaciji 42% (p=0.42), verovatnoća da će slučajan uzorak veličine 7 osoba (n=7), izabran iz te iste populacije, sadržati 2 osobe sa krvnom grupom A (x=2) iznosi:
( ) ( )( ) 243.058.042.0
!27!2!7 272 =⋅⋅−
= −xP
U istom primeru, verovatnoće za svih 8 mogućih rezultata, da u uzorku neće biti nijedne, pa sve do toga će svih 7 osoba imati krvnu grupu A (x= 0, ... 7) iznose (tabelarno i grafički):
1.0001.000ΣΣ0.0020.002770.0220.022660.0920.092550.2130.213440.2940.294330.2430.243220.1120.112110.0220.02200
ppBroj osoba sa Broj osoba sa krvnom grupom Akrvnom grupom A
0
0.1
0.2
0.3
0.4
0 1 2 3 4 5 6 7Broj osoba sa krvnom grupom A
Vero
vatn
oća
PPoissonovaoissonova raspodelaraspodela
Poissonova raspodela definiše verovatnoće brojaretkih slučajnih događaja u konstatnoj jednici prostora ili vremena.
Za ove događaje važi:1. Događaji su nezavisni. Pojava jednog događaja ne
utiče na verovatnoću drugog događaja (slučajnost događaja)
2. U teorijskom smilsu, moguć je beskonačan broj događaja u konstantnoj jedinici prostora ili vremena
3. U bilo kom malom intervalu ili prostoru verovatnoća pojave događaja proporcionalna je veličini intervala
PPoissonovaoissonova raspodelaraspodela
Primeri moguće primene u analizi:•Slučajne raspodele retkih bolesti u različitim delovima zemlje•Broja zahteva za hitnu medicinsku intervenciju•Broja mutacija u lancu DNA za dati nivo radijacije•Broj bakterijskih kolonija, ili broja bakterija u preparatu•Broja krvnih ćelija u komori za prebrojavanje•Broja nesreća
Funkcija verovatnoFunkcija verovatnoćća a PPoissonovoissonoveeraspodelraspodelee
Funkcija verovatnoća Poissonove raspodele definisana je formulom:
x - broj ostvarenih događaja u konstatnoj jednici prostora ili vremena,λ- parametar Puasonove raspodele i predstavlja prosečan broj događaja u jednici prostora ili vremena,e ≈ 2.72 (osnova prirodnih logaritama)Očekivana vrednost, varijansa i standardna devijacija:
λσμ == 2 λσ =
( )!x
exPxλλ−=
Verovatnoća za nula događaja (x=0) dobija se iz tablice ili pomoću formule:
Verovatnoće za jedan, dva ili više (x=1, 2, ...) događajamogu se dobiti rekurzivnim formulama:
( )!0
00λλ−= eP
( ) ( )
( ) ( )
( ) ( )3
23
212
01
λ
λλ
PP
PP
PP
=
=
=
Primer:Broj porođaja po danima u jednoj opštini u vremesnkom periodu od 110 dana iznosio je:
broj porođaja 0 1 2 3 4 5 6 7 8 9 10u jednom danu
broj dana 2 10 18 23 22 16 10 5 3 0 1
Kolika je verovatnoća da u jednom danu budu dva porođaja? Kolika je verovatnoća da u jednom danu bude manje od 3 porođaja? Kolika je verovatnoća da u jednom danu bude više od 2 porođaj?
Prosečan broj porođaja po jednom danu iznosio je: λ=412/110=3.75
Verovatnoća da u jednom danu ne bude porođaja iznosi:P(0) = 0.024
Verovatnoća da u jednom danu budu dva porođaja oznosi: P(2) = 0.166
Verovatnoća da u jednom danu bude manje od 3 porođaja iznosi:P(X<3) = P(0) + P(1) + P(2) = 0.024 + 0.088 + 0.166 = 0.278
Verovatnoća da u jednom danu bude više od 2 porođaja iznosi: P(X>4) = 1 – (P(0) + P(1) + P(2)) == 1 – 0.024 + 0.088 + 0.166 = 0.722
Normalna raspodelaNormalna raspodelaKontinuirana raspodela verovatnoća. Definisana formulom:
2
2
2)(
21)( σ
μ
πσ
−−
=x
exf
μ – sredina, σ2 – varijansa, π – 3.14, e – 2.72
X
f(X)
μ
σ
•Kompletno opisana parametrima μ i σ.•Dobra aproksimacija za mnoge biološke varijable.•Osnova u procesu statističkog zaključivanja
OsobineOsobine nnormalnormalnee raspodelraspodelee
U intervalu od μ-σ do μ+σ nalazi se 68% vrednostiU intervalu od μ-2σ do μ+2σ nalazi se 95% vrednostiU intervalu od μ-3σ do μ+3σ nalazi se 99.7% vrednosti
StandardStandardna na normalnormalnana raspodelaraspodela
-2 -1 0 1 2 3
0.1
0.2
0.3
0.4
Standardna normalna raspodela ima μ=0 i σ=1.
Sve normalne raspodele mogu biti konvertovane u standardnu normalnu raspodelu oduzimanjem aritmetičke sredine od svake vrednosti i deljenjem sa standardnom devijacijom čime se dobijaju standardni skorovi ili z-skorovi:
σμ−
=XZ
Tabele povrTabele površšine ispod ine ispod krivekrivesstandardtandardne ne normalnormalnene rraspodeleaspodele
Tabele pokazuje površine odnosno verovatnoće da neka vrednost bude veća ili manja od specifikovane standardne vrednosti. Ako tabela pokazuje površine od -∞ do z0 onda vrednosti u toj tabeli pokazuju verovatnoće: P(z≤z0).Uz pomoć tabela se može izračunati verovatnoća da se neka vrednost nađe između dve specifikovane standardne vrednosti.
Tabele povrTabele površšine ispod ine ispod krivekrivesstandardtandardne ne normalnormalnene rraspodeleaspodele
Primer:Telesna masa određene populacije dece je normalno raspoređena sa aritmetičkom sredinom 15kg i SD 3kg. Kolika je verovatnoća da će slučajno izabrano dete imati telesnu masu između 11kg i 17kg?
33.131511
1 −=−
=z 66.031517
2 =−
=z
P(11≤x ≤17)=P(-1.33≤z ≤0.66)= 0.4082+0.2454=0.6536
Provera normalnosti raspodeleProvera normalnosti raspodele1. CV>50% ukazuje na odstupanje od normalne
raspodele2. Vrednosti skjunisa i kurtosisa od -1 do 1 ukazuju na
normalnu raspodelu. Vrednosti skjunisa i kurtosisa veće od 3 i manje od -3 ukazuju na odstupanje od normalne raspodele. Kod pozitivno iskošene raspodele aritmetička sredina je veća od medijane. Kod negativno iskošene raspodele aritmetička sredina je manja od medijane
3. Statističko testiranje normalnosti: Kolmogorov-Smirnov test i Shapiro-Wilk test. Ako je p<0.05 u ovim testovima, empirijska raspodela statistički značajno odstupa od normalne.
Provera normalnosti raspodeleProvera normalnosti raspodeleGrafičke metode:4. Histogram – vizuelna procena da li je empirijska
raspodela slična zvonastoj simetričnoj raspodeli5. Normalni Q–Q grafikon. Ako je raspodela normalna
tačke će biti na pravoj liniji. Odstupanje tačaka od prave linije ukazuje na odstupanje raspodele od normalne.
6. Detrendovani normalni Q–Q grafikon. Ako je raspodela normalna tačke će biti ravnomerno raspoređene iznad i ispod horizontalne linije. Ako raspodela nije normalna raspored tačaka će imati neki oblik kao npr. slovo J
Provera normalnosti raspodeleProvera normalnosti raspodele8. Grafikon kutije (“boxplot”). Ako postoji nekoliko
ekstremnih vrednosti ili neobičnih vrednosti na bilo kom kraju raspodele to ukazuje na odstupanje od normalne raspodele. Ako medijana nije u centru grafikona kutije već je znatno bliža jednom od krajeva kutije, to ukazuje na odstupanje od normalne raspodele