Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ......
Transcript of Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ......
1
Материјал за предавања 17.03.2020. и за вежбе 19.03.2020.
из предмета Пословна статистика, Статистика у туризму (СП Менаджмент и Менаджмент туризма) и
Статистика (СП Јавна управа).
Предметни наставник проф. др Славица Дабетић
2
Raspored verovatnoće neprekidne
slučajne promenljive
Kod prekidne slučajne promenljive, do rasporeda verovatnoće se dolazi
tako što se formira lista pojedinih vrednosti i odgovarajućih verovatnoća.
Međutim, kod neprekidne slučajne promenljive nemoguće je sastaviti takvu
listu, jer je broj njenih vrednosti beskonačan, odnosno ima smisla odrediti
samo verovatnoću da se X nalazi u nekom intervalu.
Grafički prikaz prekidna slučajna promenljiva sastiji se samo od
ordinata, dok se kod neprekidne promenljive sastoji od neprekidne glatke
krive. Takva kriva naziva se kriva gustine verovatnoća. Matematička
funkcija gustine verovatnoća označava se sa f (x).
Osobine funkcije gustine verovatnoća su:
F-ja je uvek pozitivna tj. f (x) ≥ 0
Površina ispod krive je jednaka 1, tj. ∫ 𝑓 (𝑥)𝑑𝑥 ∞
−∞ =1.
Verovatnoća da X uzme vrednost u interval (a,b) jednaka je površini
između krive f(x) i x ose duž intervala (a,b), važi da je:
P(a < X < b) =∫ 𝑓 (𝑥)𝑑𝑥 = 𝐹(𝑏) − 𝐹(𝑎) .𝑏
𝑎
P(X = a) = P(X = b) =0.
U okviru modela neprekidnih rasporeda verovatnoće, u statističkoj praksi se
najčešće koriste normalan, Student-ov, χ2 - raspored i Snedecor-ov
(Fisher-ov) raspored.
1. Normalna – Gaus-ova raspodela verovatnoće
3
Normalan raspored ima centralnu ulogu u statističkoj teoriji i praksi, posebno
u domenu statističkog zaključivanja.
Normalan raspored je prvi otkrio francuski matematičar Abraham de Moivre
1733, kao granični slučaj binomnog rasporeda. Ovaj raspored je bio poznat i
P. Laplace-u u drugoj polovini osamnaestog veka, ali ni njegovo otkriće nije
privuklo nikakvu pažnju. Tek kada ga je C. Gauss 1809. godine opisao,
normalan raspored je potpuno prihvaćen od strane matematičara i statističara.
Gauss je izveo ovaj raspored kao matematičku funkciju namenjenu opisu
rasporeda grešaka u merenjima astronomskih opservacija, pa se ovaj
raspored dugo i zvao Gausov raspored grešaka.
Za slučajnu promenljivu X kažemo da ima normalan raspored ako je
karakterišu neprekidne vrednosti, a njena funkcija gustine ima izraz:
f(x)= 1
𝜎√2𝜋𝑒
−(𝑥−µ)2
2𝜎2 , u oznaci X: N (µ,σ2 ), −∞ < x < +∞,
gde su:
π - matematička konstanta približno jednaka 3,14159,
e - matematička konstanta približno jednaka 2,71828,
μ - aritmetička sredina normalne slučajne
promenljive,
σ - standardna devijacija normalne slučajne promenljive.
Karakteristike normalnog rasporeda lako se mogu uočiti iz grafičkog
prikaza, koji se naziva normalna kriva.
Slika 1. Normalna kriva
4
Osobine normalnog rasporeda:
1. Kriva ima oblik zvona, unimodalna je, simetrična u odnosu na µ.
2. Budući da je raspored simetričan, njegova aritmetička sredina, modus i
medijana su međusobno jednaki.
3. Normalna kriva se proteže od −∞ do +∞ , tj. asimptotski se približava x
osi, pa je njen interval varijacije beskonačan.
4. Relativna mera asimetrije je 0, a relativna mera spljoštenosti ima vrednost
3.
5. Ukupna površina ispod krive jednaka je 1. Verovatnoća da promenljiva
uzme vrednost manju (ili veću) od aritmetičke sredine iznosi 0,5.
6. Normalna kriva je u potpunosti definisana sa dva parametra µ i σ, tj.
raspored se označava sa N(µ, σ2).
7. Površina označena linijama na udaljenosti od jedne standardne devijacije
od aritmetičke sredine, x-osom i krivom f(x) iznosiće 68% od čitave površine
P(µ−σ≤ X ≤ µ+σ) = 0,68.
8. Slično može se zaključiti da je
P(µ−2σ≤ X ≤ µ+ 2σ) = 0,95, P(µ−3σ≤ X ≤ µ+ 3σ) = 0,997
Slika 2. Odnos između površine formirane na rastojanju ±σ, ±2σ, ±3σ od 𝜇 i površine
ispod krive
Za raspodele u obliku zvona to znači:
i površine ispod krive
5
68% vrednosti je u opsegu od jedne standardne devijacije od aritmetičke
sredine, 95% vrednosti je u opsegu od dve standardne devijacije od
aritmetičke sredine, 99,7% vrednosti je u opsegu od tri standardne devijacije
od aritmetičke sredine.
2. Značaj normalnog rasporeda
Normalan raspored predstavlja najznačajniji teorijski raspored
verovatnoće jer je:
1. Veliki broj pojava u prirodi i društvu ima normalan raspored.
Tipični primeri su: visina, težina, krvni pritisak, rezultati na testovima
inteligencije, greške pri merenju itd. Generalno, ako veliki broj faktora utiče
na neku pojavu na aditivan način, i uticaj svakog od njih je veoma mali, može
se očekivati da ta pojava sledi normalan raspored. U devetnaestom veku se
čak, tvrdilo da sve pojave slede normalan raspored, ali je ovo kasnije
odbačeno.
2. Normalan raspored može poslužiti kao odlična aproksimacija raznih
prekidnih rasporeda, za one vrednosti koje nisu date u tablicama verovatnoće.
Veliki broj prekidnih rasporeda, pod posebnim uslovima, teži normalnom
rasporedu.
3. Iz normalnog rasporeda je izveden veliki broj drugih neprekidnih
rasporeda, koji takođe imaju značajno mesto u statističkoj analizi. Kao što su
Studentov ili t-raspored, χ2 - raspored i F (Fišerov ) raspored.
4. Normalan raspored predstavlja osnovu za parametarsko statističko
zaključivanje zbog:
a) njegove veze sa Centralnom graničnom teoremom,
b) parametarski metodi imaju zajedničku predpostavku da osnovni
skup iz koga se uzima uzorak ima normalan raspored.
c) čak i neparametarske statističke metode koriste normalan raspored
kao sredstvo za donošenje odluke u slučaju velikih uzoraka.
Veliki broj statističkih problema se rešava uz predpostavku da populacija
kojoj pripada uzorak ima normalan raspored.
3. Standardizovan normalni raspored
U zavisnosti od parametara µ, σ postoji čitava familija normalnih rasporeda.
Kako izračunavanje verovatnoće u konkretnom slučaju zavisi od
izračunavanja određenih integrala, to znatno komplikuje analizu.
6
Prevazilaženje ovog problema moguće je korišćenjem jednog posebnog
normalnog rasporeda koji služi kao međusredstvo za rešavanje
praktičnih problema i izbegavanje integracije.
Takav normalan raspored se naziva standardizovan normalan raspored. U
praksi se koriste tablice verovatnoće ovog modela, a postupkom
standardizacije se bilo koji normalan raspored svodi na standardizovan.
Z = 𝑋−𝜇
𝜎
Uobičajeno je da se standardizovana normalna promenljiva označava sa Z.
Njena aritmetička sredina je jednaka 0, a varijansa je 1.
Slika 4.. Standardizovan normalni raspored
Verovatnoća da je Z u interval (z1, z2) se izračunava kao
P(z1 ≤ Z ≤ z2) = F(z2)−F(z1) ,
Iz osobina krive simetrične u odnosu na koordinatni početak važi da je
F (−z) = 1− F (z),
Na osnovu toga sledi da je
P(−z ≤ Z ≤ z) = F (z)− F (−z) = F (z)−(1− F (z)) = F (z)−1+ F (z) = 2F (z)−1
Specijalno, za z=1 dobija se
7
P(−1≤ Z ≤1) = F(1) − F(−1) = 2F(1) −1= 2∙0,8413−1= 0,6825.
Poznavajući verovatnoću da Z uzme vrednosti u nekom intervalu,
možemo odrediti granice tog intervala. Ako je, na primer, poznato da
verovatnoća iznosi 0,95, tj 95%, granice intervala izračunavamo iz
0,95=2F(z) - 1, pa je F(z) = 0,975.
Iz tablica se može naći odgovarajuća vrednost za z koja iznosi z = 1,96;
sledi traženi interval je (-1,96; 1,96).
Važi sledeće
P(x1 ≤ X ≤ x2) = P(z1 ≤ Z ≤ z2) , gde su: z1 = x1 −µ i z2 = x2 −µ.
Lako se vidi da je promenljiva X u granicama (µ-1,96σ; µ+1,96σ), sa
verovatnoćom od 95%.
Slika 5. Povezanost između normalnog rasporeda N (μ; σ
2) i standardizovanog z
rasporeda sa aritmetičkom sredinom 0 i standardnom devijacijom 1
8
Postupak „antistandardizacije“ moguće je primeniti i na
izračunavanje veličine x iz na primer sledeće jednakosti:
P(X ≤ x) = P(Z ≤ z) = F (z) = 0,95.
Za nađenu vrednost z = 1,64 može se lako istim postupkom može
dobiti i granica x = µ + 1,64σ. Verovatnoća da slučajna veličina ima
vrednost do nađene veličine x iznosi 95% predstavlja i odgovor na
postavljeno pitanje.
4. Studentova raspodela (t - raspodela)
Postoji neprekidna slučajna promenljiva koja uzima vrednosti iz
intervala (-∞, +∞) kao i normalna raspodela, ali čija funkcija gustine sadrži
parametar koji se naziva „broj stepena slobode” (df ili ν). Ova raspodela je
prvi put uvedena u jednom članku o uzorku čiji se autor (W. S. Gosselett)
potpisao s pseudonimom „Student”, tako da je u literaturi ova raspodela
poznata kao Studentova ili t- raspodela.
Neka su slučajne promenljive Z~ N(0, 1) i χn2 nezavisne. Raspodela slučajne
promenljive 𝑡 =𝑧
√χ𝑛2
𝑛
naziva se Studentova t-raspodela sa n stepeni slobode.
Ako je populacija normalno raspoređena, tada standardizovana statistika t
= �̅�−𝜇
𝑆
√𝑛
ima t-raspored sa n-1 stepenom slobode.
Za bilo koju celu vrednost df = 1, 2, 3,..., n postoji odgovarajuća
Studentova t-raspodela sa sledećim karakteristikama:
- aritmetička sredina ove t - distribucije je 0.
- za df > 2, varijansa t-distribucije je 𝑑𝑓
𝑑𝑓 −2 .
Budući da je t-raspored simetričan i zvonastog oblika sa širim
krajevima u odnosu na Z raspodelu važi sledeća jednakost :
9
P(tν <tν,α)=1−α , df = ν -broj stepeni slobode.
ZADACI ZA VEŽBU
Primer 1.
Jedna fabrika proizvodi sijalice čiji vek trajanja ima približno
normalnu raspodelu sa aritmetičkom sredinom μ = 100h i standardnom
devijacijom σ = 20h. Koliko iznosi verovatnoća da će slučajno izabrana
sijalica imati vek trajanja:
a) između 60 i 90 časova,
b) više od 90 časova,
c) manji od 95 časova.
Rešenje:
a) P(60 < X < 90) = P(60−𝜇
𝜎<
𝑋−𝜇
𝜎<
90−𝜇
𝜎) =
P(60−100
20< 𝑍 <
90−100
20) = P(−2 < Z < −0,5) = F(−0,5)−F(−2)
= 1 − F (0,5) − (1−F(2)) = 1 − 0,6915 − (1 − 0,9772)
= 0,3085 − 0,0228 = 0,2857
Verovatnoća da će sijalica imati vek trajanja između 60 i 90 časova je 0,2857.
b) P(X > 90) =1− P(X < 90) =1− P( 𝑋−𝜇
𝜎 <
90−𝜇
𝜎 )
1− P(Z < 90−100
20 )=1− P(Z <−0,5)=1− F (−0,5)=
= 1− (1− F (0,5)) = F (0,5) = 0,6915.
Verovatnoća da će sijalica imati vek trajanja više od 90 časova je
0,6915.
10
c) P(X < 95) = P(Z <95−100
20 ) = P(Z <−0,25) = F(−0,25) =1−F(0,25)
= 0,4013
Verovatnoća da će sijalica imati vek trajanja manje od 95 časova je 40,13%.
Primer 2.
Broj klijenata u jednoj banci u toku dana ima približno normalan
raspored sa srednjom vrednošću 360 i standardnom devijacijom 30. Koliko
klijenata se može očekivati ponedeljkom ako je učešće klijenata tog dana
95%?
Rešenje:
a) P(X < x) = P( 𝑋−𝜇
𝜎 <
𝑥−𝜇
𝜎 ) =P (𝑍 <
𝑥−360
30 )=0,95
Sledi F ( 𝑥−360
30 ) = 0,95. Iz tablice F (z) = 0,95⇒ z =1,64
Rešenje jednačine z = 𝑥−360
30 ⇒ 1,64 =
𝑥−360
30 ⇒ x = 360+1,64∙30 =
409,2
Znači 95% je verovatnoća da će u ponedeljak banka imati 409 klijenata.
Primer 3.
Broj putnika prevezenih u toku dana u julu mesecu 2012. godine prevoznika “Lasta” na relaciji Beograd – Novi Sad ima približno normalan raspored sa srednjom vrednošću od 180 putnika i standardnom devijacijom
od 20 putnika. Koliko putnika se može očekivati radnim danom 2015. godine u julu mesecu ako je učešće putnika u toku dana 95%?
11
Rešenje:
X: N(180;20), Z= 𝑋−180
20 : N(0;1).
P(Z <z1) = 0,95, z1=1,64
𝑥1−180
20=1,64;
𝑥1=180+20∙1,64 = 212,8
Može se očekivati da radnim danom u julu mesecu 2015. god. bude 213
putnika.
Primer 4.
Za pakovanje šećera može se reći da ima normalan raspored sa aritmetičkom sredinom od 1000 gr i standardnom devijacijom od 50 gr. Kolika je verovatnoća da slučajno odabrano pakovanje šećera imati težinu:
a) Do 1005 gr.
b) Više od 1100 gr.
c) Između 990 i 1050 gr.
Rešenje:
X: N(1000;50), Z= 𝑋−𝜇
𝜎 : N(0;1).
a) P(X < 1005) = P(Z < 0,1) = F(0,1) = 0,5398; b) P(X > 1100) = 1 – P(X ≤ 1100) =1 – P(Z < 2)=1 – F(2) =
=1-0,9772 = 0,0228; c) P(990 < X < 1050) = P(‒0,2 < Z < 1) = 0,8413 – (1 + 0,5793 =
0,4206.
Primer 5.
Jedna mašina proizvodi 5% defektnih proizvoda. Koja je verovatnoća da će u 100 proizvoda biti:
a) od 5–10 defektnih proizvoda,
12
b) najviše 10 defektnih proizvoda.
Rešenje:
Slučajna promenljiva X koja predstavlja broj defektnih proizvoda u 100
komada ima binomnu raspodelu.
Moze se reći da je n = 100 dovoljno veliki broj, a p = 0,05 dovoljno mali,
Kako je np =100∙0,05 ≤ 5 i npq = 100 ∙ 0,05 ∙ 0,95 = 4,75 ≤ 5 binomni raspored
ćemo aproksimirati normalnim, gde je:
𝜇 = 𝑛𝑝 = 5; σ2=𝑛𝑝𝑞=4,75;
σ = √𝑛𝑝𝑞=√4,75=2,18.
Z = Z= 𝑋−𝑛𝑝
√𝑛𝑝𝑞=
𝑋−5
2,18 : Z(0,1).
Kako se sa diskretne prelazi na neprekidnu slučajnu promenljivu,
intervali se proširuju za 0,5, važi da je:
a) P(5 ≤ X ≤10) = P(4,5 ≤ X ≤ 10,5) = P(‒0,23 ≤ Z ≤ 2,52) =
0,5851;
b) P(X ≤ 10) = P(0 ≤ X ≤ 10) = P(‒0,5 ≤ X ≤ 10,5) = P(‒2,52 ≤ Z ≤
2,52)
= 0,9882.
Primer 6.
Izračunati vrednost tν;α za ν = 15 stepeni slobode i za površinu od 0,01
na desnom kraju krive t-raspodele.
Rešenje: Ako je ν =15 i verovatnoću 99% nalazimo da je t15; 0,01= 2,602. To
znači da je :
P(t < 2,602) = 0,99
13
Slika 6. Studentova t- raspodela
Primer 7.
U kom intervalu će se naći apsolutna vrednost promenljive tν sa
verovatnoćom od 95%.
Rešenje:
Za ν = 5 i (1−α) = 0,95 tj. α = 0,05 granične vrednosti nalazimo iz
tablice t-raspodele
P(−t5;0,025 ≤ t ν ≤ t 5;0,025 )= 0,95
P(−2,5706 ≤ tν ≤ 2,5706) = 0,95
Sa verovatnoćom od 0,95 realizovana vrednost promenljive t5 naći će
se u intervalu od -2,5706 do 2,5706.
14
Primer 8.
Slučajna promenljiva X ima Studentovu raspodelu sa 14 stepeni slobode. Odrediti verovatnoću:
a) P(X < 1,34); b) P(X > 2,62); c) P(1,34 < X < 2,62).
Rešenje:
Iz tablica Studentovog t rasporeda sa 14 stepeni slobode vidi se da je za
X = 1,345, P(X>x) = 0,10; za x = 2,624, P(X>x) = 0,01;
Odatle sledi
a) P(X < 1,34)=1- P(X > 1,34)=1-0,10=0.90;
b) P(X > 2,62)=0,01
P(1,34<X < 2,62)= P(X < 2,62) - P(X <1,34) =0,99 -0,90
=0,09.
ZAKLJUČAK:
Na osnovu rezultata dobijenog u predhodnom zadatku može se uočiti
da je interval t-raspodela širi u odnosu na interval normalne promenljive Z za
istu verovatnoću.
Za verovatnoću 0,95 i promenljivu Z sa normalnom raspodelom taj
interval je [-1,96, 1,96], a za promenljivu sa t-raspodelom i 5 stepeni slobode
interval je [-2,57, 2,57]. Porastom broja stepena slobode n → ∞, ν→ ∞ t-
raspodela→ z-raspodeli.
Na osnovu toga se izvodi zaključak:
Za n ≥ 30 može se koristiti normalna z- raspodela umesto t-raspodele.
15
Tabela 1- Normalni raspored
16
Tabela 2- Normalni raspored-funkcija raspodele
17
Tabela 3. Kritične vrednosti (Studentovog t- rasporeda)
18