Post on 28-Nov-2015
description
1
Predavanja iz Statistike
Autor: dr.sc. Zdenka Zenzerović
2
1. UVOD
Pojam masovne pojave – statistička masa – definicija statistike – statistička jedinica –
statističko obilježje – vrste statističkog obilježja – faze statističkog rada – pojam
statističke tabele i tablice – formiranje statističkog niza – vrste statističkih nizova.
Masovna pojava je svaka pojava koja sadrţi velik broj jedinica; primjerice: studenti
Sveuĉilišta u Rijeci, dnevni broj putnika prevezenih gradskim autobusima, iznos ostvarenog
bruto domaćeg proizvoda u promatranoj vremenskoj jedinici, promet tereta u hrvatskim
lukama, itd.
Statistička masa je ona masovna pojava koja je odabrana za predmet statistiĉkog
istraţivanja i koja se ispituje odgovarajućim statistiĉkim metodama s ciljem odreĊivanja
znaĉajki promatrane pojave.
Statistika je znanstvena disciplina koja prouĉava masovne pojave primjenjujući na
njih odgovarajuće statistiĉke metode i koristeći pritom brojĉani i grafiĉki naĉin izraţavanja.
Statistiĉka masa je skup jedinica i kao svaki skup moţe se grafiĉki prikazati krugom, a
toĉkama unutar kruga jedinice sadrţane u statistiĉkoj masi. Primjerice, broj zaposlenih u
privredi Republike Hrvatske u 2000. godini prikazan je na shemi 1.
Shema 1. Prikaz statistiĉke mase
Zaposlene osobe u RH u 2000.god.
.= jedna zaposlena osoba
Broj jedinica u promatranoj statistiĉkoj masi je konaĉan ili beskonaĉan broj. Za svaku
pojavu za koju se moţe odrediti ukupan broj jedinica je skup s konaĉnim brojem, primjerice,
broj zaposlenih u privredi Republike Hrvatske, meĊutim za neke pojave nije iz objektivnih
razloga moguće odrediti ukupan broj jedinica pa je rijeĉ o skupovima s beskonaĉnim brojem
jedinica, primjerice: broj vozila u gradu tijekom dana,….
Statistička jedinica je, dakle, element statistiĉke mase. Broj statistiĉkih jedinica
naziva se frekvencijom i oznaĉava simbolom f .
Statistiĉka masa treba biti definirana prostorno, vremenski i pojmovno, tj. potrebno je
odrediti prostor i vrijeme na koje se odnosi statistiĉka jedinica kao i svojstva koja mora imati
jedinica da bi bila ukljuĉena u odgovarajuću statistiĉku masu.
3
Primjerice, za pojavu iz prethodne sheme statistiĉka jedinica je jedna osoba zaposlena
u privredi Republike Hrvatske u 2000. godini u radnom odnosu na neodreĊeno vrijeme.1
Statistiĉke jedinice imaju niz svojstava po kojima se podudaraju jedna s drugom, ali i
po kojima se meĊusobno razlikuju. MeĊutim, najmanje jedno svojstvo mora biti zajedniĉko
da bi jedinice pripadale istom skupu, a te osobine proizlaze iz definicije statistiĉke mase.
Statističko obiljeţje je svojstvo ili osobina statistiĉke jedinice. Svaka statistiĉka
jedinica ima relativno velik broj svojstava koja se mogu grupirati u ĉetiri skupine: atributivno,
prostorno, vremensko i numeriĉko obiljeţje.
Prostorno obiljeţje oznaĉava prostor (geografsko podruĉje), vremensko obiljeţava
vrijeme na koje se odnosi statistiĉka jedinica; numeriĉko obiljeţje jest ono koje se moţe
izraziti samo brojem, a atributivno rijeĉima (ako obiljeţje nije prostorno ili vremensko).
Primjerice, osoba zaposlena u privredi Republike Hrvatske u 2000. godini ima ova
obiljeţja: spol, struĉna sprema, godine radnog staţa, iznos plaće, godine starosti, djelatnost,
vrijeme zapošljavanja: godine, mjeseci, podruĉje: općine, ţupanije, mjesto boravka, itd.
Analizom pojedinih svojstava statistiĉke jedinice mogu se odrediti znaĉajke
promatrane pojave. Da bi se ostvario postavljeni cilj istraţivanja potrebno je provesti
odreĊene faze statističkog rada, i to:
1. Statističko promatranje - faza prikupljanja informacija o statistiĉkim jedinicama
obuhvaćenih promatranom statistiĉkom masom. S obzirom na obuhvat jedinica
promatranje je iscrpno ili reprezentativno, prema vremenu provoĊenja jednokratno,
periodiĉno ili tekuće promatranje, a prema naĉinu, prikupljanje se organizira pisanim ili
usmenim putem.
2. Grupiranje (klasifikacija) - faza grupiranja informacija prema jednom ili više odabranih
statistiĉkih obiljeţja u kojoj se kao rezultat dobivaju statistiĉki podaci. Statistiĉki podatak
je sreĊena, odnosno obraĊena informacija i predstavlja broj statistiĉkih jedinica
(frekvenciju) koje pripadaju pojedinom obliku statistiĉkog obiljeţja.
3. Statistička analiza - faza u kojoj se, na podatke o jednoj ili više promatranih statistiĉkih
masa, primjenjuju odgovarajuće statistiĉke metode da bi se odredile znaĉajke tih pojava.
Radi preglednosti informacije2 o statistiĉkim jedinicama i statistiĉki podaci prikazuju
se u statistiĉkoj tabeli, i to rezultati statistiĉkog promatranja u izvještajnoj, a rezultati
grupiranja u analitiĉkoj tabeli. U praksi te u struĉnoj i znanstvenoj literaturi u zadnje se
vrijeme ĉesto koristi termin tablica umjesto tabela. MeĊutim, statistiĉka tablica ne nastaje kao
rezultat faze statistiĉkog promatranja, već se sastoji od niza brojeva dobivenih primjenom
odgovarajućih raĉunskih radnji ili iznosa odreĊenih veliĉina koje se upotrebljavaju u
1 Prema statistiĉkoj metodologiji zaposlenom osobom smatra se osoba koja je s poslodavcem sklopila ugovor o
zasnivanju radnog odnosa na neodreĊeno vrijeme. Općenito, pojmovno definiranje statistiĉke mase propisano je i
obrazloţeno u Statistiĉkoj metodologiji Drţavnog zavoda za statistiku Republike Hrvatske. 2 Statistiĉki podatak je sreĊena, grupirana informacija. Informacija je da su u vremenu od 10 do 10.15 sati
evidentirani sljedeći prijelazi automobila preko raskršća: u 10.01 – jedan bijeli automobil, u 10.05 – jedan crveni
automobil, u 10.06 – jedan crveni automobil, u 10.10 – niti bijeli, niti crveni automobil, u 10.15 – jedan crveni
automobil. Podatak je da su u vremenu od 10 do 10.15 sati prošli kroz promatrano raskršće jedan bijeli
automobil, tri crvena automobila i jedan automobil boje razliĉite od bijele i crvene.
4
rješavanju raznih zadataka. U Rjeĉniku hrvatskog jezika [Anić, str. 733.] dopušta se termin
tablica i kao sinonim za tabelu.
Primjerice, grupirani podaci o broju zaposlenih prema djelatnosti prikazuju se u obliku
statistiĉke tabele, a logaritmi brojeva, sluĉajni brojevi, vjerojatnosti pri odreĊenim teorijskim
razdiobama nalaze se u statistiĉkim tablicama.
Statistička tabela je skup statistiĉkih jedinica jedne ili više pojava razvrstanih prema
jednom ili više obiljeţja statistiĉkih jedinica te, radi preglednosti, prikazanih u odgovarajućem
broju redaka i stupaca. Sadrţaj i oblik statistiĉke tabele prikazani su na shemi 2.
Shema 2. Sadrţaj statistiĉke tabele
Broj tabele
NASLOV TABELE
Tumaĉ redaka
predstupac ili
pretkolona
Tumaĉ stupaca-zaglavlje
Ukupno Oznaka
stupca
Oznaka
stupca
Oznaka retka Redak
Oznaka retka Redak
Polje tabele
Polje tabele
Ukupno Zbrojni redak
Opaska Oznaka izvora
Izvor: Serdar, V.-Šošić, I.: Uvod u statistiku, Školska knjiga, Zagreb, 1986., str.17.
U praksi se pojavljuju tri vrste analitičkih tabela:
Jednostavna tabela - tabela s jednim stupcem za prikazivanje statistiĉkih podataka jedne
statistiĉke mase kod koje su statistiĉke jedinice razvrstane prema jednom obiljeţju.
Sloţena tabela - tabela s dva ili više stupaca za prikazivanje statistiĉkih podataka dviju ili
više statistiĉkih masa kod kojih su statistiĉke jedinice razvrstane prema jednom obiljeţju.
Kombinirana tabela - tabela s dva ili više ulaza za prikazivanje statistiĉkih podataka jedne ili
više statistiĉkih masa kod kojih su statistiĉke jedinice grupirane istodobno prema više od
jednog obiljeţja.
Grupiranjem statistiĉkih jedinica prema odabranom obiljeţju dobiva se statistiĉki niz.
Statistički niz je niz podataka koji se odnose na statistiĉke jedinice grupirane prema jednom
odabranom obiljeţju i koji su prikazani u statistiĉkoj tabeli.
Obiljeţje prema kojem je obavljeno grupiranje odreĊuje vrstu statistiĉkog niza. Tako
se razlikuju: atributivni, geografski, numeriĉki i vremenski nizovi.
stu
pac
stu
pac
Zb
rojn
i st
up
ac
5
U tabeli 1 dani su podaci o broju zaposlenih i bruto domaćem proizvodu u privredi
Republike Hrvatske u 2000. godini prema djelatnostima, a u tabeli 2 podaci o prometu robe u
hrvatskim lukama u 2002. godini po pravcima kretanja i predstavljaju primjere atributivnog,
odnosno atributivnog i geografskog niza.
U tabelama 3, 4 i 5 statistiĉke jedinice (grupe zaposlenika u tabeli 3, broj dana u tabeli
4 te tone tereta u tabeli 5), grupirane su prema numeriĉkom obiljeţju (broj sati, broj poziva i
udaljenost u km) zato se nizovi iz tih tabela svrstavaju u numeriĉke nizove.
Podaci iz tabela 6 i 7 odnose se na broj prevezenih putnika u gradskom i zraĉnom
prijevozu Republike Hrvatske u razdoblju od 1991. do 2001.godine, odnosno na svjetsku
kontejnersku flotu u razdoblju od 1992. do 2001. godine i predstavljaju primjere vremenskih
nizova.
TABELA 1. Broj zaposlenih i bruto domaći proizvod u privredi Republike Hrvatske
u 2000. godini prema djelatnostima (stanje 31.3.)
Šifra DJELATNOST
BROJ ZAPOSLENIH
(stanje 31.03.)
BRUTO DOMAĆI
PROIZVOD
(u mil. kuna) UKUPNO ŢENE
A Poljoprivreda, lov i šumarstvo 30 017 7 882 10 951,3
D PreraĊivaĉka industrija 251 440 104 508 26 835,0
E Opskrba elektriĉnom
energijom, plinom i vodom
27 351
5 484
3 854,1
F GraĊevinarstvo 60 986 8 203 5 875,9
G Trgovina na veliko i na malo 136 059 70 521 13 159,7
H Hoteli i restorani 34 516 19 808 4 217,5
I Prijevoz, skladištenje i veze 80 356 22 411 12 425,3
J,K Financijske i druge usluge 73 591 39 090 18 863,6
B,Ĉ Ostalo 9 121 1 385 1 138,4
UKUPNO PRIVREDA 703 437 279 292 97 320,8
Napomena: Bruto domaći proizvod izraţen je u tekućim cijenama.
Šifra J obuhvaća financijsko posredovanje, šifra K poslovanje nekretninama, iznajmljivanje i
poslovne usluge, šifra B ribarstvo te šifra C rudarstvo i vaĊenje.
Izvor: SLJH-2001., str. 126.; SLJH-2002., str. 196.
TABELA 2. Promet robe u glavnim hrvatskim lukama u 2002. godini prema pravcima
kretanja (u tonama)
LUKA
UKUPAN
PROMET
(u tonama)
PRAVCI KRETANJA
UNUTRAŠNJI
PROMET
IZVOZ UVOZ TRANZIT
Dubrovnik 19 573 19 299 – 98 176
Ploĉe 972 055 65 278 3 938 75 090 827 749
Pula 538 232 1 480 468 722 64 993 3 037
Rijeka 4 983 272 1 357 191 1 045 840 1 124 850 1 455 391
Split 1 533 059 659 597 523 342 350 120 –
Šibenik 481 742 10 135 86 708 380 480 4 419
Zadar 351 483 39 567 37 957 273 959 –
UKUPNO 8 879 416 2 152 547 2 166 507 2 269 590 2 290 772
Izvor: Promet brodova po mjesecima i luĉkim kapetanijama u 2002. godini, Drţavni zavod za statistiku Republike Hrvatske,
Zagreb, tabela 18.
6
TABELA 3. Skupine zaposlenika prema vremenu utrošenom za montažu brodskog motora
BROJ
UTROŠENIH
SATI
SKUPINA
ZAPOSLENIKA
1 800 A
2 000 B
2 100 Ĉ
2 200 D
2 300 E
2 500 F
Izvor: Prema predavanjima J. Ĉaval
TABELA 4. Razdioba dana za rujan, listopad, studeni i prosinac 2001. godine prema
broju telefonskih poziva dnevno
Broj
poziva
dnevno
0 1 2 3 4 5 6 7 8 9 10 11 12
Broj dana 6 13 26 19 17 14 7 3 4 4 2 3 2
Izvor: Ispis poziva HT odabranog pretplatnika
TABELA 5. Prevezena roba u cestovnom prometu Republike Hrvatske u 2000. godini
prema udaljenosti
UDALJENOST
(u km)
PREVEZENA
ROBA
(u 000 tona)
do 24 934,2
25 – 49 1 178,1
50 – 149 794,0
150 – 299 783,7
300 – 499 579,6
500 – 699 166,7
700 – 999 226,7
preko 1000 209,1
UKUPNO 4 872,1
Napomena: Podaci o prevezenoj robi prikupljeni su od poduzeća ĉija je osnovna djelatnost prijevoz robe, što znaĉi da nije
obuhvaćena ona roba koju prevoze fiziĉke osobe registrirane kao obrtnici.
Izvor: Prijevoz, skladištenje i veze u 2000., str.44.
7
TABELA 6. Prevezeni putnici u gradskom i zračnom prijevozu Republike Hrvatske u razdoblju
od 1991. do 2001. godine
GODINA
BROJ PREVEZENIH
PUTNIKA
Gradski
prijevoz
(u mil.)
Zraĉni
prijevoz
(u tisućama)
1991. 427,4 139
1992. 419,1 238
1993. 415,3 507
1994. 418,7 661
1995. 411,7 679
1996. 393,4 824
1997. 395,5 866
1998. 379,7 920
1999. 386,0 926
2000. 389,3 1 072
2001. 398,5 1 245
Napomena: Broj putnika u gradskom prijevozu obuhvaća broj prevezenih putnika u tramvajima i autobusima. Broj putnika u
zraĉnom prijevozu obuhvaća putnike prevezene u domaćem i meĊunarodnom prijevozu.
Izvor: SLJH-97, str. 290., Prijevoz, skladištenje i veze u 1999., str. 54, Prijevoz, skladištenje i veze u 2001., str. 51.,
SLJH-00, str. 303., SLJH-02, str. 319.
TABELA 7. Svjetska kontejnerska flota u razdoblju od 1992. do 2001. godine – stanje
krajem godine
GODINA BROJ
BRODOVA
TEU
(u 000)
1992. 1414 1 957,6
1993. 1461 2 114,5
1994. 1603 2 367,0
1995. 1763 2 688,8
1996. 1949 3 072,1
1997. 2187 3 585,7
1998. 2382 4 046,5
1999. 2457 4 278,7
2000. 2590 4 720,2
2001. 2756 5 314,7
Izvor: World Fleet Statistics, Lloyd’s Register, 1992. – 2001.
8
VJEŢBA 1. Statistička tabela
Zadatak 1.1. Je li svaka statistiĉka masa masovna pojava i obrnuto? Objasniti pojmove
masovna pojava i statistiĉka masa na odabranim primjerima.
Zadatak 1.2. Za tabele od 1. do 7. odrediti statistiĉke mase koje su predmet statistiĉke analize,
statistiĉke jedinice te obiljeţje ili obiljeţja prema kojima su grupirane statistiĉke
jedinice.
Zadatak 1.3. Navesti neka obiljeţja jedne zaposlene osobe i grupirati ih prema vrstama
statistiĉkog obiljeţja. O kojoj se vrsti statistiĉkog niza radi ako se u tabeli nalaze
podaci o osobama zaposlenim u Republici Hrvatskoj u 2000. godini prema
djelatnostima, odnosno o zaposlenim osobama u Republici Hrvatskoj u
razdoblju od 1990. do 2000. godine ?
Analogno objasniti sluĉaj da su na raspolaganju podaci o zaposlenim osobama u
2000. godini po ţupanijama Republike Hrvatske.
Zadatak 1.4. Opisati faze rada koje treba provesti da bi se dobila odgovarajuća statistiĉka
tabela. Za ilustraciju uzeti tabele 1. i 2.
Zadatak 1.5. Opisati postupak sastavljanja statistiĉke tabele: odreĊivanje naslova, broja
redaka i stupaca, zbrojnog retka ili stupca, navoĊenje izvora, opaske ili
napomene.
Objasniti osnovnu podjelu tabele na tekstualni dio (predstupac i zaglavlje tabele)
i brojĉani dio (m x n polja u kojima se nalaze frekvencije, odnosno broj
statistiĉkih jedinica koje pripadaju nekom retku i nekom stupcu tabele).
Objasniti sadrţaj pojedinih oznaka koje se nalaze u poljima tabele umjesto
frekvencija.
Zadatak 1.6. Iz tabela 1. do 7. odrediti vrstu statistiĉke tabele, vrstu statistiĉkog niza te,
koristeći prethodna objašnjenja, objasniti odgovore.
■
9
RJEŠENJA.
1.1. Masovna pojava je širi pojam od statistiĉke mase, jer je statistiĉka masa ona masovna
pojava koja je odabrana za predmet statistiĉkog istraţivanja. Primjeri za statistiĉke mase su:
zaposleni u Republici Hrvatskoj, promet u tonama po lukama, zaposleni prema broju
utrošenih sati, tone tereta prema udaljenosti, prevezeni putnici po granama prijevoza,... .
1.2. Svaka statistiĉka masa sadrţi konaĉan ili beskonaĉan broj statistiĉkih jedinica koje su
grupirane prema jednom ili više statistiĉkih obiljeţja, ovisno o ĉemu formira odgovarajuću
vrstu statistiĉkoga niza.
Red.
broj
1. stat.masa 2. stat. masa 1. stat.
obiljeţje
2. stat.
obiljeţje
Vrsta
stat. niza
Vrsta
tabele
1. zaposleni BDP u mil. djelatnost − atributivni sloţena
2. tone tereta − luke pravci
kretanja
geografsko-
atributivni
kombinirana
3. skupine
zaposlenika
− broj
utrošenih
sati
−
numeriĉki jednostavna
4. dani − broj poziva
dnevno
− numeriĉki jednostavna
5. tone tereta − udaljenost
u km
− numeriĉki jednostavna
6. putnici u
gradskom
putnici u
zraĉnom pr.
godine − vremenski
(intervalni)
sloţena
7. brodovi TEU u 000 godine − vremenski
(trenutaĉni)
sloţena
1.3. Obiljeţje jedne zaposlene osobe u RH:
- djelatnost (A)
- razdoblje od 1990. do 2000. godine (V)
- ţupanije RH (G)
- spol (A)
- struĉna sprema (A)
- godine starosti (N)
- godine radnog staţa (N), .....
1.4. Statistiĉka tabela je skup podataka poredanih u odreĊenom broju redaka i stupaca. Da bi
se dobila odgovarajuća statistiĉka tabela potrebno je:
- definirati statistiĉku masu i obiljeţje koje će biti predmet statistiĉkog promatranja; statistiĉka
masa se definira prostorno, vremenski i pojmovno.
- pisanim ili usmenim putem prikupiti informacije o svakoj statistiĉkoj jedinici promatrane
statistiĉke mase
- prikupljene informacije grupirati prema zadanom obiljeţju; grupiranjem informacija dobiva
se statistiĉki podatak
- statistiĉki podaci se unose u tabelu u odgovarajuće polje ovisno o retku i stupcu tabele.
1.5. Postupak sastavljanja tabele- prema shemi 2. na stranici 4.
10
1.6. Tabela se sastoji od tekstualnog dijela, i to :
- zaglavlja u kojem se objašnjava što predstavljaju brojevi u stupcima i
- pretkolone ( predstupca) u kojoj je objašnjeno što znaĉe brojevi u pojedinim retcima tabela.
1.7. – nema pojave
0 frekvencija je manja od 0.5
... ne raspolaţe se podatkom
Ø prosjeĉna vrijednost frekvencije
1) oznaka za napomenu (opasku) ispod tabele.
1.8. Rješenje je dano u 1.2. ■
11
2. ANALIZA ATRIBUTIVNIH I GEOGRAFSKIH
NIZOVA
Atributivni i geografski nizovi se dobivaju grupiranjem statistiĉkih jedinica prema
atributivnom, odnosno geografskom obiljeţju. Radi preglednosti takvi se nizovi prikazuju
statistiĉkim tabelama odgovarajućeg oblika.
Analiza navedenih vrsta nizova obuhvaća grafiĉko prikazivanje i izraĉunavanje
relativnih brojeva za podatke koji se nalaze u tim tabelama.
2.1. Grafičko prikazivanje
Prednosti i nedostaci grafičkih prikaza – vrste grafičkih prikaza – površinski grafikoni
– stupci – kvadrati – krugovi – polukrugovi – kartogrami – dijagramska karta –
piktogram – statistička karta.
Grafiĉki prikaz podataka jednog ili više nizova iz statistiĉke tabele ima niz prednosti
od kojih je najvaţnija da se grafikonom moţe postići jasna, zorna slika o promatranoj pojavi
te brzo uoĉavanje njezinih znaĉajki i meĊusobnih odnosa pojedinih podataka.
Grafiĉki prikaz ima i nedostataka, izmeĊu ostalog, da grafikon nikad ne moţe dostići
toĉnost podataka iz statistiĉke tabele. MeĊutim, prednosti su znatno veće od nedostataka pa
se, zahvaljujući razvoju osobnih raĉunala i programske podrške, za grafiĉki prikaz kaţe da
“govori više od tisuću rijeĉi” Petz.
Grafičko prikazivanje atributivnih nizova
Atributivni se nizovi prikazuju grafiĉki površinskim grafikonima u kojima su
statistiĉke jedinice (frekvencije) predstavljene odgovarajućim površinama odabranih
geometrijskih likova.
Vrste površinskih grafikona su:
Površinski grafikon pomoću stupaca: jednostavnih
razdijeljenih (strukturnih)
dvostrukih
Površinski grafikon pomoću kvadrata
Površinski grafikon pomoću kruga i sektora kruga
Površinski grafikon pomoću polukruga i sektora polukruga.
Stupci se ucrtavaju u grafikon s pravokutnim koordinatnim sustavom, a ostali
geometrijski likovi: kvadrati, krugovi i polukrugovi u grafikon bez koordinatnog sustava.
Pravokutnici imaju jednake baze pa se frekvencije mogu usporeĊivati prema visini stupca.
12
Jednostavni stupci se koriste za prikazivanje frekvencija jedne statistiĉke mase.
Primjerice, grafiĉki prikaz broja zaposlenih u privredi Republike Hrvatske u 2000. godini
prema djelatnostima.
Razdijeljeni stupci se primjenjuju za prikazivanje ukupne frekvencije i parcijalnih
frekvencija koje su dio ukupne frekvencije jedne statistiĉke mase. Primjerice, grafiĉki prikaz
broja zaposlenih u privredi Republike Hrvatske u 2000. godini prema djelatnostima i spolu.
Visina stupca prikazuje ukupan broj zaposlenih, a posebno oznaĉena površina unutar stupca
broj muškaraca, odnosno ţena.
Dvostruki stupci su naĉin prikazivanja frekvencija dviju ili više pojava izraţenih u
istim jedinicama mjere ili za sluĉajeve umjesto razdijeljenih stupaca. Primjerice, broj
zaposlenih u privredi i neprivredi Republike Hrvatske u 2000. godini prema djelatnostima ili
za prethodni primjer prikaza zaposlenih muškaraca i ţena.
Kvadrati se koriste u sluĉaju kad se usporeĊuje manji broj frekvencija (dvije do tri).
Površina kvadrata odreĊena je stranicom
a P , 1
gdje P oznaĉava frekvenciju koja se prikazuje kvadratom. Pritom je vaţno odabrati
odgovarajuće mjerilo (s kojim se frekvencija P podijeli) kako bi stranica kvadrata a
odgovarala predviĊenoj veliĉini grafikona. Primjerice, ako se za grafiĉki prikaz ukupnog broja
zaposlenih u privredi Republike Hrvatske u 1999. i 2000. godini odabere mjerilo: 1 cm2
= 40
000 zaposlenih, tada će broj zaposlenih u Republici Hrvatskoj u 1999. godini biti prikazan
kvadratom sa stranicom od 4,22 cm, a u 2000. godini sa stranicom kvadrata od 4,19 cm.
Krugovi su naĉin prikazivanja podataka u sluĉajevima analognim kvadratu ali s
prednošću pred kvadratom jer se sektorima kruga moţe grafiĉki prikazati i struktura pojave.
Veliĉina kruga odreĊena je polumjerom
r P / . 2
Mjerilo se odabire prema veliĉini frekvencije koja se prikazuje krugom P te veliĉini
grafikona. Sektor kruga, izraţen brojem stupnjeva sektora kruga, izraĉuna se na sljedeći naĉin
x = (dio / cjelina) 360 . 3
Primjerice, za prethodni primjer broj zaposlenih jedne godine predstavljen je
odgovarajućom površinom kruga, a broj zaposlenih pojedine djelatnosti odgovarajućim
sektorom kruga.
Polukrugovi se koriste u sluĉajevima analognim kvadratu i krugu, ali najĉešće kad je
rijeĉ o samo dva polukruga. Ako su frekvencije obje pojave izraţene u istim jedinicama mjere
(broj zaposlenih u 1999. i 2000. godini) tada su polukrugovi s nejednakim polumjerom
zavisno od veliĉine frekvencije (jer se odabire jedno mjerilo za oba polukruga), a u obrnutom
sluĉaju kad su frekvencije dviju pojava izraţene u razliĉitim jedinicama mjere (broj
zaposlenih i bruto domaći proizvod), tada jedno mjerilo ne moţe vrijediti za obje pojave pa se
uzimaju dva polukruga s jednakim, proizvoljno velikim polumjerom. U tom sluĉaju polukrug
13
ne prikazuje veliĉinu pojave, ali sektori polukrugova prikazuju strukturu obje pojave prema
odabranom obiljeţju (djelatnosti).
Broj stupnjeva sektora polukruga izraĉunava se prema formuli
x = (dio / cjelina) 180 4
Naĉin odabira te izradba pojedine vrste navedenih grafiĉkih prikaza dani su u
rješenjima vjeţbe 2.1., koja se odnosi na grafiĉko prikazivanje atributivnih i geografskih
nizova.
Grafičko prikazivanje geografskih nizova
Geografski se nizovi grafiĉki prikazuju u svim oblicima površinskih grafikona
navedenim za atributivne nizove te još jednom vrstom površinskih grafikona koji se nazivaju
kartogramima.
Kartogram je geografska karta u kojoj su frekvencije predstavljene odgovarajućim
površinama odabranih geometrijskih likova ili odabranih znakova, odnosno šrafura razliĉitog
intenziteta. Prednost kartograma u odnosu na prethodno objašnjene površinske grafikone je u
ĉinjenici da kartogram zorno prikazuje geografsku (prostornu) razdiobu promatrane pojave.
Razlikuju se tri vrste kartograma:
Dijagramska karta – vrsta kartograma u kojem su frekvencije promatrane pojave
prikazane odgovarajućim površinama pravokutnika (stupaca), kvadrata, kruga ili polukruga.
Ova vrsta kartograma preporuĉuje se u sluĉajevima prikazivanja manjeg broja statistiĉkih
jedinica (frekvencija) geografskog niza. Naĉin izraĉunavanja tih površina objašnjen je u dijelu
o grafiĉkom prikazivanju atributivnih nizova.
Primjerice, promet roba u hrvatskim lukama u 2002. godini po pravcima kretanja
moţe se prikazati tako da se na karti jadranske obale oznaĉe luke i na tom mjestu ucrtaju
odgovarajući krugovi i sektori kruga kojima je predoĉen ukupan promet pojedine luke i udio
pojedinih pravaca kretanja.
Piktogram – vrsta kartograma u kojem se frekvencije prikazuju pomoću znakova tako
da se proizvoljno odabrani znak za odreĊeni broj jedinica ucrtava na površinu pripadajuće
geografske grupe. Ova vrsta grafikona veoma je ilustrativna za prikazivanje nizova s velikim
brojem geografskih grupa.
Primjerice, ako jedna toĉka oznaĉava 100 automobila onda na podruĉju općine koja
ima 10000 registriranih automobila bit će ucrtano 100 toĉkica.
Statistička karta – vrsta kartograma u kojem se frekvencije prikazuju šrafurama ili
bojama razliĉitog intenziteta. Ova vrsta grafikona preporuĉuje se u sluĉajevima kad
geografski niz ima veliki broj grupa, a frekvencije nisu apsolutni, već relativni brojevi.
Primjerice: veliĉina opasnosti od poţara, postotak nepismenih, postotak glasaĉa koji su
izašli na birališta, dubina mora, … .
14
U praksi se mogu koristiti razliĉite kombinacije navedenih grafiĉkih prikaza,
primjerice: dvostruki razdijeljeni stupci, trostruki stupci, i sliĉno, i to je opravdano ako
grafikon na ispravan i jasan naĉin prikazuje podatke iz statistiĉke tabele i omogućuje
donošenje zakljuĉaka o znaĉajkama promatrane pojave. Isto tako, neki grafiĉki prikazi
navedeni za atributivne i geografske nizove mogu se takoĊer koristiti i za numeriĉke i
vremenske nizove. Takvi sluĉajevi navedeni su u zadacima za vjeţbu u sljedećim
poglavljima.
15
VJEŢBA 2.1. Grafičko prikazivanje atributivnih i geografskih nizova
Zadatak 2.1.1. Grafiĉki prikazati broj zaposlenih u privredi Republike Hrvatske u 2000.
godini prema djelatnostima (podaci iz tabele 1.). Koji zakljuĉak proizlazi iz
grafikona?
Zadatak 2.1.2. Grafiĉki prikazati broj zaposlenih u privredi Republike Hrvatske u 2000.
godini prema djelatnostima i spolu. Usporediti moguće varijante grafiĉkog
prikaza.
Zadatak 2.1.3. Ukupan broj zaposlenih u privredi Republike Hrvatske u 1999. godini iznosio
je 712 771 osobu, a u 2000. godini 703 437 osoba. Prikazati ove dvije
frekvencije odgovarajućim grafikonom. Usporediti moguće varijante grafiĉkog
prikazivanja.
Zadatak 2.1.4. Broj zaposlenih u privredi Republike Hrvatske u 1999. godini prema
djelatnostima iznosio je prema SLJH-2000., str. 120., 175.:
Djelatnost Broj zaposlenih
Poljoprivreda, lov i šumarstvo 30 968
PreraĊivaĉka industrija 259 120
Opskrba elektriĉnom energijom,
plinom i vodom 26 944
GraĊevinarstvo 65 537
Trgovina na veliko i na malo 134 115
Hoteli i restorani 35 482
Prijevoz, skladištenje i veze 80 627
Financijske i druge usluge 70 734
Ostalo 9 244
Na temelju podataka za 1999. godinu i podataka iz tabele 1. za 2000. godinu
grafiĉki prikazati strukturu zaposlenih prema djelatnostima. Usporediti
strukturu zaposlenih u 2000. godini sa strukturom zaposlenih u 1999. godini.
Zadatak 2.1.5. Grafiĉki prikazati broj zaposlenih i bruto domaći proizvod u privredi
Republike Hrvatske u 2000. godini prema djelatnostima. Usporediti zaposleno
osoblje i bruto domaći proizvod prema pojedinim djelatnostima.
Zadatak 2.1.6. Pomoću odgovarajućih stupaca grafiĉki prikazati promet robe u glavnim
lukama Republike Hrvatske u 2002. godini po pravcima kretanja. Obrazloţiti
dobiveni grafikon.
Zadatak 2.1.7. Kojom bi se vrstom kartograma najbolje prikazali podaci o prometu robe u
lukama Republike Hrvatske u 2002. godini? Konstruirati odgovarajući
grafikon.
16
■
RJEŠENJA.
2.1.1. Grafiĉki prikaz pomoću jednostavnih stupaca.
2.1.2. Grafiĉki prikaz pomoću razdijeljenih (strukturnih) ili dvostrukih stupaca.
2.1.3. Grafiĉki prikaz pomoću dva kruga, svaki krug svojom površinom odgovara veliĉini
frekvencije koju taj krug prikazuje. Zbog toga je potrebno odabrati mjerilo;
primjerice, 1 cm2= 40000 zaposlenih pa je za 1999. godinu r1999 = 4,22 cm, a za 2000. godinu
r2000 = 4,19 cm.
2.1.4. Koristeći grafiĉki prikaz iz zadatka 2.1.3. preporuĉuje se u krugove ucrtati sektore
kruga koji prikazuju strukturu zaposlenih u R Hrvatskoj prema djelatnostima:
A D E F G H I J,K B,C Ukupno
___________________________________________________________________________
1999. 16 131 14 33 68 18 40 35 5 360
2000. 40 100 14 22 49 15 46 70 4 360
___________________________________________________________________________
2.1.5. Zaposleno osoblje i bruto domaći proizvod u privredi R Hrvatske su dvije pojave koje
su izraţene u razliĉitim jedinicama mjere, pa u takvim sluĉajevima statistika predlaţe grafiĉki
prikaz pomoću jednakih krugova ili polukrugova proizvoljne veliĉine, a sektorima kruga,
odnosno polukruga udio pojedine djelatnosti u ukupnom broju zaposlenih u R Hrvatskoj ili
ukupnom iznosu bruto domaćeg proizvoda.
Sektori kruga:
A D E F G H I J,K B,C Ukupno
___________________________________________________________________________
Zap. osoblje 15 129 14 31 70 17 41 38 5 360
BDP 40 100 14 22 49 15 46 70 4 360
__________________________________________________________________________
Sektori polukruga x0
= dio/cjelina*180, pa su sektori polukruga dvostruko manji od navedenih
sektora kruga.
2.1.6. Promet robe u glavnim lukama R Hrvatske u 2002. godini po pravcima kretanja moţe
se prikazati razdijeljenim ili dvostrukim (višestrukim) stupcima.
2.1.7. Podaci iz prethodnog zadatka mogu se prikazati dijagramskom kartom. Potrebno je
odabrati mjerilo koje ovisi o veliĉini grafikona, zatim izraĉunati polumjer kruga za svaku luku
posebno te sektore kruga kojim je prikazan udio pojedinog pravca kretanja.
Sektori kruga:
Dbk Ploĉe Pula Rijeka Split Šibenik Zadar
___________________________________________________________________________
Unutr. promet 355 24 1 98 155 8 40
Izvoz - 1 314 76 123 65 39
Uvoz 2 28 43 81 82 284 281
Tranzit 3 307 2 105 - 3 -
17
___________________________________________________________________________
360 360 360 360 360 360 360
Za ilustraciju je priloţena dijagramska karta koju je izradio izvanredni student
Pomorskog fakulteta kap. Ronald Ruţić (2006.)
■
18
2.2. Relativni brojevi
Pojam apsolutnog broja (frekvencije) – pojam relativnog broja (frekvencije) – vrste
relativnih brojeva – izračunavanje i grafičko prikazivanje relativnih brojeva – postoci
– relativni brojevi koordinacije – indeksi .
Apsolutna frekvencija je broj statistiĉkih jedinica dobiven nakon obavljene faze
statistiĉkog promatranja i grupiranja jedinica prema odabranom obiljeţju.
Primjerice, brojevi o zaposlenima i bruto domaćem proizvodu u tabeli 1. su apsolutne
frekvencije, kao i sve frekvencije u ostalim tabelama od broja 2. do 7.: broj tona tereta u
cestovnom prijevozu, broj prevezenih putnika u gradskom prijevozu, itd.
U praksi se javlja potreba usporeĊivanja apsolutnih frekvencija: broj zaposlenih u
preraĊivaĉkoj industriji s ukupnim brojem zaposlenih, bruto domaći proizvod s brojem
zaposlenih, broj zaposlenih u preraĊivaĉkoj industriji s brojem zaposlenih u djelatnosti
prijevoza, skladištenja i veza, itd. Rezultat takve usporedbe su relativni brojevi.
Relativni broj je broj kojim je izraţen odnos izmeĊu dviju i više apsolutnih
frekvencija:
fr = f1 / f2 . 5
Zavisno od frekvencije koja se nalazi u brojniku i frekvencije iz nazivnika relativnog
broja razlikuju se tri vrste relativnih brojeva: postoci, relativni brojevi koordinacije i
indeksi. Svaka vrsta relativnog broja izraĉunava se i grafiĉki prikazuje odgovarajućim
naĉinom.
Postoci (%)
Postotak je relativan broj koji pokazuje odnos jednog dijela statistiĉkih jedinica prema
ukupnom broju statistiĉkih jedinica promatrane pojave.
Iz definicije da je postotak udio parcijalne frekvencije u ukupnoj frekvenciji slijedi da
se postotak izraĉunava tako da se parcijalna frekvencija (frekvencija koja se usporeĊuje)
podijeli s ukupnom frekvencijom (koja je baza usporedbe):
% = (dio / cjelina) 100 . 6
Primjerice, udio broja zaposlenih u preraĊivaĉkoj industriji u ukupnom broju
zaposlenih u Republici Hrvatskoj u 2000. godini iznosio je 35,7%; udio pojedine luke,
primjerice luke Rijeka u ukupnom prometu svih hrvatskih luka u 2002. godini bio je 56,1%,
odnosno nešto više od polovice cjelokupnog prometa hrvatskih luka, itd.
Postotak teorijski moţe zauzeti vrijednosti u intervalu 0 % 100 , ali u praksi taj
interval glasi: 0 % 100 .
19
3.2. Srednje vrijednosti
Pojam srednje vrijednosti – aritmetička sredina – medijan – mod – prosjek
aritmetičkih sredina – prosjek relativnih brojeva .
Srednja vrijednost numeriĉkog niza je reprezentant pojedinaĉnih vrijednosti
numeriĉkog obiljeţja u promatranom numeriĉkom nizu. Primjerice: iznos sati koji u prosjeku
utroši jedna grupa zaposlenika, prosjeĉan broj telefonskih poziva dnevno, udaljenost u
kilometrima koju prelazi 50% od ukupne koliĉine tereta, i sliĉno.
Aritmetička sredina ( X )
Aritmetiĉka sredina predstavlja prosjeĉnu vrijednost numeriĉkog obiljeţja; to je
vrijednost numeriĉkog obiljeţja koja u prosjeku pripada jednoj statistiĉkoj jedinici.
Izraĉunavanje aritmetiĉke sredine zavisi od tipa numeriĉkog niza i dobiva se
dijeljenjem totala (sume vrijednosti numeriĉkog obiljeţja) s ukupnim brojem statistiĉkih
jedinica ( ukupnom frekvencijom):
Tip I. Jednostavna aritmetiĉka sredina
X
x
N
ii
n
1
Tip II. Vagana (ponderirana) aritmetiĉka sredina
X
f x
f
i ii
n
ii
n
1
1
Tip III. Vagana (ponderirana) aritmetiĉka sredina
X
f x
f
i ii
n
ii
n
1
1
gdje je:
xi = vrijednost numeriĉkog obiljeţja, razredna sredina za III. tip niza, i = 1,…,n
fi = frekvencija, i = 1,…,n .
20
Medijan (M)
Medijan je pozicijska srednja vrijednost koja se odreĊuje prema poloţaju jedinica u
nizu.
Medijan je vrijednost numeriĉkog obiljeţja koja pripada središnjoj jedinici, N/2, tj.
frekvenciji koja dijeli razdiobu na dva jednaka dijela. Medijan je takva vrijednost numeriĉkog
obiljeţja za koju vrijedi da 50 % jedinica ima vrijednost jednaku i manju od medijana, a
preostalih 50% jedinica vrijednost numeriĉkog obiljeţja jednaku i veću od medijana.
OdreĊivanje medijana ovisi o tipu numeriĉkog niza:
Tip I. Oĉita se vrijednost numeriĉkog obiljeţja koja pripada središnjoj jedinici; ako je broj
jedinica paran, onda je medijan prosjek vrijednosti koji pripada dvjema središnjim
jedinicama.
Tip II. Sastavi se kumulativni niz “manje od”, pronaĊe središnja jedinica N/2 i vrijednost koja
pripada središnjoj jedinici je medijan.
Tip III. Sastavi se kumulativni niz “manje od”, pronaĊe N/2 i toj frekvenciji pripadajući
medijalni razred. Za odreĊivanje toĉne vrijednosti medijana koristi se sljedeća formula
1
1
med
/ 2N fM L i
f
gdje je:
N/2 – središnja jedinica
L1 – donja granica medijalnog razreda
i – veliĉina medijalnog razreda
f med – frekvencija medijalnog razreda
f 1– suma svih frekvencija do medijalnog razreda.
Medijan se moţe odrediti i grafiĉkim putem da se u pravokutnom koordinatnom
sustavu unesu frekvencije kumulativnog niza “manje od”, na osi y oznaĉi središnja jedinica
N/2, zatim povuĉe paralela s osi x do kumulante i u sjecištu s linijom kumulativnog niza
spusti okomica do osi x. Ta vrijednost na osi apscise je vrijednost medijana.
Mod (Mo)
Mod je vrijednost numeriĉkog obiljeţja koja pripada najvećoj frekvenciji. Drugim
rijeĉima, mod je najĉešća vrijednost numeriĉkog obiljeţja u nizu.
Mod se ne moţe odrediti za razdiobe u kojoj su sve frekvencije meĊusobno jednake
(tip I.). Ako razdioba ima dva jednaka vrha (bimodalna razdioba) tada se oĉitaju dvije
vrijednosti moda.
21
OdreĊivanje moda ovisi o tipu numeriĉkog niza:
Tip I. Nema moda
Tip II. Oĉita se vrijednost numeriĉkog obiljeţja koja pripada najvećoj frekvenciji.
Tip III. PronaĊe se najveća frekvencija; razred koji joj pripada je modalni razred. Toĉna
vrijednost moda dobije se prema formuli
1( ) ( )
o
b aM L i
b a b c
gdje je:
oM – mod
b – najveća frekvencija u nizu (korigirana kod nejednakih razreda)
a – frekvencija iznad b
c – frekvencija ispod b
L1 – donja granica modalnog razreda
i – veliĉina modalnog razreda.
Mod se moţe odrediti i grafiĉkim putem: to je vrijednost numeriĉkog obiljeţja koja se
dobije spuštanjem okomice iz vrha krivulje na os x.
Prosjek aritmetičkih sredina ( X )
Prosjek aritmetiĉkih sredina je aritmetiĉka sredina aritmetiĉkih sredina i izraĉunava se
kao vagana aritmetiĉka sredina srednjih vrijednosti
1
1
k
i i
i
k
i
i
X N
X
N
gdje je :
X – prosjek aritmetiĉkih sredina
1,..., kX X – aritmetiĉke sredine
N1, ..., Nk – broj jedinica iz kojih su izraĉunate aritmetiĉke sredine
Prosjek postotaka ( P )
Prosjeĉan postotak izraĉunava se ili harmonijskom ili aritmetiĉkom sredinom . Vagana
aritmetiĉka sredina se koristi kad su zadani postoci (P) i ukupne frekvencije (C), tj.
frekvencije koje se nalaze u nazivniku pri izraĉunavanju postotaka
22
1
1
k
i i
i
k
i
i
PC
P
C
gdje je:
P – prosjek postotaka
P1, ..., Pk – postoci
C1, ..., Ck – ukupne frekvencije.
Prosjek relativnih brojeva koordinacije ( R )
Analogno prethodnim srednjim vrijednostima prosjek relativnih brojeva kkoordinacije
dobiva se po formuli za vaganu sredinu
1
1
k
i i
i
k
i
i
R B
R
B
gdje je :
R – prosjek relativnih brojeva koordinacije
R1, ..., Rk – relativni brojevi koordinacije
B1, ..., Bk – baze relativnog broja koordinacije.
23
VJEŢBA 3.2. Srednje vrijednosti
Zadatak 3.2.1. Izraĉunati total za vrijednosti numeriĉkih obiljeţja zadanih u tabelama 3., 4. i
5. Postoje li razlike u izraĉunavanju totala za pojedine tipove numeriĉkog niza?
Zadatak 3.2.2. Koliko iznosi broj sati koji je u prosjeku potreban jednoj skupini zaposlenika
za montaţu brodskog motora (tabela 3.)? Koje skupine zaposlenika utroše
manje, a koje više vremena od prosjeka?
Zadatak 3.2.3. Na temelju podataka iz tabele 4. izraĉunati prosjeĉan broj telefonskih poziva
po jednom danu. Koliki je udio dana s brojem poziva manjim od prosjeka, a
koliki s većim brojem poziva od prosjeka? Po ĉemu se izraĉunavanje prosjeka
u ovom zadatku razlikuje od izraĉunavanja u zadatku 3.2.2.?
Zadatak 3.2.4. Ako udaljenost koju prelazi jedna tona tereta u cestovnom prijevozu Republike
Hrvatske u 2000. godini poprima vrijednosti od 0 do 1500 km, kolika je
udaljenost koju prelazi u prosjeku jedna tona? Na koliko se naĉina moţe
izraĉunati traţena vrijednost? Provjeriti je li se, bez obzira na metodu, uvijek
dobiva isti rezultat.
Zadatak 3.2.5. Ako jednaki broj skupina zaposlenika utroši manje ili više sati u odnosu na
neku vrijednost numeriĉkog obiljeţja, kako se zove takva srednja vrijednost?
Koliko ona iznosi za podatke u tabeli 3.?
Zadatak 3.2.6. Koliki broj telefonskih poziva ostvaruje 50% od ukupnog broja dana u tabeli
4., a koliki broj poziva najveći broj dana? Traţene vrijednosti moguće je oĉitati
iz grafikona. Usporediti rezultate.
Zadatak 3.2.7. Koju udaljenost prelazi 50% od ukupne koliĉine tereta u cestovnom prijevozu
Republike Hrvatske u 2000. godini? O kojoj je srednjoj vrijednosti rijeĉ?
Rezultat provjeriti na grafikonu.
Zadatak 3.2.8. Zašto nije moguće odrediti u tabeli 3. broj sati koji je utrošio najveći broj
skupina zaposlenika? Je li bi to bilo moguće kada bi frekvencije u tabeli 3.
iznosile 2,2,2,2,2,2 ili 1,1,2,1,2,1? Objasniti pojedine sluĉajeve.
Zadatak 3.2.9. Izraĉunati udaljenost u kilometrima koju prelazi najveći broj tona tereta u
cestovnom prijevozu Republike Hrvatske u 2000. godini. Rezultat provjeriti na
grafikonu.
Zadatak 3.2.10.Usporediti rezultate dobivenih srednjih vrijednosti za nizove iz tabela 3., 4. i
5. U kakvom su odnosu pojedine srednje vrijednosti s obzirom na njihov
poredak na osi x ? Utjeĉe li poredak srednjih vrijednosti na osi x na oblik
krivulje? Objasniti to na zadanim primjerima.
Zadatak 3.2.11.Prosjeĉno ostvarenje norme u jednom poduzeću za ĉetiri radne jedinice
iznosilo je: 98,7%, 102%, 85,6% i 94,9%. Broj zaposlenih po jedinicama
iznosio je: 141, 98, 120 i 100 zaposlenih. Izraĉunati prosjeĉno ostvarenje
24
norme u promatranom poduzeću. U kojim se jedinicama norma ostvaruje
ispod, a u kojima iznad prosjeka poduzeća?
Zadatak 3.2.12.Za tri poduzeća raspoloţivi su ovi podaci:
Poduzeće
Broj
zaposlenih
Prosjeĉna
plaća
u kunama
Nabavna
vrijednost osnov.
sredst. u 000 kn
% amortizacije od
nab.vrijed.
A 278 2020 1520 40
B 90 3010 3650 55
C 132 2150 4870 27
Prema I. Šošić Uvod u statistiku, 2002., str. 43.
Za promatrana poduzeća izraĉunati:
1) prosjeĉan iznos plaće u kunama po jednoj zaposlenoj osobi,
2) prosjeĉan postotak amortizacije,
3) prosjeĉan iznos nabavne vrijednosti u kunama po jednoj zaposlenoj osobi.
■
25
RJEŠENJA.
3.2.1. Total je zbroj vrijednosti numeriĉkoga obiljeţja; za numeriĉke nizove tipa I. iznosi X , a za ostale
tipove II. i III. fX :
X = 12900 sati
fX = 468 poziva
fX = 1 097 518,7 km.
3.2.2. X = 2150 sati
3.2.3. X = 3,9 telefonskih poziva dnevno; za tip II. numeriĉkog niza potrebno je primijeniti vaganu
(ponderiranu) aritmetiĉku sredinu.
3.2.4. X = 225,27 km; taj se rezultat moţe dobiti pomoću vagane aritmetiĉke sredine i pomoću metode linearne
transformacije obiljeţja ( koja se ne obraĊuje na predavanjima ).
3.2.5. Medijan iznosi M = 2150 sati.
3.2.6. M = 3 poziva, Mo = 2 poziva dnevno. Navedene srednje vrijednosti mogu se oĉitati iz grafikona; mod
spuštanjem okomice s vrha krivulje na os x, a medijan iz grafiĉkog prikaza kumulativnog niza.
3.2.7. M = 90,77 km.
3.2.8. Mod se ne moţe odrediti ako razdioba nema vrha; u tabeli 3. jer su sve frekvencije jednake i iznose 1,
takoĊer ako su sve frekvencije jednake i iznose 2. U trećem sluĉaju razdioba ima dva moda, za treću i petu
vrijednost numeriĉkog obiljeţja.
3.2.9. Mo = 29,98 km.
3.2.10.
Tab. 3. X = 2150 sati , M = 2150 sati, Mo = nema ga
Tab. 4. X = 3,9 poziva, M = 3 poziva, Mo= 2 poziva
Tab. 5. X = 225,67 km, M = 90,77 km, Mo= 29,98 km.
Ako je razdioba simetriĉna onda sve tri srednje vrijednosti imaju jednaku vrijednost numeriĉkog obiljeţja; ako
X > M > Mo razdioba je desnostrano asimetriĉna, a u obrnutom sluĉaju ljevostrano asimetriĉna.
3.2.11. X = 95,15 %
3.2.12. Prosjeĉan iznos plaće po jednoj zaposlenoj osobi je prosjek aritmetiĉke sredine X = 2232,52 kn,
prosjeĉan postotak amortizacije je prosjek postotaka P = 39,15 %, a prosjeĉan iznos nabavne vrijednosti/1
zaposlenoj osobi je prosjek relativnih brojeva koordinacije R = 20 080 kn.
■
26
3.3. Mjere disperzije
Pojam disperzije – mjere disperzije – vrste mjera disperzije – raspon varijacije –
varijanca, standardna devijacija – koeficijent varijacije – interkvartil – koeficijent
kvartilne devijacije – momenti .
Disperzija je pojam za raspršenost ĉlanova numeriĉkog niza od neke srednje
vrijednosti.
Mjere disperzije su veliĉine kojim se utvrĊuje veliĉina raspršenosti ĉlanova
numeriĉkog niza od neke srednje vrijednosti, odnosno utvrĊuje reprezentativnost srednjih
vrijednosti.
Apsolutne mjere disperzije su izraţene u istim jedinicama mjere kao i numeriĉko
obiljeţje. To su: raspon varijacije, varijanca, standardna devijacija, interkvartil. Njihov je
nedostatak što ne omogućuju usporedbu disperzije raznorodnih nizova.
Relativne mjere disperzije izraţene su u relativnim brojevima: koeficijent varijacije,
koeficijent kvartilne devijacije.
Raspon varijacije (R) je interval izmeĊu najveće i najmanje vrijednosti numeriĉkog
obiljeţja
R = xmax - xmin .
Varijanca (2) je aritmetiĉka sredina kvadrata odstupanja vrijednosti numeriĉkog
obiljeţja od njihove aritmetiĉke sredine. Izraţena je u istim jedinicama mjere kao i numeriĉko
obiljeţje.
Standardna devijacija ()
Standardna devijacija je prosjeĉno odstupanje pojedinaĉnih vrijednosti numeriĉkog
obiljeţja od aritmetiĉke sredine.
Ako je odstupanje maleno to ukazuje na malu raspršenost, odnosno disperziju ĉlanova
numeriĉkog niza od aritmetiĉke sredine iz ĉega slijedi dobra reprezentativnost aritmetiĉke
sredine. U obrnutom sluĉaju kad je disperzija velika, reprezentativnost aritmetiĉke sredine je
slaba.
Standardna devijacija se izraĉunava zavisno od tipa numeriĉkog niza:
Tip I.
2
1
( )N
i
i
x X
N
27
Tip II.
2
2
1 1
1 1
n n
i i i i
i i
n n
i i
i i
f x f x
f f
Tip III.
2
2
1 1
1 1
n n
i i i i
i i
n n
i i
i i
f x f x
f f
gdje je:
– standardna devijacija
N – ukupan broj jedinica
xi – vrijednost numeriĉkog obiljeţja (ako je obiljeţje u razredima tada xi oznaĉava razrednu
sredinu, i=1,...,n)
X – aritmetiĉka sredina
fi – frekvencija, i=1,...,n
Koeficijent varijacije (V) je relativna mjera disperzije izraţena u % koja se
izraĉunava prema formuli
V = / X 100 .
Veći koeficijent varijacije pokazuje veću raspršenost, odnosno manju
reprezentativnost aritmetiĉke sredine. Koeficijent varijacije moţe i prijeći vrijednost 100% u
sluĉajevima kad se radi o veoma heterogenom nizu.
Interkvartil (Q3 – Q1)
Interkvartil je razlika izmeĊu gornjeg i donjeg kvartila. To je mjera disperzije kojom
se utvrĊuje reprezentativnost medijana kao srednje vrijednosti.
Donji kvartil (Q1) je vrijednost numeriĉkog obiljeţja za koju vrijedi da 25% (N/4)
jedinica u nizu ima vrijednost numeriĉkog obljeţja jednaku ili manju od donjeg kvartila i 75%
(3N/4) jedinica vrijednosti numeriĉkog obiljeţja jednaku ili veću od donjeg kvartila.
Gornji kvartil (Q3) je vrijednost numeriĉkog obiljeţja za koju vrijedi da 75% (3N/4)
jedinica u nizu ima vrijednost numeriĉkog obljeţja jednaku ili manju od gornjeg kvartila i
25% (N/4) jedinica s obiljeţjem jednakim ili većim od gornjeg kvartila.
Iz prethodnog proizlazi da je raspon izmeĊu donjeg i gornjeg kvartila interval unutar
kojeg se kreće vrijednost numeriĉkog obiljeţja za 50% jedinica u nizu i da se izmeĊu Q1 i Q3
nalazi medijan. Što je raspon izmeĊu donjeg i gornjeg kvartila manji, medijan je
reprezentativniji jer je zgusnutost oko medijana veća, i obrnuto.
28
Izraĉunavanje interkvartila je analogno izraĉunavanju medijana, samo što se za donji
kvartil Q1 polazi od N/4 jedinica, a za Q3 od 3N/4 jedinica.
Za treći tip numeriĉkog niza koriste se formule:
3 1
1
1 1
kvart
1
3 1
kvart
/ 4
3 / 4
QI Q Q
N fQ L i
f
N fQ L i
f
gdje je:
IQ – interkvartil
Q1 – donji kvartil
Q3 – gornji kvartil
N – ukupan broj jedinica
L1 – donja granica kvartilnog razreda
1f –zbroj frekvencija u kumulativnom nizu do kvartilnog razreda, ne ukljuĉujući
frekvenciju kvartilnog razreda ( fkvart)
i – veliĉina kvartilnog razreda.
Koeficijent kvartilne devijacije (VQ) je relativna mjera disperzije i zauzima
vrijednosti od 0 do 1
3 1
3 1
Q
Q QV
Q Q
gdje je :
VQ – koeficijent kvartilne devijacije
Q1 – donji kvartil
Q3 – gornji kvartil.
Što je VQ bliţe 0, disperzija je manja a medijan reprezentativniji, i obrnuto.
Momenti su odstupanja vrijednosti numeriĉkog obiljeţja od aritmetiĉke sredine
podignutih na neku potenciju. Budući da se momenti koriste pri izraĉunavanju mjera
asimetrije bit će objašnjeni u poglavlju 3.4.
29
VJEŢBA 3.3. Mjere disperzije numeričkih nizova
Zadatak 3.3.1. Ĉemu sluţe mjere disperzije? Kada se izraĉunavaju i u kojim se sluĉajevima
primjenjuju? Koja je razlika izmeĊu apsolutnih i relativnih mjera disperzije?
Zadatak 3.3.2. Koliki je raspon varijacije za numeriĉka obiljeţja u tabelama 3., 4. i 5.? Je li
moguće usporeĊivati raspon varijacije zadanih numeriĉkih nizova? Što znaĉi
raspon varijacije od 10000 kuna?
Zadatak 3.3.3. Za numeriĉke nizove u tabelama 3., 4. i 5. izraĉunati prosjeĉno odstupanje od
aritmetiĉke sredine. O kojoj mjeri disperzije je rijeĉ? Što se moţe zakljuĉiti za
aritmetiĉke sredine promatranih nizova?
Zadatak 3.3.4. Na koje je naĉine moguće izraĉunati standardnu devijaciju za tabelu 5.? U
kojim je jedinicama izraţena standardna devijacija za zadani primjer?
Provjeriti da se moţe doći do istog rezultata na dva naĉina. Usporediti
prednosti i nedostatke pojedinog naĉina izraĉunavanja standardne devijacije.
Zadatak 3.3.5. Je li moguće usporediti veliĉinu disperzije za zadane nizove u tabelama 3., 4. i
5., a na temelju rezultata iz zadatka 3.3.3.? Kada se koristi koeficijent varijacije
i koliko on iznosi za zadane nizove? Protumaĉiti što znaĉi kada koeficijent
varijacije iznosi 100%. Moţe li koeficijent varijacije biti i veći od 100%?
Zadatak 3.3.6. Grafiĉki odrediti vrijednost interkvartila za numeriĉke nizove u tabelama 3., 4.
i 5. Zašto interkvartil moţe posluţiti kao mjera disperzije? Što znaĉi ako za
neki numeriĉki niz donji kvartil iznosi 25, a gornji 35 godina starosti?
Zadatak 3.3.7. Na temelju grafikona iz zadatka 3.3.6. oĉitati ove vrijednosti:
1) Koliki broj sati utroši 3/4 skupina zaposlenika? Prelazi li ta vrijednost
prosjeĉan iznos utrošenih sati po jednoj skupini i za koliko se % razlikuje?
2) U kojem se intervalu kreće broj telefonskih poziva koji je ostvarila polovica
od ukupnog broja dana?
3) Do koje udaljenosti u kilometrima prelazi 3/4 od ukupne koliĉine tereta?
Odgovara li taj iznos 3/4 intervala u kojem se kreće vrijednost numeriĉkog
obiljeţja, tj. udaljenost?
Zadatak 3.3.8. Koliki je koeficijent kvartilne devijacije za nizove iz tabela 3., 4. i 5.? Što se
moţe zakljuĉiti o reprezentativnosti medijana?
■
30
RJEŠENJA.
3.3.1. Mjere disperzije ispituju reprezentativnost srednjih vrijednosti; apsolutne mjere
disperzije su: raspon varijacije, standardna devijacija i interkvartil, a relativne mjere:
koeficijent varijacije i koeficijent kvartilne devijacije. Apsolutne su izraţene u istim
jedinicama mjere kao i numeriĉko obiljeţje, dok su relativne mjere disperzije izraţene
relativnim brojevima.
3.3.2. Raspon varijacije iznosi:
Tab. 3. 700 sati Tab. 4. 12 poziva Tab. 5. 1500 km.
Raspon varijacije je apsolutna mjera disperzije, zbog toga nije moguće usporeĊivati
disperziju raznorodnih nizova.
Preporuka: ako je raspon varijacije 10000 kuna, u praksi je korisnije navesti donju i
gornju granicu, primjerice, raspon od 20000 do 30000 kuna.
3.3.3. Standardna devijacija ( ) je prosjeĉno odstupanje od aritmetiĉke sredine:
Tab. 3. = 221,74 sati Tab. 4. = 2,76 poziva Tab. 5. = 302,37 km.
3.3.4. Za numeriĉke nizove tipa III. Standardna devijacija se moţe izraĉunavati na dva
naĉina: pomoću produkata fx, fx2 ili metodom linearne transformacije obiljeţja (koja nije
obraĊena na predavanjima). Standardna devijacija je apsolutna mjera disperzije i izraţena je u
istim jedinicama mjere kao i numeriĉko obiljeţje.
3.3.5. Na temelju rezultata iz zadatka 3.3.3. nije moguće usporeĊivati veliĉinu disperzije,
zato se preporuĉa izraĉunavanje odgovarajuće relativne mjere disperzije, a to je koeficijent
varijacije V:
Tab. 3. V = 10,31 % Tab. 4. V = 70,80 % Tab. 5. V = 134,23 %.
Koeficijent varijacije V pokazuje veliĉinu disperzije, odnosno raspršenost ĉlanova niza
u odnosu na X . Što je V veći to je disperzija veća, a reprezentativnost X manja; za V< 50%
X je dovoljno reprezentativna, a za vrijednosti V>50% aritmetiĉka sredina nije dovoljno
reprezentativna. Budući da V = / X 100, vrijednost V moţe prelaziti iznos od 100% i u tom
sluĉaju pokazuje nedovoljnu reprezentativnost aritmetiĉke sredine.
3.3.6. Vrijednosti interkvartila mogu se oĉitati iz grafiĉkog prikaza kumulativnog niza:
N/4 jedinica ima vrijednost numeriĉkog obiljeţja jednaku i manju od donjeg kvartila Q1,
3N/4 jedinica ima vrijednost numeriĉkog obiljeţja jednaku i veću od gornjeg kvartila Q3,
Q3 – Q1 je interkvartil; on predstavlja širinu intervala u kojem se kreće vrijednost numeriĉkog
obiljeţja za 50% od ukupnog broja jedinica. Širi interval pokazuje veću disperziju ĉlanova
numeriĉkog niza u odnosu na medijan, odnosno manju reprezentativnost medijana i obrnuto.
3.3.7. Na temelju grafikona iz zadatka 3.3.6. i prethodnih rezultata slijedi:
31
1) X = 2150 sati, Q3 = 2300 sati; Q3 je veći od aritmetiĉke sredine za 7%.
2) Q3 – Q1 = 5 – 3 = 2 poziva
3) Q3 = 292,123 km. Taj iznos ne odgovara ¾ intervala u kojem se kreće udaljenost u
km; razlog je u ĉinjenici da tone tereta nisu ravnomjerno rasporeĊene prema
udaljenosti od 0 do 1500 km.
3.3.8. Koeficijent kvartilne devijacije iznosi:
Tab. 3. VQ = 0,07 Tab. 4. VQ = 0,43 Tab. 5. VQ = 0,81.
Medijan je reprezentativna srednja vrijednost za podatke u tabelama 3. i 4. MeĊutim,
za tabelu 5. nije dovoljno reprezentativan, ali u usporedbi s koeficijentom varijacije slijedi da
je M ipak reprezentativniji od X .
■
32
3.4. Mjere asimetrije i zaobljenosti
Pojam asimetrije – mjere asimetrije – momenti ( oko sredine, oko nule ) – α3 ( alfa tri )
– Pearsonova mjera asimetrije – Bowleyova mjera asimetrije – mjera zaobljenosti – α4
( alfa četiri )
Asimetrija je pojam suprotan simetriji i pokazuje da se lijevi krak krivulje ne
preklapa s desnim krakom krivulje preko osi simetrije ( okomice s vrha krivulje ).
Mjere asimetrije
Mjere asimetrije su veliĉine kojim se utvrĊuje da li postoji simetrija ili
asimetrija te, u sluĉaju asimetrije, smjer i njezina jaĉina (veliĉina).
Prema smjeru (obliku) asimetrija je ljevostrana (negativna) ili desnostrana
(pozitivna), a prema jaĉini jaka (velika) ili slaba (manja).
Za utvrĊivanje asimetrije koriste se momenti.
Momenti oko sredine ili centralni momenti (µk) predstavljaju aritmetiĉku
sredinu odstupanja vrijednosti numeriĉkog obiljeţja od aritmetiĉke sredine podignutih
na neku potenciju, tj.
µk = N
1
n
i
fi1
( xi– X )k .
Na temelju prvog svojstva aritmetiĉke sredine za pozitivno asimetriĉnu
krivulju µ je veći od 0, za negativno asimetriĉnu krivulju µ je manji od 0, a za
simetriĉnu krivulju µ je jednak 0.
Momenti imaju svoj redni broj, a za mjerenje asimetrije uzima se treći moment
oko sredine µ3. Izraĉunava se pomoću momenata oko nule, jednostavnih ili vaganih,
ovisno o tipu numeriĉkog niza.
Alfa tri (α3) je mjera asimetrije koja se najĉešće koristi, a izraĉunava se
3
3 3
.
Mjera asimetrije α3 zauzima vrijednosti u pravilu u intervalu [–2 +2 ] ovisno
o obliku i jaĉini asimetrije:
33
Izraĉunavanje µ3 prema tipu numeriĉkog niza:
Tip I.
µ3 = N
Xx )( = m3 – 3 m1 m2 + 2 m1
3
2 3 4
1 1 1 1 1
1 2 3 4, , , ,
N N N N Nk
i i i i i
i i i i i
k
x x x x x
m m m m mN N N N N
Napomena: izbrisati formulu za mk i m4 !
gdje je:
X – aritmetiĉka sredina
xi – vrijednost numeriĉkog obiljeţja
N – ukupan broj jedinica
m1 … mn – pomoćni momenti koji se koriste radi lakšeg izraĉunavanja momenata oko sredine;
kod numeriĉkog niza tipa I. radi se o jednostavnim pomoćnim momentima.
Tip II.
µ3 = m3 – 3 m1 m2 + 2 m13
2 3 4
1 1 1 1 1
1 2 3 4
1 1 1 1 1
, , , ,
n n n n nk
i i i i i i i i i i
i i i i i
k k n n n n
i i i i i
i i i i i
f x f x f x f x f x
m m m m m
f f f f f
Napomena: izbrisati formulu za mk i m4 !
m1 … mn – pomoćni momenti; za numeriĉki niz tipa II. izraĉunavaju se vagani pomoćni
momenti
fi – frekvencija
xi – vrijednost numeriĉkog obiljeţja.
34
Tip III. Ako je aritmetiĉka sredina za zadani niz izraĉunata prema formuli 1
1
n
i i
i
n
i
i
f x
X
f
,
standardna devijacija prema formuli
2
2
1 1
1 1
n n
i i i i
i i
n n
i i
i i
f x f x
f f
, treći moment oko
sredine izraĉunava se pomoću vaganih pomoćnih momenata oko nule (kao za tip II.)
tako da se pridruţi kolona fx3:
µ3 = m3 – 3 m1 m2 + 2 m13
2 3 4
1 1 1 1 1
1 2 3 4
1 1 1 1 1
, , , ,
n n n n nk
i i i i i i i i i i
i i i i i
k k n n n n
i i i i i
i i i i i
f x f x f x f x f x
m m m m m
f f f f f
Napomena: izbrisati formulu za mk i m4 !
fi – frekvencija
xi – razredna sredina.
Pearsonova mjera asimetrije (Sk) je mjera asimetrije koja se zasniva na razlici
aritmetiĉke sredine i moda ili na razlici aritmetiĉke sredine i medijana. Zauzima vrijednosti u
intervalu [–3 +3 ] ovisno o obliku krivulje i jaĉini asimetrije:
1
2
3 ( )
o
k
k
X MS
X MS
Taj koeficijent ima vrijednost nula kod simetriĉne razdiobe, veću od nule a pozitivno i
manju od nule za negativno asimetriĉnu razdiobu. Jaka simetrija utjeĉe da se vrijednost Sk
pribliţava vrijednosti +3, odnosno –3.
Bowleyova mjera asimetrije (SkQ) se koristi za mjerenje asimetrije i to odnosa
izmeĊu medijana i kvartila koji se kreće u intervalu [–1 +1 ]
3 1
3 1
2kQ
Q M QS
Q Q
.
Ako je niz simetriĉan, ovaj koeficijent ima vrijednost nula. Što je niz jaĉe pozitivno
asimetriĉan SkQ se pribliţava vrijednosti +1, a kod jako negativno asimetriĉnih nizova
pribliţava se vrijednosti –1.
35
Mjera zaobljenosti (α4)
Mjera zaobljenosti je veliĉina kojom se utvrĊuje zaobljenost promatranog
numeriĉkog niza. Za usporeĊivanje uzima se zaobljenost normalne krivulje za koju vrijedi da
je α4 = 3.
Alfa četiri α4 je mjera zaobljenosti koja se, analogno mjeri asimetrije α3, dobiva po
formuli
4
4 4
;
µ4 je ĉetvrti moment oko sredine koji se izraĉunava pomoću momenta oko nule
µ4 = m4 – 4m1 m3 + 6 m12 m2 – 3 m1
4 .
Izraĉunavanje momenata oko nule ovisi o rednom broju momenta i tipu numeriĉkog
niza, što je objašnjeno kod mjera asimetrije.
Za mjeru zaobljenosti α4 potrebno je dodatno izraĉunati ĉetvrti pomoćni moment oko
nule m4 (uz pretpostavku da su prvi, drugi i treći pomoćni moment izraĉunati kod mjera
asimetrije). Ĉetvrti pomoćni moment se raĉuna kao jednostavni za numeriĉke nizove tipa I. a
vagani za numeriĉke nizove tipa II. i tipa III.:
Upisati formulu!
36
VJEŢBA 3.4. Mjere asimetrije i zaobljenosti
Zadatak 3.4.1. Koja se krivulja naziva simetriĉnom? Kakav oblik poprima krivulja ako nije
simetriĉna? Kako asimetrija utjeĉe na zakljuĉivanje o ponašanju frekvencija s
obzirom na vrijednost numeriĉkog obiljeţja? Što su mjere asimetrije?
Zadatak 3.4.2. Zašto se momenti mogu koristiti za mjerenje asimetrije? Po ĉemu se razlikuju
momenti oko sredine od momenata oko nule? Koji momenti dolaze u obzir pri
izraĉunavanju mjere asimetrije 3? Izraĉunati prvi, drugi i treći moment oko
nule za nizove u tabelama 3., 4. i 5.
Zadatak 3.4.3. Na temelju rezultata iz prethodnog zadatka izraĉunati odgovarajući moment
oko sredine potreban za 3. Prema dobivenoj vrijednosti zakljuĉiti radi li se o
desnostranoj ili ljevostranoj asimetriji.
Zadatak 3.4.4. Koliko iznosi mjera asimetrije 3 za promatrane nizove? Kakav zakljuĉak
proizlazi iz dobivenog rezultata? Što znaĉi ako je 3=0?
Zadatak 3.4.5. Kada se upotrebljava Bowleyova mjera asimetrije? Koje vrijednosti moţe
zauzeti ova mjera? Koliko ona iznosi za niz u tabeli 4.?
Zadatak 3.4.6. Koje su veliĉine uzete u obzir pri mjerenju asimetrije Pearsonovom mjerom
asimetrije? Što znaĉi ako ta mjera za neki niz iznosi +2,0? Izraĉunati
Pearsonovu mjeru asimetrije za niz u tabeli 5. Zakljuĉak o smjeru i jaĉini
asimetrije provjeriti na grafikonu iz zadatka 3.1.6.
Zadatak 3.4.7. Kakav oblik moţe imati razdioba frekvencija s obzirom na zaobljenost? Na
koji se naĉin mjeri zaobljenost? Kako izgleda krivulja ako ima 4=1,8, a kako
ona kojoj je 4=8,35? Napraviti skicu.
Zadatak 3.4.8. Izraĉunati 4 za nizove u tabelama 3., 4. i 5. Po ĉemu se razlikuje
izraĉunavanje? Kako se mogu izraĉunati momenti oko nule za niz u tabeli 5.?
Koristiti oba naĉina radi provjere rezultata. Moţe li 4 biti s negativnim
predznakom (manji od 0)? Obrazloţiti odgovore.
Zadatak 3.4.9. Usporediti za nizove u tabelama 3., 4. i 5. dobivene rezultate srednjih
vrijednosti, mjera disperzije, mjera asimetrije i mjere zaobljenosti. Utvrditi
znaĉajke svake promatrane pojave zasebno. Objasniti specifiĉnosti primjera za
niz iz tabele 3. O kakvom je nizu rijeĉ? Da li rezultati o asimetriji i
zaobljenosti potvrĊuju zakljuĉke dobivene ranije na temelju srednjih
vrijednosti?
■
37
RJEŠENJA.
3.4.1. Krivulja je simetriĉna ako srednje vrijednosti , M i Mo imaju jednaku vrijednost,
odnosno ako se na grafikonu lijevi krak krivulje poklopi s desnim krakom krivulje
preko osi simetrije. Mjere asimetrije utvrĊuju veliĉinu i jaĉinu asimetrije.
3.4.2. Momenti se koriste za mjerenje asimetrije, budući da je ( x – X ) > 0 za pozitivno i
( x – X ) < 0 za negativno asimetriĉnu krivulju. Momenti oko sredine μk su
odstupanja od X , a za α3 se koristi µ3 koji se moţe izraĉunati pomoću momenata oko
nule:
Tab. 3. m1 = 2150 m2 = 4 671 666,66666 m3 = 102555*105
Tab. 4. m1= 3,9 m2= 22,8333 m3 = 171,05
Tab. 5. m1 = 225,27 m2 = 142 171,75 m3 = 129 411 744,17
3.4.3. Tab. 3 µ3 = 0 simetriĉna
Tab. 4. µ3 = 22,538 desnostrano asimetriĉna
Tab. 5. µ3 = 56 194 495,96 desnostrano asimetriĉna
3.4.4. Tab. 3. α3 = 0
Tab. 4. α3 = 1,07
Tab. 5 . α3 = 2,03
3.4.5. Tab. 4. SkQ = 0,333
3.4.6. Tab. 5. Sk1 = 0,646
3.4.7. α4 = 1,8 manje zaobljena od normalne
α4 = 8,35 šiljastija od normalne
3.4.8. Tab. 3. α4 = 2,14
Tab. 4. α4 = 3,72
Tab. 5. α4 = 6,69
3.4.9. Tab. 3. Simetriĉna krivulja sa srednjim vrijednostima u istoj toĉki na osi x; i M su
reprezentativne a krivulja je plosnatija od normalne krivulje.
Tab. 4. Desnostrano asimetriĉna krivulja; > M > Mo.
Tab. 5. Desnostrano asimetriĉna krivulja, vrlo šiljasta. Srednje vrijednosti nisu
dovoljno reprezentativne, jer je velika disperzija. Najviše se tona tereta prevozi na vrlo
kratkim udaljenostima.
■
38
4. ANALIZA VREMENSKIH NIZOVA
4.1. Grafičko prikazivanje formiranje vremenskih nizova
vrste vremenskih nizova
vrste grafiĉkih prikaza
- površinski grafikon (histogram)
- linijski grafikon
korigirane frekvencije
okomiti prekid grafikona
vodoravni prekid grafikona
kumulativni niz
grafiĉko usporeĊivanje dvaju ili više vremenskih nizova.
Vremenski niz se dobiva grupiranjem statistiĉkih jedinica prema vremenskom
obiljeţju, a vremensko obiljeţje je svojstvo statistiĉke jedinice kojim je izraţeno vrijeme na
koje se odnosi statistiĉka jedinica.
Kod vremenskog niza se statistiĉke jedinice oznaĉavaju sa Yi, i = 1,…, N. Vremenska
jedinica moţe biti: 1 godina, 1 dan, 1 sat, 1 petogodišnje razdoblje, … . Razdoblje je širi
pojam od vremenske jedinice i predstavlja skup vremenskih jedinica, razdoblje od 2000. do
2005. godine se odnosi na 2000.,2001., …, do ukljuĉivo 2005. godinu.
Postoje dvije vrste vremenskih nizova: intervalni i trenutaĉni vremenski niz.
Intervalni vremenski niz je vrsta vremenskog niza kod kojeg se frekvencije dobivaju
postepenim zbrajanjem unutar intervala odabrane vremenske jedinice (1 dan, 1 godina,…).
Trenutačni vremenski niz je vrsta vremenskog niza kod kojeg zbrajanje frekvencija
nema realnog smisla pa se frekvencije vremenskog niza, odnosno broj statistiĉkih jedinica
dobiva snimanjem pojave u nekom odreĊenom trenutku (01.sijeĉnja, krajem mjeseca,
sredinom godine,…).
Vrste grafičkih prikaza:
Intervalni vremenski niz: Trenutaĉni vremenski niz:
- površinski grafikon - linijski grafikon
- linijski grafikon
Grafiĉki prikaz putnika u gradskom prijevozu… (zadatak 4.1.):
39
Površinski grafikon je vrsta grafiĉkog prikaza u kojem se stupac podiţe iznad baze
odreĊene vremenske jedinice do visine koja je odreĊena frekvencijom vremenskog niza.
Linijski grafikon je vrsta grafiĉkog prikaza koji predstavlja liniju dobivenu
spajanjem toĉaka kod kojeg je svaka toĉka na grafikonu podignuta nad sredinom vremenske
jedinice (ako je vremenski niz intervalni), odnosno iznad onog mjesta na apscisi koje se
odnosi na trenutak kada je pojava snimljena (ako je vremenski niz trenutaĉni) do visine koja
je odreĊena frekvencijom vremenskog niza.
Korigirane frekvencije su potrebne kada su vremenske jedinice nejednake. One se
izraĉunavaju pomoću sljedeće formule
YY i
ic 0
,
gdje je:
Yc – korigirana frekvencija
i0 – osnovna veliĉina vremenske jedinice na koju se svode sve ostale jedinice
i – veliĉina vremenske jedinice koja pripada frekvenciji Y koja se korigira.
Korigiranje frekvencija dolazi u obzir samo za intervalne vremenske nizove.
Kumulativni niz je niz koji se dobiva postepenim zbrajanjem frekvencija vremenskog
niza, ali on se moţe dobiti samo za intervalni niz jer za trenutaĉni niz to zbrajanje nema
realnog smisla.
Vodoravni prekid grafikona (samo za linijske grafikone): preporuĉa se kad se
frekvencije kreću u jednom intervalu (rasponu), tako da se vodoravnim prekidom na osi y
dobiva veća duljina na ordinati za uţi interval pa se zbog toga postiţe zorniji prikaz kretanja
promatrane pojave.
Okomiti prekid grafikona (za površinske i linijske grafikone): prekid je paralelan s
osi y, a koristi se kada je zadan diskontinuirani niz vremenskih jedinica (1998., 2000.-2002.)
ili kada su vremenske jedinice razliĉite (2002.-2007., a zatim mjeseci 2008.).
Ako je zadan intervalni vremenski niz sa čestim prekidima izmeĎu vremenskih
jedinica tada se preporuĉa površinski grafikon s razmakom izmeĊu stupaca (bez oznake
prekida):
40
Kad god je to moguće u jedan grafikon treba ucrtati frekvencije više pojava (i to
linijskim grafikonom), bilo da su ti vremenski nizovi intervalni ili trenutaĉni, a ne u više
zasebnih grafikona.
Grafičko usporeĎivanje vremenskih nizova (dvaju ili više vremenskih nizova-
intervalnih i/ili trenutaĉnih) je moguće pomoću aritmetiĉkog ili logaritamskog mjerila na osi
y.
Postoje tri sluĉaja:
statistiĉke jedinice su izraţene u istim jedinicama mjere aritmetiĉko mjerilo na
osi y, što znaĉi isti razmak izmeĊu jedinica mjere (0-100, 500-600), …
statistiĉke jedinice su izraţene u istim jedinicama mjere, ali na različitoj razini
logaritamsko mjerilo na osi y,
statistiĉke jedinice su izraţene u različitim jedinicama mjere logaritamsko
mjerilo na osi y.
Pravila za konstruiranje logaritamskog mjerila:
1. ne moţe poĉeti od nule, jer je log , a najmanji broj s kojim se poĉinje je 1
2. logaritamsko mjerilo završava s 10 puta većim brojem
3. duljina logaritamskog mjerila je proizvoljna i ovisi o veliĉini grafikona, a za naše uvjete
preporuĉa se veliĉina od 10 cm
4. interval od najmanjeg do najvećeg broja popunjava se s brojevima koji se nalaze u tom
intervalu koristeći logaritme.
5. preporuĉa se formirati osnovni logaritamski ciklus od 1 do 10
log 1 = 0
log 2 = 0,30
log 3 = 0,48
log 4 = 0,60
log 5 = 0,70
log 6 = 0,78
log 7 = 0,85
log 8 = 0,90
log 9 = 0,95
log 10 = 1
6. osnovni logaritamski ciklus se koristi za preraĉunavanje ciklusa koji odgovara zadanim
frekvencijama (100-1000, 35-350, …). Ako su frekvencije u intervalu od 13-200 tada
treba formirati dva ciklusa: od 10-100 i od 100-1000.
41
VJEŢBA 4.1. GRAFIČKO PRIKAZIVANJE VREMENSKIH NIZOVA
Zadatak 4.1.1. Navesti statistiĉke jedinice i vremensko obiljeţje za nizove prikazane u
tabelama 6. i 7. Odrediti vrstu vremenskog niza. Obrazloţiti odgovore.
Zadatak 4.1.2. Grafiĉki prikazati broj prevezenih putnika u gradskom prijevozu Republike
Hrvatske u razdoblju od 1991. do 2001. godine površinskim grafikonom. Kada
je poţeljno u linijskom grafikonu vodoravno prekinuti ordinatu? Usporediti
površinski s linijskim grafikonom te linijskim grafikonom koji je vodoravno
prekinut. Koji je od ta tri grafikona sada najpregledniji? Obrazloţiti odgovor.
Zadatak 4.1.3. Izraĉunati broj prevezenih putnika u gradskom prijevozu Republike Hrvatske u
razdoblju od 1991. do 1995. godine i od 1996. do 2001. godine. Koliko je
prevezeno putnika u gradskom prijevozu Republike Hrvatske u razdoblju od
1991. do 2001. godine? Kumulativne frekvencije prikazati odgovarajućim gra-
fikonom. Zašto je linija grafikona uzlazna?
Zadatak 4.1.4. Grafiĉki prikazati na jednom grafikonu broj prevezenih putnika u gradskom i
zraĉnom prijevozu u Republici Hrvatskoj u razdoblju od 1991. do 2001.
godine. Nacrtati grafikon s aritmetiĉkim i logaritamskim mjerilom na osi
ordinate. Obrazloţiti dobivenu sliku i odabrati odgovarajući grafikon na kojem
je moguće usporeĊivati relativne promjene broja putnika u gradskom i
zraĉnom prijevozu.
Zadatak 4.1.5. Prikazati na odgovarajućem grafikonu kretanje broja kontejnerskih brodova i
TEU u svijetu u razdoblju od 1992. do 2001. godine. Odgovoriti, na temelju
grafikona, je li u promatranom razdoblju brţe rastao broj brodova ili iznos
TEU. Koji zakljuĉak slijedi iz prethodnog odgovora?
■
42
RJEŠENJA.
4.1.2. Preporuĉa se linijski grafikon sa vodoravnim prekidom na ordinati.
4.1.3. Kumulativni niz:
1991. – 1995. 20922 mil. putnika
1996. – 2001. 23424 mil. putnika
1991. – 2001. 44346 mil. putnika.
Kumulativni niz “manje od” prikazuje se linijskim grafikonom kod kojeg se frekvencija
kumulativnog niza ucrtava nad gornjom granicom promatrane vremenske jedinice.
4.1.4. Putnici u gradskom i zraĉnom prijevozu su dvije statistiĉke mase izraţene u istim
jedinicama mjere, ali na razliĉitoj razini, zato je potrebno koristiti logaritamsko mjerilo
na osi y.
Predlaţe se mjerilo:
- gradski prijevoz 50-500 putnika
- zraĉni prijevoz 130-1300 putnika.
4.1.5. Broj kontejnerskih brodova su statistiĉke mase izraţene u razliĉitim jedinicama mjere,
zbog toga je potrebno takoĊer koristiti logaritamsko mjerilo.
Predlaţe se mjerilo:
- brodovi 300 - 3000
- TEU 500 – 5000
■
43
4.2. Indeksi
pojam indeksa
vrste indeksa
veriţni indeksi
baziĉni indeksi
preraĉunavanje indeksa
skupni indeksi
Indeks je relativan broj koji se dobije usporeĊivanjem dviju ili više frekvencija
vremenskog niza (frekvencije Yi, i = 1,2,…, N), tj.
IY
Y
1
2
100 ,
gdje su Y1 i Y2 frekvencije jedne te iste pojave, ali koje pripadaju razliĉitim
vremenskim jedinicama. Frekvencija koja je baza usporedbe nalazi se u nazivniku.
Y1 = Y1998
Y2 = Y1995 IY
Y
1998
1995
100
Y Y I
Y Y I
Y Y I
1 2
1 2
1 2
100
100
100
Indeks je neimenovan broj i on pokazuje koliko se frekvencija u brojniku razlikuje od
frekvencije u nazivniku, a ta je razlika izraţena u postocima.
Primjerice, I = 250 znaĉi da je Y1 > Y2 za 150% ili 2,5 puta
I = 100 znaĉi da je Y1 = Y2
I = 87 znaĉi da je Y1 < Y2 za 13 %.
Vrste indeksa:
Individualni – veriţni i baziĉni
Skupni.
Individualni indeks je indeks u kojem se jedna frekvenciju (u brojniku) usporeĊuje s
jednom frekvencijom (u nazivniku) za razliku od skupnog indeksa kod kojega se više
frekvencija jedne vremenske jedinice usporeĊuju s više jedinica druge vremenske jedinice
odabrane za bazu usporedbe.
Veriţni indeksi se nazivaju i indeksima s promjenljivom bazom, jer se frekvencija
neke vremenske jedinice usporeĊuje s frekvencijom prethodne vremenske jedinice:
NiY
YiI
i
,...,2,1001
44
God. Yi Veriţni indeks Indeks 1998. = 100
1988. 100
1989. I
Y
Y
1989
1988
100 120 120
1990. 95 89
1991. 100 150
:
Grafički prikaz veriţnih indeksa:
Bazni indeksi su indeksi sa stalnom bazom. Proizvoljno se odabire ili je zadana
vremenska jedinica za bazu usporedbe; u brojniku je frekvencija i-te vremenske jedinice, a u
nazivniku frekvencija one vremenske jedinice koja je odabrana za bazu usporedbe:
IY
Y
i
B
100 , i = 1,…, N
Grafički prikaz baznih indeksa:
Preračunavanje indeksa je prevoĊenje baznih indeksa u veriţne i obrnuto ili
prevoĊenje baznih s jedne vremenske jedinice na drugu:
1. veriţni indeksi u bazne indekse na bazi prve vremenske jedinice:
100113
4
2
3
1
2 Y
Y
Y
Y
Y
Y
Y
Y
Y
Y i
i
i
2. bazni indeksi (na bazi prve vremenske jedinice) na bazu neke druge vremenske
jedinice
100100100: 1
111
B
i
B
iBi
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
3. bazni indeksi (na bazi prve vremenske jedinice) veriţne indekse
100100100:11
1
11
1
1
i
i
i
iii
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
45
Kod skupnih indeksa se javlja mogućnost da se usporedi više frekvencija
jedne vremenske jedinice sa više frekvencija druge vremenske jedinice. Te se frekvencije
odnose na više pojava, ali samo onih ĉije usporeĊivanje ima smisla. Od skupnih indeksa
najĉešći je indeks vrijednosti proizvodnje:
IV – indeks vrijednosti proizvodnje
Vrijednost proizvodnje izvještajnog razdoblja p1·q1 , 1 = izvještajno razdoblje
Vrijednost proizvodnje baznog razdoblja p0·q0 , 0 =baziĉno razdoblje
Ip q
p qV
1 1
0 0
100
Primjerice, ako je IV = 110 to znaĉi da je vrijednost proizvodnje porasla za +10%, ali
na temelju tog rezultata nije moguće odgovoriti koliki je u tom porastu udio cijena (pi), a
koliki udio koliĉina (qi). Zbog toga je potrebno izraĉunati skupni indeks cijena i skupni indeks
koliĉina:
1. Ip q
p qK
0 1
0 0
100 1. Ip q
p qC
1 0
0 0
100
2. Ip q
p qK
1 1
1 0
100 2. Ip q
p qC
1 1
0 1
100
IK – indeks koliĉina pokazuje promjenu koliĉina izvještajnog u odnosu na bazno razdoblje
IC – indeks cijena pokazuje promjenu cijena izvještajnog u odnosu na bazno razdoblje
IV = IK · IC
p q
p q
p q
p q
p q
p q
0 1
0 0
1 1
0 1
1 1
0 0
Primjeri skupnih indeksa:
tone x kilometri = tkm
putnici x kilometri = pkm
■
46
VJEŢBA 4.2. Indeksi vremenskih nizova
Zadatak 4.2.1. Izraĉunati promjene broja prevezenih putnika u gradskom i zraĉnom prijevozu
Republike Hrvatske pojedine godine u odnosu na 1991. Objasniti naĉin
odabiranja frekvencije koja je uzeta za bazu usporedbe. Što se dogaĊa, ako se
za bazu uzme frekvencija neke druge vremenske jedinice?
Zadatak 4.2.2. Rezultate iz prethodnog zadatka prikazati odgovarajućim grafikonom.
Usporediti gradski sa zraĉnim prijevozom.
Zadatak 4.2.3. Jesu li godišnje promjene broja putnika u gradskom i zraĉnom prijevozu
Republike Hrvatske u razdoblju od 1991. do 2001. bile ravnomjerne? Koje je
godine zabiljeţen najveći porast odnosno pad broja prevezenih putnika u
odnosu na prethodnu godinu? Pokušati naći razloge zbog kojih je došlo do
takvih promjena.
Zadatak 4.2.4. Na temelju podataka iz tabele 7. usporediti godišnje promjene broja
kontejnerskih brodova i TEU u svijetu u odnosu prema prethodnoj godini.
Rezultate prikazati odgovarajućim grafikonom.
Zadatak 4.2.5. Rezultate iz zadatka 4.2.4. preraĉunati na 1992. godinu kao bazu. Da li je u
razdoblju od 1992. do 2001. godine brţe rastao broj brodova ili iznos TEU?
Zakljuĉak povezati sa zakljuĉkom iz zadatka 4.1.5.
Zadatak 4.2.6. Izraĉunati relativne promjene cijena, koliĉina i vrijednosti proizvodnje
izvještajnog razdoblja (1996.) u odnosu na bazno razdoblje (1990.), ako je
zadano:
Proizvod 1990. 1996.
Koliĉina Vrijednost Koliĉina Vrijednost
A 28 5 800 34 7 400
B 39 8 000 47 10 200
C 21 4 400 23 5 000
Ukupno 88 18 200 104 22 600
Obrazloţiti dobivene rezultate.
■
47
RJEŠENJA. 4.2.1.
Godina 1991. 1992. 1993. 1994. 1995. 1996. 1997. 1998. 1999. 2000. 2001.
Gradski 100 98 97 98 96 92 93 89 90 91 93
Zraĉni 100 171 365 476 488 593 623 662 666 771 896
4.2.2. Bazni indeksi se prikazuju linijskim grafikonom, a budući da su indeksi
neimenovani brojevi, preporuĉa se ucrtati indekse za gradski i zraĉni prijevoz u jedan
grafikon. Usporedbom linija dobit će se odgovarajući zakljuĉak o promjenama broja putnika u
gradskom i zraĉnom prijevozu u odnosu na 1991. godinu.
4.2.3.
Godina 1991. 1992. 1993. 1994. 1995. 1996. 1997. 1998. 1999. 2000. 2001.
Gradski – 98 99 98 96 92 93 89 102 101 102
Zraĉni – 171 213 130 103 121 105 106 101 116 116
Najveći je porast zabiljeţen u zraĉnom prijevozu 1993. u odnosu na 1992. godinu
(+113%), a najveći pad u gradskom prijevozu 1998. u odnosu na 1997. godinu (–11%).
4.2.4.
Godina 1992. 1993. 1994. 1995. 1996. 1997. 1998. 1999. 2000. 2001.
Brodovi – 103 110 110 111 112 109 103 105 106
TEU – 108 112 114 114 117 113 106 110 113
Veriţni se indeksi takoĊer prikazuju linijskim grafikonom, ali za razliku od baznih
indeksa koji imaju stalnu bazu, veriţni indeksi su s promjenljivom bazom pa se indeksi
prikazuju izlomljenim linijama. I u ovom sluĉaju indeksi za obje pojave se prikazuju na
jednom grafikonu što omogućuje usporedbu promjena u odnosu na prethodnu godinu za jednu
i drugu pojavu.
4.2.5.
Godina 1992. 1993. 1994. 1995. 1996. 1997. 1998. 1999. 2000. 2001.
Brodovi 100 103 113 125 138 155 168 174 183 195
TEU 100 108 121 137 157 183 207 219 241 271
U promatranom razdoblju brţe je rastao iznos TEU nego broj kontejnerskih brodova
na temelju ĉega se zakljuĉuje da je tijekom promatranog razdoblja rastao iznos TEU/1 brodu.
4.2.6.
p1· q1= 22600 IV = 124,176 IK 1 = 105,929 IC 1 = 105,072
p0·q0 = 18200 IK 2 = 118,181 IC 1 = 117,225
p0·q1 = 19279,120 Iv = 118,181 x 105,072 /
100 = 124,175
p1·q0 = 19123,146 Iv = 105,929 x 117,225 / 100 = 124,175
■
48
4.3. Srednje vrijednosti vremenskih nizova
pojam srednje vrijednosti
vrste srednjih vrijednosti
prosjeĉna ordinata
kronološka sredina
geometrijska sredina
Niz A je oscilirajući, a nizovi B i C su nizovi koji pokazuju tendenciju rasta, odnosno
pada.
Srednja vrijednost je frekvencija vremenskog niza koja reprezentira sve
pojedinaĉne vrijednosti vremenskog niza i izraţena je u onim jedinicama mjere u kojima su
zadane frekvencije.
Vrste srednjih vrijednosti: prosjeĉna ordinata, kronološka sredina i
geometrijska sredina. Uporaba pojedine srednje vrijednosti ovisi o tendenciji kretanja
frekvencija i vrsti vremenskog niza:
vrsta v. niza oscilirajući (A) tendencija rasta ili pada (B i C)
intervalni v.niz prosjeĉna ordinata Y
geometrijska sredina G
trenutaĉni v.niz kronološka sredina Y
Prosječna ordinata se izraĉunava po formuli za jednostavnu aritmetiĉku
sredinu. To je prosjeĉna vrijednost frekvencije po jednoj zadanoj vremenskoj jedinici
(godina,…), a koristi se za oscilirajuće intervalne vremenske nizove:
Y
Y
N
ii
N
1
Y = prosjeĉan broj jedinica/ 1 vremenskoj jedinici
Y = prosjeĉan broj putnika/godišnje prevezen u gradskom i zraĉnom prijevozu…
Kronološka sredina je takoĊer prosjeĉna vrijednost frekvencija vremenskog
niza, ali koja se izraĉunava za oscilirajuće trenutaĉne vremenske nizove
Y
p Y
p
i i
i
N
i
i
N
1
1
, p Yi ii
N
1
- suma ponderiranih stanja
Y = prosjeĉan broj jedinica/1 vremenskoj jedinici
Y = prosjeĉan broj brodova ili TEU/godišnje …
49
Ponder (p) je broj koji treba odrediti ovisno o trenutku kada je pojava snimana. Ako
je dano stanje poĉetkom ili krajem vremenske jedinice (godine), tada prva i posljednja
jedinica imaju ponder 0,5 a sve ostale imaju ponder 1.
Ako je zadano stanje 30.06. onda svaka vremenska jedinica ima ponder 1 i u tom se
sluĉaju trenutaĉni niz svodi na intervalni vremenski niz.
Ponder je potrebno odrediti iz razloga što se svako stanje trenutaĉnog niza odnosi na
jedan odreĊeni trenutak, a s ponderom se “pokrije” interval izmeĊu dva snimanja pojave. Pri
odreĊivanju pondera uzima se pretpostavka da je razina pojave u trenutku snimanja t ista do
polovine intervala t+1 odnosno do polovine intervala t-1 s tim da ti intervali mogu biti
meĊusobno jednaki ili nejednaki.
Stanje 30.06. Stanje 01.01.
Stanje 31.12. Stanje 30.6.
Nejednaki intervali
Geometrijska sredina (G) je srednja vrijednost koja se izraĉunava za bilo
intervalne ili trenutaĉne nizove koji pokazuju tendenciju rasta ili pada. Geometrijska sredina
je broj kojim se odreĊuje veliĉina rasta ili pada za promatranu vremensku jedinicu. To je
srednja vrijednost koja predstavlja prosjeĉnu stopu kretanja promatranog vremenskog niza i
koja se odnosi na promatranu vremensku jedinicu.
God. Yi Veriţni indeks
1. 2. Y2 / Y1
3. Y3 / Y2
4. Y4 / Y3
:
:
N YN / YN–1
Geometrijska sredina je prosjek veriţnih indeksa
Y
Y
Y
Y
Y
Y
Y
Y
N
N
N2
1
3
2
4
3 1
1
iz ĉega slijedi konaĉna formula za izraĉunavanje geometrijske sredine
50
GY
Y
NN
1
1
GY
Y 4
1
3
G > 1 – pokazuje tendenciju rasta 1,05 +5 %
G < 1 – pokazuje tendenciju pada 0,94 -6 %
G – prosjeĉna godišnja stopa rasta ili pada; ona se izraĉunava prema X % = G ·100–
100.
Primjer: X % = 1,05 ·100–100 = + 5 % godišnja stopa rasta za promatranu pojavu.
God. Yi
1988. Y1
1989.
1990.
1991. Y4
51
VJEŢBA 4.3. Srednje vrijednosti vremenskih nizova
Zadatak 4.3.1. Koje se srednje vrijednosti mogu izraĉunati za vremenske nizove prikazane u
tabelama 6. i 7.? Objasniti odabiranje srednjih vrijednosti za intervalne i
trenutaĉne nizove.
Zadatak 4.3.2. Izraĉunati prosjeĉni godišnji broj prevezenih putnika u zraĉnom prijevozu
Republike Hrvatske na temelju podataka za razdoblje od 1991. do 2001.
Koliko broj prevezenih putnika 2001. godine odstupa od izraĉunatog prosjeka?
Zadatak 4.3.3. Izraĉunati prosjeĉni godišnji broj brodova svjetske kontejnerske flote na
temelju podataka za razdoblje od 1992. do 2001. godine. To isto uĉiniti i za
iznos TEU. Objasniti razliku izraĉunavanja godišnjeg prosjeka u odnosu na
prethodni zadatak. Koliko je odstupanje broja brodova i iznosa TEU u 2001.
godini od izraĉunatog prosjeka?
Zadatak 4.3.4. Izraĉunati prosjeĉnu godišnju stopu kretanja broja prevezenih putnika u
gradskom i zraĉnom prijevozu u razdoblju od 1991. do 2001. godine.
Usporediti gradski sa zraĉnim prijevozom.
Zadatak 4.3.5. U razdoblju od 1991. do 2001. godine mogu se za prevezene putnike u
gradskom i zraĉnom prijevozu uoĉiti razliĉite tendencije. Usporediti prosjeĉnu
stopu kretanja za razdoblje od 1991. do 1995. godine sa stopom kretanja iz
prethodnog zadatka za razdoblje od 1991. do 2001. godine. Obrazloţiti
dobivene rezultate.
Zadatak 4.3.6. Izraĉunati prosjeĉnu godišnju stopu kretanja za brodove i iznos TEU u svijetu
za razdoblje od 1992. do 2001. godine. Je li brţe rastao broj brodova ili iznos
TEU? Zakljuĉak usporediti s grafikonom iz zadatka 4.1.5.
Zadatak 4.3.7. Pomoću prosjeĉne godišnje stope iz prethodnog zadatka procijeniti broj
brodova i iznos TEU koji se mogu oĉekivati u 2005. godini. Pod kojim
uvjetima vrijedi ta procjena?
■
52
RJEŠENJA.
4.3.2. Y = 734,27 tisuća putnika godišnje; prosjeĉan godišnji broj prevezenih putnika veći je
9,5 % od godišnjeg prosjeka za razdoblje od 1991. - 2001. godine.
4.3.3.Y = 2053 broda godišnje
Y = 33900 TEU godišnje
4.3.4. Gradski prijevoz, G = 0,9993; godišnja stopa pada 0,7 %
Zraĉni prijevoz, G = 1,245; godišnja stopa rasta 24,5 %
4.3.5. Razdoblje od 1991.- 1995.
Gradski prijevoz, G = 0,991; godišnja stopa pada 0,9 %
Zraĉni prijevoz, G = 1,487; godišnja stopa rasta 48,7 %
4.3.6. Brodovi, G = 1,077; godišnja stopa rasta 7,7 %
TEU, G = 1,1173; godišnja stopa rasta 11,74 %
4.3.7. Procjena za 2005. godinu
Brodovi Y2005 = 3708 brodova
TEU Y2005 = 8288 TEU
■
53
4.4. TREND pojam trenda
vrste trendova
metoda najmanjih kvadrata
vrijednost trenda
grafiĉko prikazivanje trenda
Trend je linija (pravac ili krivulja) koja oznaĉava tendenciju kretanja pojave u
promatranom razdoblju.
Vrste trendova :
linearni (linijski) trend koji ima oblik pravca i
krivolinijski trend koji ima oblik krive linije.
Metoda najmanjih kvadrata je metoda pomoću koje se izraĉunavaju parametri
linearnog ili krivolinijskog trenda. Polazna je pretpostavka da je trend linija koja se najbolje
moguće prilagoĊava zadanim frekvencijama vremenskog niza, tj. da je suma kvadrata
odstupanja (Y – YC) minimalna.
Vrijednost trenda YC se odreĊuje tako da se u jednadţbu trenda za X uvrsti ona
vrijednost koja pripada vremenskoj jedinici za koju se izraĉunava vrijednost trenda. Za
kontrolu iY = CY .
4.4.1. Linearni trend
jednadţba linearnog trenda
odreĊivanje vrijednosti X
tumaĉenje jednadţbe trenda
grafiĉko prikazivanje linearnog trenda
analiza varijance
procjena pomoću jednadţbe trenda
Linearni trend je pravac kojim se odreĊuje tendencija kretanja pojave u promatranom
razdoblju.
Jednadţba linearnog trenda
Y a bXC
bXY Y X
X X X
2
a Y bX
Za jednadţbu linearnog trenda potrebno je imati sljedeće podatke:
54
Godina iY iX 2
iX iiYX
Vrijednost
trenda YC
1991.
…
…
Ukupno iY iX 2
iX
iiYX
iC YY
N
YY
i ( za intervalne) Y =
i
ii
p
yp( za trenutaĉne nizove ) X =
N
X i
OdreĎivanje vrijednosti X
Vrijednost X se odreĊuje zavisno od ishodišta koje je zadano ili se proizvoljno
odabire. Ako je ishodište u sredini razdoblja onda ona vremenska jedinica koja je u sredini
razdoblja ima vrijednost X=0, a sve one kasnije imaju pozitivne vrijednosti X, dok one ranije
od ishodišta poprimaju negativne predznake.
INTERVALNI NIZOVI; vrijednosti X se odreĊuju u odnosu na 30.06. pojedine
godine, odnosno na sredinu zadane vremenske jedinice.
1. Ishodište u sredini
neparan broj vremenskih jedinica
God. Yi X
1990. -1
1991. 0
1992. +1
X = 0
paran broj vremenskih jedinica
God. Yi X
1990. -1,5
1991. -0,5
1992. +0,5
1993. +1,5
X = 0
diskontinuirani niz vremenskih jedinica
God. Yi X
1990. -2,5
1991. -1,5
1993. +0,5
1994. +1,5
1995. +2,5
X 0
55
Vaţno:
dulji oblik formula za YC i treba uzeti u obzir i one godine koje nisu zadane u tabeli.
2. ishodište nije u sredini
God. Yi Ishodište
30.06.’90.
ishodište
30.06.’92.
Ishodište
01.01.’90.
1990. 0 -2 +0,5
1991. +1 -1 +1,5
1992. +2 0 +2,5
1995. +5 +3 +5,5
Zaključak o mogućim slučajevima:
- paran broj vremenskih jedinica
- neparan broj vremenskih jedinica
- ishodište na poĉetku razdoblja
- ishodište neka druga vrijednost
- kontinuiran niz vremenskih jedinica
- diskontinuiran niz vremenskih jedinica
- ishodište 30.06. neke godine
- ishodište bilo koji datum
TRENUTAČNI NIZOVI ; vrijednost X-a se uvijek preraĉunava na stanje kada je
pojava snimana (01.01., 31.03., krajem godine, sredinom godine,…)
ishodište u sredini razdoblja
ishodište izvan sredine razdoblja
paran ili neparan broj jedinica
prva vremenska jedinica ili neka druga
diskontinuirani ili kontinuirani niz vremenskih jedinica
stanje
01.01.
Yi ishodište u
sredini
1990. -2,5
1991. -1,5
1993. +0,5
1995. +2,5
X 0
VAŢNO:
Ako je X = 0, tada se jednadţba linearnog trenda izraĉunava pomoću ovih
formula:
CY = a + bX
56
bXY
X 2
, a Y .
Tumačenje jednadţbe trenda a - prosjeĉna razina pojave, odnosno prosjeĉan broj jedinica / 1 vremenskoj jedinici (godi-
šnje, …)
b - prosjeĉan pad ili rast izraţen u apsolutnim jedinicama / po 1 vremenskoj jedinici (godi-
šnje, …).
Ako ishodište nije u sredini razdoblja onda parametar a nije prosjeĉan broj jedinica.
Primjer:
Na temelju podataka o broju prevezenih putnika u gradskom prijevozu RH u razdoblju
od 1991. – 2001. godine dobivena je jednadţba linearnog trenda koja glasi:
XYC 05,415,403
ishodište: 30.06.1996.
jedinica X- 1 godina
jedinica Y- 1 milijun putnika.
U promatranom razdoblju od 1991. – 2001. godine prosjeĉan godišnji broj prevezenih
putnika u gradskom prijevozu RH je iznosio 403,15 milijuna putnika, a prosjeĉan godišnji pad
prevezenih putnika bio je 4,05 milijuna putnika.
Grafičko prikazivanje linearnog trenda
Parametar b je koeficijent smjera linearnog trenda:
ako b > 0 trend je uzlazni, ako b < 0 trend je silazni.
Linearni trend je pravac za koji su dovoljne dvije vrijednosti trenda.
Analiza varijance je metoda kojom se ispituje reprezentativnost trenda.
57
2 2 ( )Y Y / N - ukupna varijanca
p CY Y2 2 ( ) / N- protumaĉena varijanca
np CY Y2 2 ( ) / N- neprotumaĉena varijanca
2 2 2 p np
Trend će biti reprezentativniji što je protumaĉena varijanca ( p
2 ) veća odnosno
neprotumaĉena varijanca (np
2 ) manja.
X % - stupanj protumaĉenosti trenda izraĉunava se prema formulama
(1) Xp
%
2
2 100 ili (2) Xnp
%
2
2 100 , 0 < X % < 100.
Reprezentativnost trenda je bolja (veća) kad je X% veći broj po (1), odnosno manji
broj po (2).
Ukupna, protumaĉena i neprotumaĉena varijanca se izraĉunavaju po formulama:
2
2 2
( )Y Y
N
Y Y Y
N
p
CY Y
N
a Y b XY Y Y
N
2
2
( )
np
CY Y
N
Y a Y b XY
N
2
2 2
( )
.
Procjena pomoću trenda; ako je linearni trend reprezentativan onda se
jednadţba trenda moţe koristiti za procjenu, tj. za izraĉunavanje oĉekivane frekvencije za
vremensku jedinicu koja je zadana ili odabrana. Ta procjena, doduše, vrijedi za pojavu za koju
se moţe prihvatiti da će se u budućnosti kretati istim tempom kao i dosad.
58
putnikamilY
Y
XY
bXaY
C
C
.7,366
905,415,403
05,415,403
2005
2005
59
4.4.2. Krivolinijski trend
Krivolinijski trend je kriva linija koja pokazuje tendenciju kretanja pojave u
promatranom razdoblju.
Vrste krivolinijskih trendova ovise o izboru matematiĉke krivulje koja se
dobro prilagoĊava empirijskim frekvencijama. Uzeti su u obzir samo ovi sluĉajevi:
krivolinijski trend pomoću pomiĉnih prosjeka,
paraboliĉni trend II. stupnja,
eksponencijalni trend.
Krivolinijski trend pomoću pomičnih prosjeka dolazi u obzir ako frekvencije
vremenskog niza ne pokazuju kretanje po nekoj poznatoj krivulji. Pomiĉni prosjeci se
izraĉunavaju da se zbrajaju frekvencije za tri ili više vremenskih jedinica (najĉešće tri),
dobivaju se tzv. trogodišnji totali (ili višegodišnji), te se na kraju dobiveni totali podijele s
brojem frekvencija koje su ušle u zbroj.
God. Yi Trogodišnji totali Pomiĉni prosjeci
1990. Y1 = 20
1991. Y2 = 15 Yii
1
3
41 Yii
1
3
3 13: ,7
1992. Y3 = 6 Yii
2
4
29 Yi
i
2
4
3 9: ,7
1993. Y4 = 8 Yii
3
5
24 Yi
i
3
5
3 8:
1994. Y5 = 10
Prednosti:
neparametarska metoda koja je jednostavna jer ne zahtijeva nikakvu jednadţbu,
metoda za nepravilna kretanja, tj. kod kojih se ne mogu koristiti matematiĉke krivulje.
Nedostatak:
ne moţe se koristiti za ekstrapolaciju (za procjenu frekvencije neke vremenske
jedinice).
Grafički prikaz pomičnih prosjeka
60
Parabolični trend (parabola II. stupnja)
Ova vrsta trenda se dobro prilagoĊava vremenskom nizu koji u svom kretanju
pokazuje jednu izrazitu izboĉinu ili udubljenje, odnosno koji ne pokazuje linearno
kretanje(rast ili pad) po pravcu.
Jednadţba parabole II. stupnja
Y a bX cXC 2
a, b, c, - parametri
Ishodište na poĉetku razdoblja
Y N a b X c X
XY a X b X c X
X Y a X b X c X
2
2 3
2 2 3 4
Ishodište u sredini razdoblja ( X X 0 03, )
Y N a c X
XY b X
X Y a X c X
2
2
2 2 4
Na temelju prethodnog izraza izvedene su formule pomoću kojih se mogu izraĉunati
parametri a, b, c:
aY X X YX
N X X X
4 2 2
4 2 3 b
XY
X 2
cN YX X Y
N X X X
2 2
4 2 2
Radna tabela za izraĉunavanje parabole II. stupnja ima ove stupce:
Godina Yi Xi Xi2
Xi4 Xi Yi Xi
2Yi
Vrijednosti
trenda YC
1991. 108 107,43
1992. 106 104,57
1993. 104 107,00
1994. 111 114,71
1995. 134 127,71
1996. 146 146,00
1997. 168 169,57
Ukupno 877 0 28 196 290 3730 876,99
Jednadţba parabole II. stupnja za navedeni primjer glasi:
Yc= 114,71428 + 10,357 X + 2,642857 X2.
61
Analiza varijance je metoda kojom se ispituje reprezentativnost dobivenog trenda:
2
2
( )Y Y
N , p
CY Y
N
2
2
( )
, np
CY Y
N
2
2
( )
, Xp
%
2
2 100 .
Grafički prikaz parabole II. stupnja
Eksponencijalni trend je jedna vrsta krivolinijskog trenda koja se koristi za pojave
koje se ponašaju prema eksponencijalnoj krivulji.
Jednadţba eksponencijalnog trenda
Y A BC
X log
log log log
log
Y A X B
Y a bX
C
C
Ishodište na poĉetku razdoblja
bX Y X Y
X X X
aY
NbX
log log
log
2
Ishodište u sredini razdoblja
bX Y
X
aY
N
log
log
2
Radna tabela za izraĉunavanje eksponencijalnog trenda ima ove stupce:
62
Godina Yi Xi Xi2
log Yi Xi log Yi Vrijednosti
trenda YC
1991. 108 97,29
1992. 106 105,74
1993. 104 114,20
1994. 111 123,34
1995. 134 133,21
1996. 146 143,86
1997. 168 155,37
Ukupno 877 0 28 14,63784 0,96382 873,01
Jednadţba eksponencijalnog trenda za prethodni primjer glasi:
Yc= 123,34 * 1,08X
Analiza varijance je metoda kojom se ispituje reprezentativnost dobivenog trenda:
2
2
( )Y Y
N , p
CY Y
N
2
2
( )
, np
CY Y
N
2
2
( )
, Xp
%
2
2 100 .
VAŢNO:
Izbor oblika trenda (bilo linearnog ili krivolinijskog) ovisi o stupnju reprezentativnosti
trenda; optimalan je onaj trend za koji je odnos protumaĉene i ukupne varijance najpovoljniji.
Ako se usporede rezultati zadanog primjera
Vrsta trenda Stupanj
reprezentativnosti trenda
Linearni 82,1 %
Parabola II. stupnja 97,2 %
Eksponencijalni 79,8 %
izlazi da se u zadanom primjeru parabola II. stupnja najbolje prilagoĊava zadanim
frekvencijama, što se moţe provjeriti na grafikonu.
63
VJEŢBA 4.4. Trend
Zadatak 4.4.1. Za broj kontejnerskih brodova u svijetu, a na temelju podataka za razdoblje od
1992. do 2001., odrediti tendenciju kretanja. Za ishodište uzeti:
1) sredinu razdoblja.
2) 31.12.1992.
3) 30.06.1992.
Ispisati jednadţbe trenda pod 1), 2) i 3) i objasniti parametre a i b.
Usporediti dobivene rezultate.
Zadatak 4.4.2. Na grafikonu iz zadatka 4.1.4. ucrtati jednadţbu trenda iz prethodnog zadatka.
Što se moţe zakljuĉiti o prilagoĊavanju trenda empirijskim podacima?
Zadatak 4.4.3. Odgovarajućom metodom ispitati reprezentativnost trenda izraĉunatog u
zadatku 4.4.1. Koji je zakljuĉak? Je li se zakljuĉak o reprezentativnosti trenda,
dobiven raĉunski, poklapa sa zakljuĉkom na temelju grafikona iz zadatka
4.4.2.?
Zadatak 4.4.4. Koristeći rezultate iz prethodnog zadatka, grafiĉki i raĉunski procijeniti broj
brodova koji se moţe oĉekivati u 2005. godini. Do koje se mjere moţe koristiti
trend kao metoda za prognozu? Koja se pretpostavka mora ostvariti da bi
prognoza bila ostvarena?
Zadatak 4.4.5. Oĉekivani broj brodova u 2005. godini iz prethodnog zadatka usporediti s
rezultatom dobivenim u zadatku 4.3.7. Obrazloţiti moguće naĉine procjene.
Zadatak 4.4.6. Zadan je intervalni vremenski niz za razdoblje od 1991. do 1997. godine s
ovim frekvencijama: 108, 106, 104, 111, 134, 146, 168. Odrediti jednadţbu
linearnog trenda s ishodištem u sredini razdoblja, zatim s ishodištima
30.6.1991., 30.6.1990. i 1.1.1993.
Usporediti parametre dobivenih jednadţbi i obrazloţiti kako promjena
ishodišta utjeĉe na vrijednosti parametara jednadţbe te na vrijednosti trenda za
pojedine vremenske jedinice.
Zadatak 4.4.7. Odgovarajućom metodom ispitati reprezentativnost prethodno izraĉunatog
trenda. Kako se donosi odluka o optimalnoj krivulji koja se najbolje
prilagoĊava originalnim frekvencijama?
Zadatak 4.4.8. Za podatke iz zadatka 4.4.6. izraĉunati parabolu drugog stupnja i
eksponencijalni trend te ispitati njihovu reprezentativnost.
Na kraju odrediti optimalnu liniju trenda i zakljuĉak provjeriti na grafikonu s
ucrtanim empirijskim frekvencijama i frekvencijama koje pripadaju pojedinoj
vrsti trenda.
64
5. TEORIJSKE RAZDIOBE
5.1. Slučajna varijabla
pojam sluĉajne varijable
oznake sluĉajne varijable
vrste sluĉajnih varijabli
primjeri sluĉajne varijable
funkcija vjerojatnosti
funkcija razdiobe
numeriĉke znaĉajke (parametri) razdiobe vjerojatnosti
Primjer
Pokus (eksperiment) se sastoji u bacanju dviju kocki i biljeţe se dobiveni zbrojevi.
Mogući ishodi tog pokusa su: 2 (1,1); 3 (1,2) ili (2,1); 4 (1,3), (2,2), (3,1); … ; 12 (6,6).
Rezultati su prikazani u tabeli 1.
Tabela 1. Razdioba vjerojatnosti ishoda bacanja dviju kocki
Mogući
ishodi (xi)
Apsolutna
frekvencija
(fi)
Vjerojatnost
(pi)
Funkcija
razdiobe F(xi)
2 1 1/36 (0,028) 1/36
3 2 2/36 (0,056) 3/36
4 3 3/36 (0,083) 6/36
5 4 4/36 (0,111) 10/36
6 5 5/36 (0,139) 15/36
7 6 6/36 (0,167) 21/36
8 5 5/36 (0,139) 26/36
9 4 4/36 (0,111) 30/36
10 3 3/36 (0,083) 33/36
11 2 2/36 (0,056) 35/36
12 1 1/36 (0,028) 36/36
Ukupno 36 36/36 = 1
Izvor: I. Šošić, Uvod u statistiku, Zagreb, 2002., str.238
xi – vrijednost mogućeg ishoda (vrijednost sluĉajne varijable)
fi – broj pojavljivanja mogućeg ishoda (frekvencija mogućeg ishoda)
pi – vjerojatnost svakog ishoda (vjerojatnost a priori)
pm A
ni ( )
65
Slučajna varijabla je numeriĉka vrijednost obiljeţja ĉije pojavljivanje ovisi o
sluĉaju. To je varijabla koja poprima niz vrijednosti; svaku s odreĊenom vjerojatnosti.
U jednom pokusu (promatranju, mjerenju, brojanju, …) sluĉajna varijabla moţe
poprimiti samo jednu vrijednost koja se unaprijed ne moţe predvidjeti, ali u razliĉitim
pokusima moţe poprimiti razliĉite vrijednosti.
Oznake slučajne varijable
X : x1, x2, …, xn vjerojatnost P (X = xi) = pi , i = 1, 2, …, n
Y : y1, y2, …, yn vjerojatnost P (Y = yi) = pi , i = 1, 2, …, n
Sluĉajna varijabla X poprima niz vrijednosti x1, x2, …, xn svaku s odreĊenom
vjerojatnosti p1, p2, …, pn , pri ĉemu je 11
n
i
ip .
Vrste slučajnih varijabli: prekidna (diskretna) sluĉajna varijabla i neprekidna
(kontinuirana) sluĉajna varijabla.
Varijabla je diskretna ako je niz vrijednosti xi diskontinuiran, tj. predstavlja prebrojiv
skup vrijednosti, primjerice: ishod bacanja dviju kocki, ocjena, broj telefonskih poziva,…. U
obrnutom sluĉaju, ako sluĉajna varijabla X poprima bilo koju vrijednost iz nekog intervala
(neprebrojiv skup vrijednosti) onda se radi o kontinuiranoj sluĉajnoj varijabli, primjerice:
visina, teţina, udaljenost u kilometrima, brzina vozila,….
Primjeri slučajne varijable: broj dolazaka vozila u servisnu postaju, broj prometnih
nezgoda, broj kvarova vozila, brzina vozila, vremenski razmak izmeĊu vozila, broj prevezenih
putnika, broj tona tereta, broj brodova koji pristiţu u luku, vrijeme opsluţivanja, broj putnika
tijekom jednog dana, broj kupaca koji ulaze u robnu kuću, broj prodanih artikala, broj
klijenata u banci, broj studenata na ispitu, broj telefonskih poziva, visina i teţina ţivih bića,
ocjena na ispitu, …
Svakoj sluĉajnoj varijabli pridruţena je funkcija vjerojatnosti odnosno funkcija
razdiobe.
Funkcija vjerojatnosti se oznaĉava sa f(x) i kod kontinuirane sluĉajne varijable
naziva se gustoća vjerojatnosti.
Pravilo prema kojem je svakom X = xi pridruţena vjerojatnost P(X = xi) = pi zove se
zakon vjerojatnosti ili zakon razdiobe vjerojatnosti koji predstavlja odnos izmeĊu mogućih
vrijednosti sluĉajne varijable x1, x2, …, xn i pripadajućih vjerojatnosti p1, p2, …, pn.
Zakon vjerojatnosti predstavljen je funkcijom vjerojatnosti f(x); to nije vjerojatnost
već funkcija kojom se odreĊuje vjerojatnost za neku vrijednost sluĉajne varijable.
66
Prekidna (diskretna) slučajna varijabla
Zakon vjerojatnosti prekidne sluĉajne varijable X je skup parova vrijednosti xi i
pripadajućih vjerojatnosti pi pri ĉemu je zbroj vjerojatnosti jednak 1.
n
i
iii ppxX1
1,,
Zakon vjerojatnosti moţe se prikazati tabelarno i grafiĉki.
Tabela
xi pi
x1 p1
x2 p2
. .
xn pn
ili
xi x1 x2 … xn
pi p1 p2 … pn
Grafiĉki se prikazuje tako da se na apscisu nanose vrijednosti sluĉajne varijable x1, x2,
…, xn , a na ordinatu vjerojatnosti p1, p2, …, pn i to pomoću stupaca ili okomitim crtama
(primjer bacanja dviju kocki):
67
Neprekidna (kontinuirana) slučajna varijabla
f xP x X x x
xx( ) lim
( )
0
P x X x x f x dxx
x x
( ) ( )
Vjerojatnost da će se kontinuirana sluĉajna varijabla X nalaziti u intervalu (x, x+x)
jednaka je površini izmeĊu krivulje f(x) i osi x, te ordinata podignutih iz toĉaka x i x+x.
Razlika izmeĎu prekidne i kontinuirane slučajne varijable:
Za prekidnu sluĉajnu varijablu vrijedi da svakoj njenoj vrijednosti xi pripada odgovarajuća
vjerojatnost pi .
Kod kontinuirane sluĉajne varijable vjerojatnosti pripadaju intervalima; za pojedinaĉne
vrijednosti xi vjerojatnost je nula, jer se nad toĉkom ne moţe ucrtati površina. Budući da
je skup vrijednosti koje se nalaze u promatranom intervalu neprebrojiv, nije moguće
elementarno prikazati zakon vjerojatnosti kontinuirane sluĉajne varijable X te se iz tog
razloga na grafikonu dobiva neprekidna krivulja. Kod kontinuirane sluĉajne varijable
funkcija vjerojatnosti f(x) se još zove i gustoća vjerojatnosti ili gustoća razdiobe.
Funkcija razdiobe F(x) je funkcija pomoću koje se mogu izraĉunati vjerojatnosti da
će sluĉajna varijabla X poprimiti vrijednost jednaku ili manju od nekog realnog broja x :
F x P X x P xix xi
( ) ( )
.
68
Iz ovog slijedi da je funkcija razdiobe kumulativni niz vjerojatnosti koji se dobiva
zbrajanjem vjerojatnosti za sve vrijednosti xi ; xi x .
Funkcija razdiobe ima svojstvo da je rastuća funkcija i da se kreće u intervalu od 0 do
1.
U tabeli na stranici 73. su upisane vrijednosti funkcije razdiobe za primjer bacanja
dviju kocki; 21/36 je vjerojatnost da će mogući ishod pri bacanju dviju kocki biti 7 i manje
od 7, odnosno od 2 do 7.
Funkcija razdiobe prekidne slučajne varijable:
1
1
1
, , 1
( ) ( )
( ) ( )
( ) ( ) ( )
i
n
i i i
i
i
x x
k
k k i
i
i i i
X x p p
F X P X x P x
F X P X x P X x
P X x F x F x
Grafiĉki prikaz funkcije razdiobe prekidne sluĉajne varijable
Funkcija razdiobe neprekidne slučajne varijable:
F x P X x f x dx
x
( ) ( ) ( )
,
f(x) – funkcija vjerojatnosti neprekidne sluĉajne varijable (gustoća razdiobe)
F x f x dx
x
( ) ( )
.
Ako je bXa tada P( bXa ) = b
a
dxxf )( .
69
Grafiĉki prikaz funkcije razdiobe neprekidne sluĉajne varijable
Grafiĉki prikaz funkcije razdiobe za kontinuirane sluĉajne varijable definiran je
površinom ispod krivulje f(x) koja leţi lijevo od proizvoljno odabrane vrijednosti sluĉajne
varijable X.
Veza izmeĊu funkcije vjerojatnosti i funkcije razdiobe dana je relacijom:
f x F x( ) ( ) .
Statistiĉka analiza razdioba vjerojatnosti obuhvaća izraĉunavanje srednjih
vrijednosti, mjera disperzije,…To su numeriĉke znaĉajke, odnosno parametri razdiobe
vjerojatnosti.
Numeričke značajke (parametri) razdiobe vjerojatnosti su vrijednosti kojima je
odreĊena promatrana razdioba vjerojatnosti: srednje vrijednosti, mjere disperzije, mjere
asimetrije i mjera zaobljenosti.
U praksi se najĉešće izraĉunavaju sljedeći parametri:
- aritmetiĉka sredina koja se još naziva oĉekivana vrijednost ili matematiĉko oĉekivanje, a
oznaĉava se sa E(X).
- medijan (M),
- mod (M0),
- standardna devijacija odnosno varijanca (, 2 D(x)),
- koeficijent varijacije (V),
- koeficijent asimetrije (3),
- koeficijent zaobljenosti (4) .
Numeriĉke znaĉajke se mogu izraĉunavati na dva naĉina:
1. naĉin je da se koriste formule iz poglavlja o numeriĉkim nizovima s tim da se umjesto
apsolutnih frekvencija (fi) uvrste relativne frekvencije odnosno vjerojatnosti (pi):
70
diskretna sluĉajna varijabla
1
1
( )n
i i
i
E X p x m
kontinuirana sluĉajna varijabla
( ) ( ) ;E X xf x dx x
diskretna sluĉajna varijabla
22 2
1
2 2
2 2 1
( )n
i i
i
p x E X
m m
kontinuirana sluĉajna varijabla
22 2 ( ) ( )x f x dx E X
1
1
2
2 2 1
3
3 3 1 2 1
2 4
4 4 1 3 1 2 1
( )
3 2
4 6 3
nk
k i i
i
nk
k i i
i
m p x
p x X
m m
m m m m
m m m m m m
2. naĉin je da se koriste formule za numeriĉke znaĉajke pojedine vrste razdiobe vjerojatnosti,
što će biti prikazano u sljedećim odjeljcima poglavlja 5.
71
5.2. Vrste teorijskih razdioba
pojam empirijske i teorijske razdiobe
binomna razdioba
Poissonova razdioba
normalna razdioba
Statistiĉko promatranje, koje predstavlja prvu fazu statistiĉkog rada (brojenje,
mjerenje, snimanje, promatranje, …), je naĉin da se prikupe informacije o statistiĉkim
jedinicama promatrane pojave.
Empirijska razdioba je svaka ona razdioba koja je dobivena grupiranjem opaţanja ili
grupiranjem statistiĉkih jedinica prema jednom ili više obiljeţja. Zovu se još i originalne ili
opaţene razdiobe.
Primjer:
Ocjena (xi) Broj studenata (fi)
1 .
2 .
3 .
4 .
5 .
fi
Empirijska razdioba Oĉekivana razdioba
(teorijska razdioba)
Teorijska razdioba je takva razdioba koja se oĉekuje u skladu s iskustvom ili
na temelju nekih teorijskih postavki. Primjerice: u prirodi vlada zakon normalne razdiobe, a to
znaĉi da najveći broj jedinica ima prosjeĉnu vrijednost numeriĉkog obiljeţja odnosno sluĉajne
varijable, dok je preostali broj jedinica raspodijeljen na vrijednosti manje odnosno veće od
prosjeka.
72
Teorijske razdiobe su razdiobe vjerojatnosti koje su zadane u analitiĉkom obliku pa su
zato i poznate njihove numeriĉke znaĉajke (matematiĉko oĉekivanje, mod, medijan, 3, 4 ,
…).
Sluĉajna varijabla ĉesto slijedi zakonitost neke teorijske razdiobe. Da bi se mogla
usporeĊivati razdioba sluĉajne varijable s nekom teorijskom razdiobom potrebno je upoznati
vrste teorijskih razdioba. Teorijske razdiobe se dijele na dvije skupine ovisno o vrsti sluĉajne
varijable, i to:
diskontinuirane teorijske razdiobe ili diskretne i
kontinuirane teorijske razdiobe.
U prvu skupinu ubrajaju se sljedeće razdiobe: binomna, Poissonova,
hipergeometrijska,…, a u drugu skupinu: normalna, Studentova, F-razdioba, 2-razdioba.
Teorijske razdiobe su zapravo razdiobe vjerojatnosti koje su oĉekivane odnosno
unaprijed poznate i koje sluţe kao baza usporedbe s empirijskim razdiobama dobivenim u fazi
statistiĉkog promatranja.
5.2.1. Binomna razdioba B (n,p)
oznaka
izraĉunavanje vjerojatnosti
numeriĉke znaĉajke
oblik razdiobe
grafiĉki prikaz
uvjeti
Binomna razdioba je diskontinuirana razdioba koja se odnosi na alternativna
obiljeţja, tj. na raspored dviju kategorija u koju se moţe klasificirati jedan dogaĊaj.
Primjeri: pismo ili glava, muško ili ţensko, za ili protiv, da ili ne, zdrav ili bolestan,
ispravan ili oštećen, pozitivan ili negativan, ….
DogaĊaj A:
p je vjerojatnost da će se ostvariti dogaĊaj A, a dogaĊaj koji je suprotan dogaĊaju A je
dogaĊaj non A (A , AC),
q je vjerojatnost da se dogaĊaj A neće ostvariti; p + q = 1.
Binomna razdioba se najĉešće koristi u pokusima ili promatranjima gdje se dogaĊaj A
ostvaruje uz konstantnu vjerojatnost p pa iz toga slijedi da je binomna razdioba definirana s
parametrima:
n – broj elemenata u uzorku ili broj pokusa i
p – vjerojatnost ostvarenja dogaĊaja A.
Oznaka za binomnu razdiobu je: B(n, p) ili B (n,p).
Izračunavanje vjerojatnosti
Ako se sluĉajna varijabla ponaša prema binomnoj razdiobi onda se vjerojatnost da
sluĉajna varijabla X ima neku vrijednost x, tj. P(X = xi) izraĉunava na sljedeći naĉin:
73
1. P(x) je vjerojatnost da će u seriji od n pokusa dogaĊaj A nastupiti x puta ili vjerojatnost da
će sluĉajna varijabla X poprimiti vrijednost x.
P xn
xp qx n x( )
za x = 0 P(0) = qn ;
n
x
n
x n x
!
!( )! ;
n
01
;
n
n
1
n! = 1·2· ··· · n
x – broj nastupanja dogaĊaja A u n pokusa (promatranja)
2. Rekurzivna formula
P xn x
x
p
qP x( ) ( )
11 ;
za x = 0 P0 = qn, gdje je q = 1 – p.
3. Tablica vjerojatnosti pri binomnoj razdiobi
0,05 0,06 0,5
0
1
2
3
4. Raĉunalni program (STATISTICA)
Oblik binomne razdiobe
1) n , 3 0 , 4 3
B N ; N – oznaka za normalnu razdiobu uskladiti
2) p = q = 0,5 simetriĉna
3) p < q desnostrano asimetriĉna
4) p > q ljevostrano asimetriĉna
Grafički prikaz binomne razdiobe: na os x se nanose cjelobrojne
vrijednosti sluĉajne varijable, a na os y njihove pripadajuće vjerojatnosti.
histogram poligon
vjerojatnosti
74
Numeričke značajke binomne razdiobe
1. Matematiĉko oĉekivanje E(X) = X = n·p p = n
X
2. Disperzija varijanca 2 npq
standardna devijacija npq
koeficijent varijacije Vq
np 100
3. Asimetrija npq
pq 3
4. Zaobljenost 4 31 6
pq
npq
5. Mod np q M np pO
Pri izraĉunavanju moda ako su granice intervala cijeli brojevi, tada mod predstavljaju
dvije vrijednosti sluĉajne varijable X kojima pripada najveća i jednaka vjerojatnost.
Ako su granice intervala decimalni brojevi, tada je mod ona cjelobrojna vrijednost
koja se nalazi unutar tog intervala.
Primjer:
Uvjeti za binomnu razdiobu
2
1. 0 1 ,
2. (1 )
Xp p
n
XX
n
75
VJEŢBA 5.1. Binomna razdioba
U trgovinu je stigla velika pošiljka proizvoda za koju proizvoĊaĉ tvrdi da ne sadrţi
više od 6% oštećenih proizvoda. Pretpostavka o postotku oštećenih proizvoda ispitana je
pomoću sluĉajno odabranog uzorka od 5 proizvoda.
Zadatak 5.1.1. Na temelju prethodnih podataka sastaviti razdiobu vjerojatnosti pojavljivanja
odreĊenog broja oštećenih proizvoda u uzorku. Vjerojatnosti za vrijednosti
sluĉajne varijable X5 izraĉunati prema formulama za izraĉunavanje
vjerojatnosti, a zatim ih provjeriti pomoću Tablice vjerojatnosti pri binomnoj
razdiobi.
Zadatak 5.1.2. Izraĉunati parametre (numeriĉke znaĉajke) zadane razdiobe, i to:
1) pomoću formula za izraĉunavanje parametara numeriĉkog niza,
2) pomoću formula za izraĉunavanje parametara binomne razdiobe. Usporediti
dobivene rezultate.
Zadatak 5.1.3. Pokazati da razdioba iz zadatka 5.1.1. zadovoljava uvjete za binomnu
razdiobu.
Zadatak 5.1.4. Grafiĉki prikazati promatranu binomnu razdiobu. Iz grafikona oĉitati
vrijednost moda. Kako treba protumaĉiti taj rezultat?
Zadatak 5.1.5. Na temelju rezultata iz zadataka 5.1.1. do 5.1.4. donijeti odgovarajuće
zakljuĉke o zadanoj razdiobi.
Zadatak 5.1.6. Obavljeno je 100 mjerenja sluĉajne varijable X i dobivene su ove vrijednosti:
f(x=0)=1; f(x=1)=7; f(x=2)=27; f(x=3)=33; f(x=4)=23; f(x=5)=6; f(x=6)=3.
Ispitati da li empirijski podaci zadovoljavaju uvjete za binomnu razdiobu te u
sluĉaju potvrdnog odgovora izraĉunati ostale parametre zadane razdiobe.
Obrazloţiti rezultate i provjeriti ih na poligonu vjerojatnosti.
Zadatak 5.1.7. Ako se telefonira u vrijeme kada je svaki ĉetvrti telefonski broj zauzet, koliko
iznosi vjerojatnost da će se od 12 poziva uspostaviti veza 3 puta?
Zadatak 5.1.8. Promatra se neki dogaĊaj s konstantnom vjerojatnosti p=0,6. Koliko bi trebao
iznositi broj promatranja da se sa 99% vjerojatnosti moţe oĉekivati da će se
dogaĊaj A ostvariti barem jedanput?
Uputa: ako se sa p oznaĉi vjerojatnost realizacije dogaĊaja A, sa pn vjerojatnost
realizacije dogaĊaja A n puta, a sa qn vjerojatnost suprotnog dogaĊaja n puta,
onda vjerojatnost da će se ostvariti dogaĊaj A barem jedanput je suprotno od qn
(da se neće ostvariti nijedanput). Vrijednost za n dobije se iz relacije 1–(1–p)n
0,99.
■
76
5.2.2. Poissonova razdioba P ()
oznaka
izraĉunavanje vjerojatnosti
numeriĉke znaĉajke
oblik razdiobe
grafiĉki prikaz
uvjeti
Poissonova razdioba je diskontinuirana razdioba (što znaĉi da se odnosi na
sluĉajnu varijablu koja ima cjelobrojne vrijednosti) i predstavlja graniĉni sluĉaj binomne
razdiobe kada n , a p 0.
U praksi, kada je n > 50 izraĉunavanje vjerojatnosti po binomnoj razdiobi je
dugotrajno te se, u sluĉajevima kada je p malen broj, preporuĉuje Poissonova razdioba.
Poissonova razdioba je definirana jednim parametrom koji predstavlja
matematiĉko oĉekivanje, odnosno aritmetiĉku sredinu i koji se oznaĉava na razliĉite naĉine
(m ili ).
Oznaka za binomnu razdiobu je: P() ili P ().
Izračunavanje vjerojatnosti
Vjerojatnosti sluĉajne varijable X koja se ponaša prema Poissonovoj razdiobi
izraĉunavaju se na sljedeće naĉine:
1. P xx
e
x
( )!
2. Rekurzivna formula
P xx
P x( ) ( )
1 P e( )0
3. Tablica vjerojatnosti
4. Korištenje odgovarajućih raĉunalnih programa
0,1 0,2 1,0
0
1
2
3
1,1
1,2
2,0
0
1
77
Oblik Poissonove razdiobe ovisi o parametru i to tako da je razdioba unimodalna i
desnostrano asimetriĉna, a asimetrija je to manja što je veći.
Ako je decimalan broj, onda najveća vjerojatnost pripada jednom broju, tj. jednoj
vrijednosti varijable X (mod), a ako je parametar cijeli broj, onda najveću i jednaku
vrijednost imaju dvije vjerojatnosti sluĉajne varijable X (dvije vrijednosti moda), pa se kaţe
da Poissonova razdioba ima tupi vrh).
Kada tada 3 0 i 43 na temelju ĉega slijedi da Poissonova
razdioba
postaje simetriĉnom i normalno zaobljenom, što znaĉi da teţi normalnoj razdiobi.
Grafičko prikazivanje Poissonove razdiobe:
histogram poligon vjerojatnosti
Primjeri:
Uvjeti za Poissonovu razdiobu
X 2
Numeričke značajke Poissonove razdiobe
1. Matematiĉko oĉekivanje E(X) = X = = m (prvi moment oko nule)
2. Disperzija varijanca 2
2
standardna devijacija
koeficijent varijacije V 100
3. Asimetrija
3
1
4. Zaobljenost 4 31
5. Mod 01 M
78
Ako se mod nalazi izmeĊu dviju decimalnih vrijednosti onda je pripadajuća vrijednost
moda jednaka cjelobrojnoj vrijednosti M0=0 ako je izraĉunati interval 0,34 M0 0,96;
ako je dobiveni interval 1 M0 2 tada postoje dvije vrijednosti moda M0 = 1 i 2.
79
VJEŢBA 5.2. Poissonova razdioba
Zadane su tri vrijednosti parametra za razdiobe A, B i C te intervali vrijednosti sluĉajne
varijable X, i to:
A B C
0,5 2 6
X 0 – 6 0 – 11 0 – 13
Zadatak 5.2.1. Na temelju prethodnih podataka sastaviti razdiobe vjerojatnosti za zadane
vrijednosti sluĉajne varijable A(X6), B(X11) i C(X13).
Vjerojatnosti za tekuće vrijednosti sluĉajne varijable izraĉunati prema zadanim
formulama za izraĉunavanje vjerojatnosti, a zatim ih provjeriti pomoću Tablice
vjerojatnosti pri Poissonovoj razdiobi.
Zadatak 5.2.2. Izraĉunati parametre (numeriĉke znaĉajke) zadanih razdioba A, B i C, i to:
1) pomoću formula za izraĉunavanje parametara numeriĉkog niza,
2) pomoću formula za izraĉunavanje parametara Poissonove razdiobe.
Usporediti dobivene rezultate.
Zadatak 5.2.3. Pokazati da razdiobe A, B i C zadovoljavaju uvjet za Poissonovu razdiobu 2X .
Zadatak 5.2.4. Grafiĉki prikazati razdiobe vjerojatnosti A, B i C. Na temelju dobivenih
grafiĉkih prikaza objasniti kako parametar utjeĉe na oblik Poissonove
razdiobe ako je decimalan broj, odnosno cjelobrojna vrijednost ili, pak, ako
.
Zadatak 5.2.5. Na temelju rezultata iz zadataka 5.2.1. do 5.2.4. dati odgovarajuće zakljuĉke o
zadanim razdiobama.
Zadatak 5.2.6. Na nekom podruĉju evidentiran je tijekom 50 dana ovaj broj dnevnih
prometnih nesreća: 21 dan bez nesreća, 18 dana s 1 nesrećom, 7 dana s 2
prometne nesreće, 3 dana s 3 i 1 dan s 4 nesreće dnevno.
Ispitati da li empirijski podaci zadovoljavaju uvjet za Poissonovu razdiobu te u
sluĉaju potvrdnog odgovora izraĉunati ostale parametre zadane razdiobe.
Obrazloţiti dobivene rezultate.
Zadatak 5.2.7. Na autobusni kolodvor dolazi dnevno 75 autobusa. Praćenjem u duljem
razdoblju ustanovljeno je da od ukupnog broja u prosjeku 8% autobusa pristiţe
na kolodvor sa zakašnjenjem. Izraĉunati kolika je vjerojatnost da će tijekom
dana zakasniti više od 3 autobusa.
■
80
5.2.3. Normalna razdioba
veza između binomne i normalne razdiobe
funkcija vjerojatnosti ( gustoća razdiobe)
oznake
oblik normalne razdiobe
numeričke značajke normalne razdiobe
jedinična (standardizirana) normalna razdioba
Tablica ordinata gustoće jedinične normalne razdiobe
sigma-pravilo
Tablica površina ispod normalne krivulje ( Laplaceova funkcija)
intervali normalne razdiobe.
Normalna razdioba je najznaĉajnija kontinuirana teorijska razdioba koja se primjenjuje
u raznim podruĉjima: brojni se skupovi (populacije) u statistiĉkim istraţivanjima ponašaju
prema zakonitostima normalne razdiobe (primjerice, biomedicinske znanosti), a kada osnovni
skup nije normalno rasporeĊen, procjene na temelju uzoraka teţe normalnoj razdiobi, pod
uvjetom da je uzorak dovoljno velik. Zbog toga se ĉesto “nenormalne” razdiobe
aproksimiraju s normalnom razdiobom.
Matematiĉku osnovu normalne razdiobe dao je engleski ?? matematiĉar De Moivre,
pronašao ju je Francuz Laplace, a detaljno prouĉio njemaĉki matematiĉar Gauss po kome se
ĉesto i naziva Gaussovom razdiobom, a grafiĉki prikaz te razdiobe Gaussovim zvonom.
Veza izmeĊu binomne i normalne razdiobe ogleda se u sljedećem: kada se pri
binomnoj razdiobi s vjerojatnostima p = q = 0,5 povećava broj elemenata u uzorku, odnosno
broj pokusa (promatranja, mjerenja, i sl.) n , tada binomna razdioba s diskontinuiranim
obiljeţjem prelazi u normalnu razdiobu s kontinuiranim vrijednostima sluĉajne varijable; B
N.
Prema tome, normalna razdioba je graniĉni sluĉaj binomne razdiobe. Ovaj se zakljuĉak
moţe provjeriti grafiĉkim putem (primjer 1.).
Primjer 1. Neka je n = 6, 25, 50, …, a p = q = 0,5:
81
Prema priloţenim grafikonima izlazi da pri povećanju broja n histogram ima sve veći
broj stupaca s manjom bazom, tako da za velik broj n histogram prelazi u kontinuiranu
krivulju kojom se pribliţava grafiĉkom prikazu normalne razdiobe kao graniĉnoj vrijednosti.
Kao svakoj teorijskoj razdiobi tako su i normalnoj razdiobi pridruţene funkcija
vjerojatnosti i funkcija razdiobe.
Normalna sluĉajna varijabla X je rasporeĊena prema zakonu normalne razdiobe, tj. X ~
N (, σ2), ako je podruĉje njezinih vrijednosti od –∞ do +, a funkcija vjerojatnosti
f x e
x
( )( )
1
2
1
2
2
; xR (1)
gdje je:
x – tekuća vrijednost sluĉajne varijable
– oĉekivana vrijednost ili aritmetiĉka sredina
σ – standardna devijacija
e – baza prirodnog logaritma (2,71828)
π – konstanta (3,14159).
Funkcija vjerojatnosti se kod kontinuiranih razdioba naziva gustoćom razdiobe.
Iz (1) slijedi da je normalna razdioba jednoznaĉno odreĊena s dva parametra:
matematičkim očekivanjem () i varijancom (σ2). Oznaka za normalnu razdiobu je: N
( , σ2).
Funkcija f(x) je parna funkcija, pozitivna za sve vrijednosti sluĉajne varijable, pa je
normalna razdioba prema obliku simetriĉna krivulja kojoj je os simetrije pravac x = , iz
ĉega slijedi da je za svaku normalnu razdiobu koeficijent asimetrije α3 = 0 i da su
vrijednosti aritmetiĉke sredine (matematiĉkog oĉekivanja), medijana i moda meĊusobno
jednake.
Normalna razdioba ima zaobljenost “u obliku zvona”, unimodalna je s vrhom na pravcu x
= i s dva kraka koji se asimptotski pribliţavaju osi x; koeficijent zaobljenosti α4 = 3. Toĉke
infleksije imaju apscise + σ.
Grafiĉki prikaz normalne krivulje dan je na grafikonu :
82
Egzaktan oblik normalne razdiobe ovisi o parametrima i σ2
:
krivulja je uţa i viša što je σ2, odnosno σ (standardna devijacija) manja i obrnuto, šira i
plosnatija s porastom standardne devijacije,
krivulja se porastom matematiĉkog oĉekivanja pomiĉe uzduţ apscise udesno, odnosno
ulijevo sa smanjenjem .
Utjecaj parametara i σ2
na oblik normalne krivulje
1. 1 2
2. 1
2
2
2
3. 1 2
1
2
2
2
4. 1 2
1
2
2
2
5. 1 2
1
2
2
2
6. 1 0
1
2 1
83
Funkcija razdiobe F(x) za normalno distribuiranu varijablu je funkcija kojom je
izraţena vjerojatnost P X x F x( ) ( ) , tj. da će sluĉajna varijabla X poprimiti vrijednosti
jednake ili manje od x. Funkcija razdiobe predstavlja kumulativni niz vjerojatnosti za
vrijednosti sluĉajne varijable od x i manje od x, pa je prema tome:
F x f x dx
x
( ) ( )
F x e dx
xx
( )( )
1
2
1
2
2
U geometrijskom smislu vrijednosti funkcije razdiobe predstavljaju dio površine ispod
normalne krivulje.
Numeričke značajke normalne razdiobe su:
1. Matematiĉko oĉekivanje
xf x dx( )
2. Varijanca
2 2
x f x dx( )
3. Koeficijent asimetrije 3 = 0
4. Koeficijent zaobljenosti 4 = 3
Da bi se empirijske razdiobe mogle usporeĊivati potrebno je da normalna razdioba ima
jediniĉni oblik odnosno oblik koji ne zavisi od parametra i 2. Zato je uzeto da je =0, a
2=1 i ta normalna razdioba nazvana je standardizirana ili jedinična normalna razdioba, a
do nje se dolazi uvoĊenjem nove standardizirane varijable koja glasi:
zx
Gustoća standardizirane sluĉajne varijable je:
f z ez
( ) 1
2
1
2
2
,
odnosno umjesto f(z) moţe se koristiti oznaka (x) N (0, 1).
84
Vrijednosti Y(z) za pojedine vrijednosti z dane su u Tablici ordinata gustoće jediniĉne
normalne razdiobe. Vrijednosti f(z) ili (x) predstavljaju ordinate normalne razdiobe.
Svakoj teorijskoj razdiobi f(x) pripada funkcija razdiobe koja se dobiva sumiranjem
vjerojatnosti od normalne razdiobe:
f x e
x
( )( )
1
2
1
2
2
Funkcija razdiobe za normalno distribuiranu varijablu predstavlja vjerojatnost
P X x F x( ) ( ) da će sluĉajna varijabla X poprimiti vrijednosti koje su jednake ili manje od
x. Funkcija razdiobe predstavlja kumulativni niz vjerojatnosti za vrijednosti sluĉajne varijable
od x i manje od x.
F x f x dx
x
( ) ( )
F x e dx
xx
( )( )
1
2
1
2
2
U geometrijskom smislu vrijednosti funkcije razdiobe predstavljaju površinu ispod
normalne krivulje. Radi primjene u praksi izraĊene su tablice koje sadrţe vrijednosti funkcije
razdiobe za jediniĉnu normalnu razdiobu. Ta funkcija razdiobe glasi:
F x e dtt
x
( ) /
1
2
2
Funkcija razdiobe za jediniĉnu normalnu razdiobu povezana je sa Laplaceovom
funkcijom koja glasi:
( ) /x e dtt
x
1
2
2
0 , (Gaussov integral)
s tim da treba uzeti u obzir da vrijedi identitet:
( ) ( ) .x F x 05 .
Vrijednosti Gaussovog integrala su tabelirane i nalaze se u odgovarajućoj statistiĉkoj
tablici koja u praksi ĉesto ima razliĉite nazive, npr.:
tablica površine ispod normalne krivulje,
površine ispod jediniĉne normalne krivulje,
vrijednosti funkcije razdiobe jediniĉne normalne krivulje,
Laplaceova funkcija.
Za korištenje Tablice površina ispod normalne krivulje koristi se tzv. sigma pravilo
koje glasi da se unutar odreĊenog intervala nalazi odgovarajući postotak svih vrijednosti
kontinuirane sluĉajne varijable X. Prema tablici, u intervalu od –1 do +1 standardne devijacije
nalazi se 68.26% svih vrijednosti neprekidne sluĉajne varijable, u intervalu od –2 do +2
85
standardne devijacije 95.45% svih vrijednosti, a u intervalu od –3 do +3 standardne devijacije
99.73% svih vrijednosti neprekidne sluĉajne varijable:
P z( ) . 1 1 06826
P z( ) . 2 2 09545
P z( ) . 3 3 09973.
U praksi se Tablica površine ispod normalne krivulje koristi na dva naĉina:
1. zadan je interval pa treba naći vjerojatnost odnosno površinu,
P z( ) . .
.
1 1 034134 034134
0 68268
2. zadana je površina odnosno vjerojatnost, a treba naći interval.
P = 95% to znaĉi da je vjerojatnost od 0.95000
95%:2 475% 047500 . . za tu vrijednost se pronaĊe u tablici koji je to z
99%:2 495% 049500 . . ako nema te vrijednosti uzima se prva veća.
Izraĉunavanje vjerojatnosti da se sluĉajna varijabla X nalazi u intervalu od a do b
odreĊuje se pomoću formule:
P a X bb a
( )
.
86
VJEŢBA 5.2.3. Normalna razdioba
Zadatak 5.2.3.1. Ispitati vezu izmeĊu binomne i normalne razdiobe grafiĉki, tako da se
uzme B (n; 0,5) gdje n varira: n=6, 24, 50,.... Pokazati da, kad je p=q i n ,
tada B N .
Zadatak 5.2.3.2. Ispitati vezu izmeĊu binomne i Poissonove razdiobe takoĊer gra-fiĉki
tako da se uzme B (60, p) gdje p varira: 0,5; 0,1; 0,01... .
Pokazati da, kad n i p0, tada B P ().
Zadatak 5.2.3.3. Ispitati utjecaj parametara i 2 na oblik normalne razdiobe tako da se
grafiĉki prikaţu ove razdiobe:
1) 1 = 2 = 10 i 2 2
1 2 2
2) 1 = 2 = 10 i 2 2
1 22, 5
3) 1 = 10, 2 = 3 i 2 2
1 2 2
4) 1 = 10, 2 = 3 i 2 2
1 22, 5
5) = 0, 2
1 1 .
Na temelju grafikona objasniti opravdanost uvoĊenja jediniĉne
(standardizirane) normalne krivulje.
Zadatak 5.2.3.4. Koristeći Tablicu ordinata gustoće jediniĉne normalne razdiobe nacrtati
razdiobu uzevši u obzir desetak vrijednosti z u intervalu od 0,00 do 3,90. Za
usporedbu koristiti raĉunalni program za crtanje normalne razdiobe. Objasniti
zbog ĉega su se pojavile razlike u kvaliteti grafiĉkog prikaza.
Zadatak 5.2.3.5. Na temelju Tablica površina ispod normalne krivulje, odnosno
Laplaceove funkcije:
1) izraĉunati vjerojatnost, ako z = –0,5 i ako –0,5 z 0,5;
2)izraĉunati u kojem se intervalu nalazi 95% površine ispod normalne krivulje,
odnosno 95% svih vrijednosti kontinuirane sluĉajne varijable.
Zadatak 5.2.3.6. Mjerenjem brzine vozila na odreĊenoj dionici prometnice dobiveni su
ovi podaci:
Brzina u km/h Broj vozila
50 – 60 13
60 – 70 16
70 – 80 25
80 – 90 31
90 – 100 22
100 – 110 14
110 – 120 12
120 – 130 11
Ukupno 144
Uz pretpostavku normalne razdiobe izraĉunati:
1) vjerojatnost da će brzina vozila biti izmeĊu 70 i 90 km/h,
87
2) vjerojatnost da će brzina biti veća od 100 km/h,
3) vjerojatnost da će brzina biti manja od 70 km/h,
4) vjerojatnost da će brzina biti veća od 70 km/h.
■
88
5.3. 2 – test (hi-kvadrat test)
pojam statistiĉkog testa
veza izmeĊu empirijske i teorijske razdiobe
pojam teorijske frekvencije
hipoteza (nulta i alternativna)
uvjet za 2 test
izraĉunavanje vrijednosti 2
tablica kritiĉne vrijednosti 2 razdiobe
odluka o prihvaćanju hipoteze
Statistički testovi su metode koje se koriste u usporedbi izmeĊu empirijskih i teorijskih
razdioba radi donošenja odluke ponaša li se empirijska razdioba prema nekoj teorijskoj
razdiobi.
Od svih testova 2- test se najviše koristi u praksi. Sluĉajna varijabla ĉesto slijedi
zakonitost neke teorijske razdiobe i ako je to sluĉaj onda se za analizu promatrane pojave
mogu koristiti numeriĉke karakteristike teorijske razdiobe prema kojoj se ponašaju empirijski
podaci. Na taj naĉin uštedi se vrijeme i novac radi prikupljanja podataka za promatranu
pojavu te se u tom sluĉaju odmah koristi odgovarajuća teorijska razdioba.
Primjerice: broj pristiglih brodova u luku je sluĉajna varijabla zato jer taj broj ne
ovisi o danu, satu i luci; kaţe se da ovisi o sluĉaju. Bez obzira što je broj pristiglih
brodova sluĉajna varijabla, analiziranjem podataka o broju pristiglih brodova ustanovljeno
je da slijedi zakonitosti Poissonove razdiobe. To znaĉi da se kod svakog daljnjeg dolaska
u luku moţe uzeti pretpostavka (iako to ne mora biti uvijek) da za broj brodova vrijede
znaĉajke Poissonove razdiobe. Prema tome, koristeći Poissonovu razdiobu mogu se
odrediti vjerojatnosti da će broj brodova poprimiti neku vrijednost x, P(X=x).
Empirijske frekvencije su frekvencije dobivene na temelju statistiĉkog promatranja, a
teorijske frekvencije su frekvencije koje pripadaju odreĊenoj teorijskoj razdiobi i koje se
izraĉunavaju na odgovarajući naĉin. Teorijske frekvencije su frekvencije ĉije se vrijednosti
ponašaju prema zakonitosti odgovarajuće teorijske razdiobe.
2– test je test kojim se usporeĊuju empirijske s teorijskim frekvencijama. Razlika
izmeĊu fi i fti moţe biti malena (sluĉajna), odnosno velika (znaĉajna). Ako je razlika malena
pripisuje se sluĉaju i kaţe se da, bez obzira što postoji razlika, moguće je prihvatiti da se
empirijska razdioba ponaša prema teorijskoj razdiobi. Ako je razlika izmeĊu fi i fti velika,
onda se kaţe da je razlika znaĉajna, odnosno da se empirijska razdioba ne ponaša prema
teorijskoj. Drugim rijeĉima, rezultat 2– testa je donošenje odgovarajuće odluke koja se
odnosi na prihvaćanje ili nul-hipoteze (H0) ili alternativne hipoteze (H1).
H0 : empirijska razdioba se ponaša (slijedi zakonitosti) prema odabranoj teorijskoj
razdiobi (Poissonova, binomna, …)
H1 : empirijska razdioba se ne ponaša prema odabranoj teorijskoj razdiobi.
Hipoteza H0 se prihvaća kada je razlika fi - fti malena (sluĉajna), a hipoteza H1 se
prihvaća kada je razlika fi - fti velika (statistiĉki znaĉajna) vrijednost hi kvadrata se izaĉunava
prema formuli:
89
2
2
1
f f
f
i ti
tii
n
,
gdje su:
fi – empirijske frekvencije (zadane),
fti – teorijske frekvencije (treba izraĉunati).
Za Poissonovu i binomnu razdiobu teorijske frekvencije se raĉunaju po formuli:
f N P xti ( ) ,
a za normalnu razdiobu:
)(zYi
Nf ti
,
gdje je:
N – ukupan broj jedinica,
i – veliĉina razreda,
Y(z) – ordinata jediniĉne normalne razdiobe koja se oĉitava iz tablice gustoće jediniĉne
normalne razdiobe ovisno o vrijednosti standardizirane sluĉajne varijable.
Za donošenje odluke o prihvaćanju H0, odnosno H1 potrebno je izraĉunati vrijednost 2
sa tabliĉnom vrijednosti 0
2 koja predstavlja dozvoljeni iznos razlike izmeĊu fi i fti .
Uvjet za 2 test:
N > 100 , fti > 5.
Ako uvjet nije zadovoljen onda se ne preporuĉa primjena 2 testa.
Vrijednost 2 je maksimalno odstupanje koje je dozvoljeno s obzirom na broj stupnjeva
slobode i razinu signifikantnosti.
Oĉitavanje 0
2 obavlja se iz tablice kritične vrijednosti 2 razdiobe, uzevši u obzir broj
stupnjeva slobode i postotak signifikantnosti, odnosno znaĉajnosti. Broj stupnjeva slobode k
iznosi:
za binomnu i Poissonovu razdiobu k = n-2,
za normalnu razdiobu k = n-3 ,
gdje je n broj parova vrijednosti fi i fti , odnosno broj redaka u tabeli, a – razina
signifikantnosti, tj. postotak dozvoljenog rizika.U praksi se kreće od 5% prema 1%. Rizik ne
moţe biti 0%.
Ako nije ispunjen uvjet da je fti > 5 potrebno je zbrajati teorijske frekvencije dok se ne
ispuni taj uvjet.
Postotak signifikantnosti prihvaća odreĊeni rizik pri testiranju, npr.: testiranje na razini
5% signifikantnosti dozvoljava rizik od 5% sluĉajeva, a postotak signifikantnosti od 1%
dozvoljava rizik u prosjeku od 1% sluĉajeva.
90
Odluka o prihvaćanju hipoteze:
2
0
2 2 je manji od dozvoljenog iznosa odstupanja ili razlike, što znaĉi da se
prihvaća nulta hipoteza (H0) da se empirijska razdioba ponaša prema zakonitostima odabrane
teorijske razdiobe,
2
0
2 graniĉni sluĉaj
2
0
2 2 prelazi dozvoljeni iznos odstupanja izmeĊu fi i fti te se prihvaća
alternativna hipoteza da se empirijska razdioba ne ponaša prema odabranoj teorijskoj
razdiobi.
91
VJEŢBA 5.3. TESTIRANJE PODUDARNOSTI EMPIRIJSKE
S TEORIJSKOM RAZDIOBOM
Zadatak 5.3.1 Broj studenata koji dnevno dolazi u knjiţnicu tijekom promatranog tjedna
iznosio je: 50, 62, 39, 46 i 53 studenta. Na razini 5% znaĉajnosti ispitati
pretpostavku o uniformnoj razdiobi dnevnog broja studenata tijekom radnih
dana knjiţnice.
Da li se broj studenata statistiĉki znaĉajno razlikuje ovisno o danu u
tjednu? Ako ne postoji znaĉajna razlika koliki bi trebao biti oĉekivani broj
studenata i knjiţnici petkom?
Zadatak 5.3.2. Na temelju podataka iz zadatka 5.1.6. ispitati na razini 5% znaĉajnosti moţe li
se prihvatiti pretpostavka da se sluĉajna varijabla X ponaša prema binomnoj
razdiobi.
Rezultat provjeriti grafiĉki ucrtavanjem empirijskih i teorijskih
frekvencija.
Zadatak 5.3.3. Na temelju podataka iz zadatka 5.2.6. ispitati pretpostavku da se broj
prometnih nesreća dnevno ponaša prema Poissonovoj razdiobi. Testiranje
provesti na razini 5% i 1% znaĉajnosti.
Objasniti kako promjena razine znaĉajnosti utjeĉe na rezultat.
Zadatak 5.3.4. Ako je u prethodnom zadatku prihvaćena nul-hipoteza, odrediti koliki je
oĉekivani broj dana bez prometnih nesreća.
Zadatak 5.3.5. Testirati pretpostavku da uzorak iz zadatka 5.3.6. o broju vozila prema brzini
potjeĉe iz osnovnog skupa normalne razdiobe. Testiranje provesti na razini 5%
znaĉajnosti.
Zadatak 5.3.6. Ako je razdioba vozila prema brzini iz prethodnog zadatka normalno
distribuirana koliki je oĉekivani broj vozila s brzinom do 100 km/h, odnosno
iznad 100 km/h?
Zadatak 5.3.7. Moţe li se za empirijsku razdiobu broja dana prema broju telefonskih poziva
dnevno (prikazanoj u tabeli 4. ovog priruĉnika) ustanoviti zakonitost, odnosno
odrediti teorijska razdioba prema kojoj se ponaša navedena empirijska
razdioba. Testiranje provesti na razini 5% znaĉajnosti.
■