Post on 08-Mar-2016
description
Doc. dr Mirjana Landika Prof. dr uro Miki
METODI STATISTIKE ANALIZE
- primjena u oblasti zdravstvenih, sportskih i inenjerskih nauka -
Banjaluka, 2015.
METODI STATISTIKE ANALIZE - primjena u oblasti zdravstvenih, sportskih i inenjerskih nauka -
Autori:
Doc. dr MIRJANA Landika, Prof. dr URO Miki
Recenzenti: Prof. dr NEBOJA Ralevi, prof. dr IVANA Ljubanovi - Ralevi
Lektor:
BILJANA Koji, profesor srpskog jezika i knjievnosti
Izdava: Panevropski univerzitet "APEIRON", Banja Luka, 1. izdanje, godina 2015.
Odgovorno lice izdavaa:
DARKO Uremovi
Glavni i odgovorni urednik: Dr ALEKSANDRA Vidovi
DTP:
SRETKO Boji
tampa: MARKOS design&print studio, Banja Luka
Odgovorno lice tamparije:
IGOR Jakovljevi
EDICIJA: Ekonomska biblioteka knj. 107
ISBN 978-99955-91-64-9
Na osnovu lanova 241, 286. 287.Statuta i izvjetaja o publikaciji Centra za izdavaku djelatnost Panevropskog univerziteta Apeiron, Senat na sjednici odranoj 21. jula 2015. godine donosi odluku
broj: 2045-5-2/15, kojom se odobrava izdavanje ovog udbenika.
3
SADRAJ
1. UVOD ...................................................................................................................................... 9 1.1. Prikupljanje statistikih podataka, formiranje statistike serije,
tabelarno i grafiiko prikazivanje statistikih serija ....................................................... 11
2. DESKRIPTIVNA ANALIZA ............................................................................................. 34 2.1. Mjere centrlane tendencije .............................................................................................. 34
2.1.1. Aritmetika sredina prosjek ......................................................................................... 34 2.1.2. Geometrijska sredina ...................................................................................................... 42
2.2. Momenti statistike serije ............................................................................................... 52 2.3. Pozicione srednje vrijednosti .......................................................................................... 64
2.3.1. Modus ............................................................................................................................. 64 2.3.2. Medijana; Kvartili; Decili; Percentili ............................................................................. 68
2.4. Mjere varijabiliteta .......................................................................................................... 79 2.4.1. Apsolutne mjere varijabiliteta ......................................................................................... 79 2.4.2. Apsolutne mjere varijabiliteta ......................................................................................... 90 2.4.3. Mjere asimetrije, zaobljenosti i koncentracije ................................................................ 95
3. OSNOVI TEORIJE VJEROVATNOE I TEORIJSKI RASPOREDI ....................... 122 3.1. Osnovni pojmovi teorije vjerovatnoe .......................................................................... 122
3.1.1. Modeli distribucije vjerovatnoe kontinuirane sluajne promjenljive .......................... 145
4. STATISTIKO ZAKLJUIVANJE ............................................................................... 158 4.1. Statistiko ocjenjivanje nepoznatih parametara osnovnog skupa ................................. 158
4.1.1. Statistiko ocjenjivanje aritmetike sredine i totala osnovnog skupa ........................... 159 4.1.2. Statistiko ocjenjivanje procenta uea osnovnog skupa ............................................ 169 4.1.3. Statistiko ocjenjivanje varijanse (standardne devijacije) osnovnog skupa ................. 176
4.2. Testiranje statistikih hipoteza ..................................................................................... 181 4.2.1. Statistiko testiranje hipoteza o aritmetikoj sredini osnovnog skupa ......................... 183 4.2.2. Testiranje hipoteza o procentu uea osnovnog skupa ............................................... 193 4.2.3. Statistiko testiranje hipoteza o vrijednosti varijanse osnovnog skupa ........................ 200 4.2.4. Statistiko testiranje hipoteza o razlici aritmetiih sredina dvaju osnovnih skupova ... 206 4.2.5. Statistiko testiranje hipoteza o razlici procenta dvaju osnovnih skupova ................... 213 4.2.6. Statistiko testiranje hipoteza o varijansi dvaju osnovnih skupova
analiza varijanse; F test ........................................................................................... 221 4.3. Neparametraski testovi ................................................................................................. 227
4.3.1. Test predznaka (sign test) test hipoteze o vrijednosti medijane osnovnog skupa ...... 228 4.3.2. Wilcoxonov test (Wilcoxon one sample signed rank test) test pretpostavljene
vrijednosti medijane u odnosu na predznak razlike vrijednosti statistikog obiljeja i medijane ....................................................................................................... 232
4.3.3. Wilcoxonov test (Wilcoxon mached pairs signed rank test) test pretpostavljene vrijednosti na bazi ekvivalentnih parova statistikih obiljeja ..................................... 236
4.3.4. Mann Whitney Wilcoxonov test za nezavisne uzorke ............................................ 241 4.3.5. Test homogenosti statistike serije (runs test) ........................................................... 245 4.3.6. Test Kolmogorov Smirnova ...................................................................................... 265 4.3.7. Kuskal Wallisov i Friedmanov test analiza varijanse na bazi rang promjenljivih .. 268
5. REGRESIONA I KORELACINA ANALIZA ................................................................ 289 5.1. Osnovni pojmovi regresionog modela .......................................................................... 289 5.2. Modeli proste linearne regresije ................................................................................... 292
4
5.2.1. Statistiko testiranje hipoteza u modelu proste linearne regresije ................................ 297 5.2.2. Prosta linearna korelacija koeficijent korelacije ........................................................ 299 5.2.3. Ocjenjivanje i predvianje vrijednosti zavisne promjenljive ........................................ 304
5.3. Jednostavna krivolinijska regresija ............................................................................... 319 5.4. Odabrani modeli nelinearne regresije ........................................................................... 325
6. OSNOVNA ANALIZA VREMENSKIH SERIJA .......................................................... 338 6.1. Grafiko prikazivanje i komparacija vremenskih serija ............................................... 339 6.2. Pokazatelji dinamike ..................................................................................................... 346 6.3. Indeksi ........................................................................................................................... 349 6.4. Odabrani modeli vremenskih serija .............................................................................. 356
6.4.1. Modeli trenda ................................................................................................................ 357 6.4.2. Metode izravnavanja vremenske serije ......................................................................... 367
LITERATURA:......................................................................................................................... 383
5
RECENZIJA
Udbenik Metodi statistike analize - primjena u oblasti zdravstvenih, sportskih i
inenjerskih nauka autora Mirjane Landika i ure Mikia, prema kritikom miljenju i
opreznoj ocjeni recenzenata, predstavlja konsolidovani tekst statistike teorije i prakse
udbenikog profila, prevashodno namjenjen studentima zdravstvenih, sportskih i inenjerskih
disciplina.
Potrebno je naglasiti da pojedini segmenti udbenika tretiraju odgovarajua teorijska
pitanja statistike metodologije, ali istovremeno i konkretnu primjenu ove teorije u medicinskoj,
sportskoj i inenjerskoj praksi. Ako je ortodoksna statistika nauka na pogrenom putu, zablude
ne lee u nadgradnji,sainjenoj na brizi logike dosljednosti, ve u premisama kojima nedostaje
jasnoa i optost. Stoga teorijske preferencije i apstraktni dokazi, kao i empirijske provjere, uz
povremmene kontraverze, mogu ostvariti svoj cilj, tj.motivisati itaoceda, u rjeavanju odreenih
problema, kritiki preispituju potvuju ili oponiraju vlastite hipoteze, slijede upravo brojne
pokazane primjere u udbeniku.
Dakle, cilj autora je da pokae i objasni, ne samo sopstvena stanovita i njihova odstupanja
u odnosu na konvencionalni pristup ve i univerzalnu primjenu statistikih alata u pogledu
sticanja futuristikih znanja u prevazilaenju oprenih uvjerenja i savladavanju stohastike
neoreenosti. Sa druge strane, knjiga ispoljava vidljive znakove i rezultate upotrebe i djelovanja
statistike snage u obuhvatanju promjena u navedenim oblastima tako da se moe smatrati
svjedokom nastojanja autora da se rjee brojni problemi i potvrde oekivanja u nastajanju
materijalne istine vezane za otkrivanje zakonomjernosti ponaanja pojedinih pojava.
Pisanje udbenika je oigledno bio ozbiljan napor autora da izbjegne puku sistematizaciju i
organizaciju podataka ve promovie metod statistike analize u sadanjosti determinisan pod
uticajem promjenljivh verzija budunosti. Udbenik je struktuiran u est standardnih poglavlja
(Uvod, Deskriptivna analiza, Vjerovatnoa i kombinatorika, Statistiko zakljuivanje,
Regresiona i korelaciona analiza i Analiza vremenskih serija) iji su dijelovi harmonino
komponovani u metodoloku i strunu cjelinu, a za usvajanje i primjenu izloene materije
neophodna su elementarna matematika i informatika zananja.
Simbolike pseudomatematike metode, koje matematikom sintaksom formalizuju
modele sistema, esto neopravdano pretpostavljaju da su odnosni inioci i njihovi uticaji potpuno
6
nezavisni. Time se umanjuje uvjerljivost i autoritet statistikih postupaka a poetne hipoteze
(uvjerenja) ispostave nepotvrena. U uobiajenom rezonovanju moemo da imamo na umu
potrebne rezerve i ogranienja, kao i eventualne korekcije, jer pretjerano zahtjevno uee
matematike ekonomije moe da vodi u pekulaciju, toliko spornu, koliko sporne i polazne
pretpostavke.
Udbenik je u potpunosti osloboen navedenih rezervi i nepotrebnih sumnji tako da svoga
autora dovodi u korektan i odgovoran odnos u pogledu sagledavanja sloenosti i meuzavisnosti
u realnom svijetu rastereenog pretencioznim matematikim simbolima.
Autor preuzima odgovornost za eventualne nedostatke ali sa zahvalonou prim a sve
primjedbe i sugestije strune javnosti koje bi doprinijele unapreenju kvaliteta sledeeg izdanja.
Banja Luka, 12.7.2015.
7
PREDGOVOR
U pogledu kontinuiranog razvoja teorije statistikih metoda i njene doslijedne primjene
i provjere u medicinskoj, sportskoj i Inenjerskoj praksi, sainjen je udbenik: Metodi
statistie analize primjena u oblasti zdravstvenih, sportskih i inenjerskih nauka sa kojim
bi dalje iskustvo u nastavi pokazalo gdje i kada bi se moglo izvrsiti olakanje izlaganja i
usvajanja odredjenih poglavlja od posebne vaznosti. Panja autora je posebno usmjerena na
zadovoljavavanje metodolokih kriterija, ali i znatno proirena na aspekte validnosti
empiriskog mjerenja i eksperimentalnog rada, generisanja statistikih podataka u okviru
postupka statistikog istraivanja, razmatranja osnovnih pojmova matematike distribucije u
okviru teorije vjerovatnoe, provjeravanja statistikih hipoteza, utvrivanja ocjena i greaka
ocjena karakteristika pojedinih parametara, ispitivanja statistike povezanosti varijacija i
stepena kvantitativnog slaganja kao i analize vremenskih serija.
U skladu sa izloenim intencijama dodani su brojni primjeri iz prakse za navedene
oblasti kako bi se olakalo razumjevanje doprinosa statistikih metoda i odgovorilo na neka
praktina pitanja za potrebe rjeavanja raznih izazova koji ekaju svoju konkretnu
verifikaciju. Izvrena je odredjena konsolidacija gradiva koje se odnosi na deskriptivnu
statistiku kao i potrebna koncentracija preferencija kljunih pitanja ispitnog programa iz
predmeta: Statisticke metode, sastavljenog i prvenstveno namjenjenog studetima univerziteta
APEIRON za sticanje znanja neophodnih za uspjena istraivanja u zvanjima za koje se
spremaju.
Svrha ovog udbenika je dakle osposobiti medicinsku, sportsku kao i inenjersku
profesiju mogunostima istraivanja i analize na bazi dragocjene statistike indikacije kao i
pravilnoj ocjeni, selekciji, upotrebljivosti i vjerodostojnosti podataka od cijeg nivoa
kritinosti direktno zavisi i nivo naunosti izvedenog rezultata. Daljim provoenjem
statistikog postupka i obradom statistikog materijala dobijene pokazatelje i koeficijente
potrebno je razumjeti u kontekstu analize strukture i dinamike povezanosti pojava iz
navedenih podruja pa je iz takvog postavljenog zahtjeva temeljno obraeno i primjerima iz
prakse obogaeno podruje teorije vjerovatnoe, teorije uzorka, korelacione i regresione
analize kao i odjeljak analize vremenskih serija. Gotovo cjelokupna sportska, medicinska i
inenjerska obiljeja imaju kvantitativni i stohastiki karakter to ukazuje na nezaobilaznu
udbeniku pomo i solidno poznavanje moderne statistike analize u smislu i sa ciljem
8
otkrivanja zakonitosti ponaanja odreenih pojava sportskog, medicinskog ili inenjerskog
predznaka, a to je i posluilo kao polazni motiv i dodatna inspiracija u pisanju ovog
udbenika. Takoe, udbenik je velikim djelom rezultat viegodinjeg rada autora na
statistikom obrazovanju profila navedenih profesija prvog ciklusa ali moe da slui i svima
drugima koji koriste statistike metode, jer njegova primarna primjena ne ograniava
upotrebljivost i u drugim oblastima nauno istraivakog rada.
Udbenik sadri est sledeih poglavlja koja u svom prirodnom poretku ine sklad i
cjelinu udbenike grae edukativnog tipa:
- Plan i program statistikog istraivanja, gdje su obuhvaeni i primjerima
ilustrovani opti elementi i faze statistikog istraivanja.
- Deskriptivna analiza, gdje su izloene i primjerima ilustrovane mjere centralne
tendencije, mjere varijabiliteta, kao i mjere oblika rasporeda.
- Teorijski modeli i funkcije raspodjel,a gdje su obuhvaeni jednodimenzionalni i
dvodimenzionalni disketni i indiskretni teorijski rasporedi u okviru zakona vjerovatnoe.
- Analiza uzorka, gdje su dati osnovni pojmovi iz podruja reprezentativne i anlize
sa osvrtom na obim, izbor i reprezantativnost, kako bi se itaocima olakalo
savladavanje i koristenje metoda ocjenivanja i testiranja u cilju statistikog zakljuivanja
i donoenja statistikih sudova.
- Korelaciona i regesiona analiza, sa posebnom panjom na odreivanje, sa jedne
strane uzrocno-posljedicne povezanosti a sa druge stepena, smjera i intenziteta
kvantitativnog slaganja u paralelizmu varijacija i slinosti njihovih uticaja.
- Analiza vremenskih serija, gdje se posebno naglaava trend kao razvojna
vremenska komponenta odnosno kao prilagodjena i ekstrapolisana funkcija koja najbolje
ispoljava razvojnu tendenciju pojave i moe se koristiti kao vrlo efikasan metod
prognoziranja.
Objavljivanjem ovog udbenika autor je imao u vidu korisnost brojnih priloga i
miljenja studenata, kolega i druge dobronamjerne strune javnosti tako da i dalje, sa
posebnim zadovoljstvom i zahvalnou ostaje otvoren i raspoloen za konstruktivne kritike,
sugestije i primjedbe koje bi nesporno doprinjele kvalitetu sljedeeg izdanja.
9
1. UVOD
Statistika analiza primjenjuje se u oblastima strune, naune i praktine djelatnosti, kao to
su analiza optih osobina masovne pojave kao oblika kretanja varijacija, predvianje buduih
ishoda, donoenje sudova i zakljuaka. U okviru statistikog istraivanja razlikujemo sljedee
faze:
- Prikupljanje statistikih podataka;
- Formiranje i prikazivanje statistike serije;
- Statistika analiza;
- Publikacija i interpretacija rezultata statistikog istraivanja.
Osnovni pojamovi u statistikoj analizi su statistiki skup, populacija (osnovni skup) i
uzorak. Statistiki skup obuhvata elemente kojima se odreuju kvalitaitivne i kvantitativne
osobine, takav skup moe biti realan ili hipotetiki, kao i konaan ili beskonaan. Skup podataka
u odnosu na svaki pojedini element naziva se populacija, a dio populacije je uzorak.
Statistiki podaci su obiljeja odreenih elemenata statistikih skupova, a predstavljaju osnov
za razlikovanje jedinica statistikog skupa. Obiljeja jedinica statistikog skupa predstavljaju
promjenljive u statistikim analizama. Pojavni oblici odreenih osobina nazivaju se modaliteti.
Statistika graa prikuplja se planski, pri emu se koriste metode posmatranja ili statistikog
eksperimenta, uz uslov da su posmatrane osobine masovne i varijabilne. Masovnost osobina
odnosi se na pretpostavku da statistiki skup sadri veliki broj jedinica, dok varijabilnost
podrazumijeva da se jedinice statistikog skupa meusobno razlikuju u pogledu odreenih
osobina ili da odreene osobine kod posmatrane jedinice statistikog skupa iskazuju
promjenljivost vremenu ili prostoru.
Izvori iz kojih se prikuplja statistika graa mogu biti primarni i sekundarni. Primarni izvori
podtaka odnose se na dio statistike grae koji se prikuplja posmatranjem ili statistikim
eksperimentom (najee je to anketa), pri emu se njihov kvalitet i kvantitet prilagoava
zahtjevima konkretnog statistikog istraivanja. Sekundarni izvori podataka predstavljaju javne
podatke odreenih institucija ili informacionih sistema ukljuujui podatke dostupne u okviru
globalne svjetske mree (www).
Statistika serija predstavlja niz ureenih statistikih podataka, koji se formira na bazi
prikupljene statistike grae. Najprije se jedinice statistikog skupa ralane prema osobinama i
10
njihovim modalitetima, zatim se prikupljena graa grupie u odgovarajue podskupove koji
moraju zadovoljiti zahtjev nepreklapanja. Broj jedinica statistikog skupa koje imaju istu ili
slinu vrijednost posmatrane ili mjerene osobine naziva se apsolutna frekvencija ili uestalost.
Relativna frekvencija ili procent uea izraava se kao odnos apsolutne frekvencije i obima
pojave. Nakon grupisanja vri se redanje grupa prema intezitetu mjerenog obiljeja kako bi se
formirala statistika serija.
Statistika graa moe biti numerika, prostorna, vremenska i atributivna. Numerika
obiljeja u statistikoj seriji redaju se u nominalnu ili rednu skalu prema intenzitetu mjerenog
obiljeja. Prostorna obiljeja se redaju prema udaljenosti od referentne take. Vremenska
obiljeja se redaju hronoloki. Atribuivna obiljeja se redaju prema intenzitetu mjerenog
obiljeja ili prema konvencionalnom poretku prilagoeno prirodi podataka.
Prikazivanje statistike serije vri se tabelarno i grafiki. Jednostavni tabelarni prikaz
podrazumijeva prikaz statistike serije ralanjene po jednom obiljeju, a sloene tabele tabele
kontigencije koriste se za prikazivanje statistikih serija koje nastaju ralanjivanjem jedinice
statistikog skupa prema veem broju obiljeja.
Grafiko prikazivanje statistikih serija obuhavta dijagrame taaka, linijske i povrinske
dijagrame. Najpoznatiji linijski dijagrami su polarni i pravougaoni kordinatni sistem. Vaniji
povrinski dijagrami su: histogrami, poligon frekvencija i strukturni krug.
Statistika analiza obuhvata dva analitika pristupa, a to su deskriptivna i inferencijala
statistika analiza. Deskriptivna analiza obuhvata postupke kojima se ureuju, grupiu, tabelarno
i/ili grafiki prikazuju odgovarajui podaci i izraunavaju raznovrsni analitiki pokazatelji.
Sutina deskriptivne statistike analize jeste u tome da se njome dobijeni sudovi i zakljuci
projektuju na odgovarajue empirijske vrijednosti bez uoptavanja. Inferencijalna statistika
analiza polazi od uzorka, a njen osnovni zadatak odnosi se na izuavanje pojava i procesa
pomou dijelimine informacije, pri emu se zakljuci i rezultati uoptavaju, a najee se
odnose na testiranje statistikih hipoteza i procjenu nepoznatih parametara. Inferencijalna
statistika analiza obuhvata stohastike procese koji se pokoravaju zakonima vjerovatnoe i nije
ih mogue matematiki predviati. Prethodno pomenuti metodi zasnivaju se na teoriji
vjerovatnoe i upotrebi dijelimine (nepotpune) informacije o populaciji koja se analizira.
11
1.1. Prikupljanje statistikih podataka, formiranje statistike serije, tabelarno i grafiiko prikazivanje statistikih serija
Primjer 1.1. Ispitivanje stanovnika o simptomima i prevenciji gripe u zimskom periodu vri
se pomou anketnog upitnika, iji je izgled:
Molimo Vas da odvojite par minuta i iskreno
odgovorite na sljedea pitanja
1. Vaa starosna dob je:
2. Mjesto Vaeg stanovanja:
a. Centar grada
b. ire gradsko podruje
c. Prigradsko naselje
d. Ruralna sredina (selo)
3. Vaa kolska sprema:
a. Osnovna kola
b. Srednja kola
c. Via kola
d. Visoka kola
e. Magistar ili doktor nauka
4. Radni status:
a. Zaposlen(a)
b. Nezaposlen(a)
c. Penzioner(ka)
5. Da li ste bolovali od gripa:
a. Veoma esto (vie puta godinje)
b. esto (svake godine)
c. Povremeno (ne svake godine)
d. Rijetko ili nikada (ne sjeam se kada)
6. Da li ste preduzimali preventivne mjere
kako biste sprijeili grip:
a. Vakcinacija
b. Pomona ljekovita sredstva
(farmakoloka)
c. Pomona ljekovita sredstva
(prirodna ili domaa)
d. Nita od navedenog
7. Kako lijeite grip:
a. Odlazak ljekaru i pridavanje
dobijenih uputstava
b. Odlazak ljekaru i dijelimino
pridravanje uputstava
c. Samostalno uzimanje ljekova
d. Samostalno uzimanje pomonih
ljekovitih sredstava (farmakolokih)
e. Samostalno uzimanje pomonih
ljekovitih sredstava (prirodnih ili
domaih)
Hvala na iskrenosti i izdvojenom
vremenu!
Slika 1. Izgled anketnog upitnika za ispitivanje informisanosti ispitanika u pogledu prevencije i lijeenja gripa
12
Anketa je provedena na 40 ispitanika, pri emu su rezultati ankete bili sljedei:
V1 V2 V3 V4 V5 V6 V7 25 c b b b d b 53 b a a c d d 18 a b a d c b 58 b a b c c b 46 c c a a c b 19 c c a d a d 59 a b b c b d 63 a b a b b a 54 c d a d a b 58 b c a d b d 54 b d b b a a 21 b d c d c b 49 d a a c c e 28 b c a d b d 46 a a a a c c 61 b d a d d b 49 d c b c c e 20 b b c a a b 40 a e b b d c 50 a e b c a d 61 d c b d a e 45 d d c a a c 18 c b c a b a 26 c a c c d b 21 b b b a a a 54 a e a b a d 27 d a b c d c 40 d b b b b b 26 c d a c d b 26 a c b a a c 35 c a c a a c 63 b c c d c b 34 d b a d c c 67 b b b d a b 20 b d b d a a 22 b a a c b b 56 c a b b d a
13
44 b b b c d c 60 d b a b d a 58 c d a b d b
Slika 2. Rezultati ankete odgovori ispitanika
Za potrebe prikazivanja rezultata statistikog eksperimenta, obiljeja posmatranog
statistikog skupa (statistike promjenljive) predstavljene se oznakama V1, V2,..., V7 u odnosu
na redni broj pitanja u anketnom upitniku, pri emu V1 predstavlja prvo obiljeje (prvu
promjenljivu) starosna dob ispitanika, V2 predstavlja drugo obiljeje (drugu promjenljivu)
mjesto stanovanja ispitanika, V3 predstavlja tree obiljeje (treu promjenljivu) kolska
sprema ispitanika, V4 predstavlja etvrto obiljeje (etvrtu promjenljivu) radni status
ispitanika, V5 predstavlja peto obiljeje (petu promjenljivu) uestalost obolijevanja od gripa,
V6 predstavlja esto obiljeje (estu promjenljivu) metod prevencije od gripa i V7 predstavlja
sedmo obiljeje (sedmu promjenljivu) metod lijeenja gripa. Modaliteti obiljeja oznaeni su u
u kolonama ispod naziva promjenljive.
Potrebno je:
a. Formirti statistike serije prema dobijenim odgovorima na postavljena pitanja i tako
dobijene serije prikazati tabelarno uz prikazivanje kako apsolutnih tako i relativnih
frekvencija;
b. Urediti podatke koji se odnose na pitanja kolska sprema i Metod prevencije od
gripa sa jedne strane, te Metod lijeenja gripa sa druge strane.
Rjeenje:
a. Kako bismo izvrili formiranje statistike serije potrebno je urediti prikupljenu
statistiku grau, stoga je potrebno rezultate pojedinih statistikih promjeljivih urediti na
odgovarajui nain. Kako je promjenljiva V1 numerika promjeljiva, dok su ostale
promjenljive V2 V7 atributivne, nizove modaliteta vrijednosti pojedinih obiljeja
ureujemo prema intenzitetu mjerenog svojstva, ime dobijamo:
v1 v2 v3 v4 v5 v6 v7 18 a a a a a a 18 a a a a a a 19 a a a a a a 20 a a a a a a 20 a a a a a a 21 a a a a a a 21 a a a a a a
14
22 a a a a a b 25 b a a b a b 26 b b a b a b 26 b b a b a b 26 b b a b a b 27 b b a b a b 28 b b a b b b 34 b b a b b b 35 b b a b b b 40 b b a b b b 40 b b b c b b 44 b b b c b b 45 b b b c b b 46 b b b c c b 46 b c b c c b 49 c c b c c c 49 c c b c c c 50 c c b c c c 53 c c b c c c 54 c c b c c c 54 c c b c c c 54 c c b d c c 56 c d b d d c 58 c d b d d d 58 c d b d d d 58 d d b d d d 59 d d c d d d 60 d d c d d d 61 d d c d d d 61 d d c d d d 63 d e c d d e 63 d e c d d e 67 d e c d d e
Slika 3. Odgovori ispitanika ureeni prema intenzitetu mjerenog dejstva
a. Promjenljiva V1 je kontinuirana numerika promjenljiva, ureenja je u rastui brojni niz
koji emo grupisati u intervalnu statistiku seriju distribucija frekvencija. Za potrebe
formiranja statistike serije starosti ispitanika, modalitete promjenljive Starost ispitanika
grupisati emo u intervale, pri emu je potrebno odrediti:
- Broj intervala unutar kojih e biti uvrtene vrijednosti modaliteta u konkretnoj statistikoj
seriji (K). Zatim,
15
- Veliine formiranih intervala (i).
Pomenute veliine izraunavaju se koritenjem sljedeih obrazaca:
K =1+3,32log N gdje je N obim pojave (broj anketiranih lica)
Uvaavajui prirodu promjenljive K broj intervala mora biti prirodan broj.
gdje su:
Xmax modalitet obiljeja koji u posmatranoj statistikoj seriji ima najveu vrijednost;
Xmin modalitet obiljeja koji u posmatranoj statsistikoj seriji ima najmanju vrijednost;
K prethodno odreen broj intervala u statistikoj seriji.
U posmatranom primjeru je:
K = 1 + 3,32*log 40 = 1 + 3,32*log 40 =1 + 3,32*1,60206 = 1 + 5,32 = 6,32 | 6
Veliina intervala moe biti iskazana u obliku cjelobrojne ili racionalne vrijednost, ovdje
emo uzeti veliinu intervala 9, pri emu emo poslednji interval ostaviti otvoren. Intervalna
serija se formira tako da prvi interval za donju granicu ima vrijednost najmanjeg modaliteta u
statistikoj seriji, a gornja granica dobije se kao zbir donje granice intervala i veliine intervala,
dok je frekvencija intervala broj jedinica koje imaju vrijednost modaliteta posmatranog obiljeja
iz posmatranog intervala. U konkretnom primjeru prvi interval obuhvata ispitanike ija je starosn
dob izmeu 18 i 27 godina, broj ispitanika ija je starost izmeu 18 i 27 godina je 12. Analogno
navedenom postupak ponavljamo za sve ispitanike i dobijamo statistiku seriju kao to je
prikazano u narednoj tabeli. Relativne frekvencije dobijamo tako to frekvencije svakog
pojedinog intervala podijelimo sa 40, jer je ukupan broj jedinica u posmatranom statistikom
skupu 40, odnosno:
16
Starost ispitanika xi
Broj ispitanika Udio ispitanika % fi pi
18 27 12 30,0 27 36 4 10,0 36 45 3 7,5 45 54 7 17,5 54 63 11 27,5 63 i vie 3 7,5 Ukupno: 40 100%
Tabela 1. Tabelarni prikaz promjenljive V1 Starost ispitanika; tip promjenljive numeriki; tip statistike serije intervalna serija distribucija frekvencija
Ostale promjenljive u posmatranom statistikom modelu su atributivnog tipa pri emu
promjenljivu V2 ureujemo prema konvencionalnom poretku, a ostale promjenljive V3 V7 prema intenzitetu mjerenog svojstva, ime dobijamo statistike serije prikazane u sljedeim tabelama.
Mjesto stanovanja ispitanika
xi Broj ispitanika Udio ispitanika %
fi pi Centar grada 8 20
Gradsko podruje 14 25 Prigradsko podruje 10 35
Rurarlo podruje (selo) 8 20 Ukupno: 40 100%
Tabela 2. Tabelarni prikaz promjenljive V2 Mjesto stanovanja ispitanika; tip promjenljive atributivni; tip statistike serije serija distribucija frekvencija
kolska sprema ispitanika
xi Broj ispitanika Udio ispitanika %
fi pi Osnovna kola 9 22,5 Srednja kola 12 30,0
Via kola 8 20,0 Visoka kola 8 20,0
Magistar ili doktor nauka 3 7,5 Ukupno: 40 100%
Tabela 3. Tabelarni prikaz promjenljive V3 kolska sprema ispitanika; tip promjenljive atributivni; tip statistike serije serija distribucija frekvencija
17
Radni status ispitanika xi
Broj ispitanika Udio ispitanika % fi pi
Nezaposlen(a) 17 42,5 Zaposlen(a) 16 40,0
Penzioner(ka) 7 17,5 Ukupno: 40 100%
Tabela 4. Tabelarni prikaz promjenljive V4 Radni status ispitanika; tip promjenljive atributivni; tip statistike serije serija distribucija frekvencija
Uestalost obolijevanja od gripa xi
Broj ispitanika Udio ispitanika % fi pi
Veoma esto 8 20,0 esto 9 22,5
Povremeno 11 27,5 Rijetko ili nikad 12 30,0
Ukupno: 40 100% Tabela 5. Tabelarni prikaz promjenljive V5 Uestalost obolijevanja od gripa; tip promjenljive atributivni; tip
statistike serije serija distribucija frekvencija
Metod prevencije gripa xi
Broj ispitanika Udio ispitanika % fi pi
Vakcina 13 32,5 Pomona ljekovita sredstva (farmakoloka) 7 17,5
Pomona ljekovita sredstva (prirodna ili domaa) 9 22,5 Nita od navedenog 11 27,5
Ukupno: 40 100% Tabela 6. Tabelarni prikaz promjenljive V6 Metod prevencije gripa; tip promjenljive atributivni; tip statistike
serije serija distribucija frekvencija
Metod lijeenja gripa xi
Broj ispitanika Udio ispitanika % fi pi
Odlazak ljekaru i pridravanje dobijenih uputstava 7 17,5 Odlazak ljekaru i dijelimino pridravanje dobijenih
uputstava 15 37,5
Samostalno uzimanje ljekova 8 20,0 Samostalno uzimanje pomonih ljekovitih sredstava
(farmakolokih) 7 17,5
Samostalno uzimanje pomonih ljekovitih sredstava (prirodnih ili domaih)
3 7,5
Ukupno: 40 100% Tabela 7. Tabelarni prikaz promjenljive V7 Metod lijeenja gripa; tip promjenljive atributivnii; tip statistike
serije serija distribucija frekvencija
18
b. Prethodni tabelarni prikazi predstavljaju jednodimenzionalni prikaz statistike serije
prema modalitetima jednog obiljeja. U narednom radu prikazaemo statistiku seriju
ureenu prema modalitetima dva obiljeja. U prvom sluaju navedeno se odnosi na
obiljeja kolska sprema ispitanika i Metod prevencije gripa, u drugom sluaju to su
kolska sprema ispitanika i Metod lijeenja gripa. Navedeni prikaz zahtijeva
upotrebu tabele kontigencije, kako slijedi:
kolska sprema
ispitanika
Metod prevencije
Osnvna
kola
Srednja
kola
Via
kola
Visoka
kola
Magistar
ili doktor
nauka
Ukupno:
Vakcina 1
(2,5%)
3
(7,5%)
3
(7,5%)
4
(10,0%)
2
(5,0%)
13
(32,5%)
Pomona ljekovita
sredstava
(farmakolokih)
1
(2,5%)
4
(10,0%)
2
(5,0%)
0
(0,0%)
-
-
7
(17,5%)
Pomona ljekovita
sredstava (prirodnih
ili domaih)
3
(7,5%)
2
(5,0%)
3
(7,5%)
1
(2,5%)
-
-
9
(22,5%)
Nita od navedenog 4
(10,0%)
3
(7,5%)
-
-
3
(7,5%)
1
(2,5%)
11
(27,5%)
Ukupno: 9
(22,5%)
12
(30,0%)
8
(20,0%)
8
(20,0%)
3
(7,5%)
40
(100%) Tabela 8. Anketirani prema kolskoj spremi i Metodu prevencije gripa
U prethodnoj tabeli frekvencije pokazuju broj (procenat udio) ispitanika koji istovremeno
posjeduju modalitet dva obiljeja. Tako npr.jedan ispitanik sa zavrenom osnovnom kolom
prevenciju gripe vri putem vakcinacije, to u procentima predstavlja 2,5 % od ukupnog broja
ispitanika.
Kolona Ukupno sadri frekvencije modaliteta u zaglavlju i naziva se jo i marginalna
kolona, jednako vrijedi i za redove tabele. Zbirni red (Ukupno) sadri zbir frekvencija
modaliteta u zaglavlju i naziva se marginalni red.
19
kolska sprema
ispitanika
Metod lijeenja
Osnvna
kola
Srednja
kola
Via
kola
Visoka
kola
Magistar
ili doktor
nauka
Ukupno:
Odlazak ljekaru i
pridravanje dobijenih
uputstava
1
(2,5%)
4
(10,0%)
0
(0,0%)
2
(5,0%)
0
(0,0%)
7
(17,5%)
Odlazak ljekaru i
dijelimino
pridravanje dobijenih
uputstava
3
(7,5%)
5
(12,5%)
2
(5,0%)
5
(12,5%)
0
(0,0%)
15
(37,5%)
Samostalno uzimanje
ljekova
3
(7,5%)
2
(5,0%)
1
(2,5%)
1
(2,5%)
1
(2,5%)
8
(20,0%)
Samostalno uzimanje
pomonih ljekovitih
sredstava
(farmakolokih)
1
(2,5%)
1
(2,5%)
3
(7,5%)
0
(0,0%)
2
(5,0%)
7
(17,5%)
Samostalno uzimanje
pomonih ljekovitih
sredstava (prirodnih
ili domaih)
1
(2,5%)
0
(0,0%)
2
(5,0%)
0
(0,0%)
0
(0,0%)
3
(7,5%)
Ukupno: 9
(22,5%)
12
(30,0%)
8
(20,0%)
8
(20,0%)
3
(7,5%)
40
(100%) Tabela 9. Anketirani prema kolskoj spremi I Metodu lijeenja gripa
Primjer 1.2. Na jednom prodajnom mjestu zabiljeeni su podaci o broju prodanih jedinica
proizvoda X u toku 10 radnih dana, kako slijedi: 9 , 7, 5, 2, 6, 4, 8, 1, 0 i 3.Formirati statistiku
seriju broja prodanih proizvoda X u toku radnog dana, te tako formiranu seriju prikazati
tabelarno.
Rjeenje: Prikupljeni podaci u posmatranom primjeru su numeriki podaci, gdje je osobina
koja je predmet posmatranja i analize broj prodanih jedinica proizvoda X u toku jednog
radnog dana. Modaliteti pojavni oblici mjerene osobine (xi), u posmatranom primjeru su cijeli
20
nenegativni brojevi, pri emu se svaki modalitet pojavljuje samo jednom. Poznato je da se broj
podataka sa istim oblikom obiljeja naziva frekvencija (fi). Ordiniranim poretkom, prema
intenzitetu mjerene osobine, ureenih parova modalitet frekvencija dobijamo statistiku seriju.
Kako su sve frekvencije, u posmatranom primjeru jednake jedinici, sreivanjem podataka
dobijamo statistiku seriju koja se naziva prosta serija. Dakle, ovdje imamo:
Broj prodanih proizvoda u toku radnog dana
(xi)
0
1
2
3
4
5
6
7
8
9 Tabela 10. Tabelarni prikaz statistike serije broja prodanih proizvoda X
Primjer 1.3. Na ispitnom roku iz statistike rezultati su verifikovani sljedeim ocijenama: 5,
7, 6, 6, 5, 5, 8, 7, 6, 6, 7, 5, 5, 9, 7, 8, 7, 6, 6,10, 6, 6, 8, 5, 5, 6, 7, 6, 6, 5, 6, 7, 8, 6, i 5. Potrebno
je:
a. Formirati statistiku seriju ostvarenih rezultata na ispitu iz statistike. Seriju prikazati
tabelarno;
b. Prikazati statistiku seriju pod a) prikazom u dekartovom i polarnom koordinatnom
sistemu;
c. Prikazati statistiku seriju pod a) histogramom kvadrata i krugova, te strukturnim
krugom;
Rjeenje:
a. Prikupljeni podaci u posmatranom primjeru su numeriki podaci, gdje je osobina koja je
predmet posmatranja i analize visina ocjene na ispitu iz statistike. Modaliteti pojavni oblici
21
mjerene osobine (xi), u posmatranom primjeru su cijeli brojevi iz intervala 5 - 10, pri emu se
modaliteti pojavljuju odgovarajui broj puta. Dakle, ovdje emo izvriti poredak modaliteta
prema intenzitetu ispoljavanja, to je:
5,5,5,5,5,5,5,5,5,6,6,6,6,6,6,6,6,6,6,6,6,6,7,7,7,7,7,7,7,8,8,8,8,9 i 10.
Sada je potrebno izvriti grupisanje modaliteta sa istom vrijednou. Ovdje se modalitet 5
javlja 9 puta, modalitet 6 se javlja 13 puta, modalitet 7 se javlja 7 puta, modalitet 8 se javlja 4
puta, a modaliteti 9 i 10 se javljaju po 1 put. Dakle, sada znamo da su frekvencije modaliteta 9,
13, 7, 4, 1 i 1, respektivno te dobijene rezultate moemo unijeti u sljedeu tabelu.
Visina ocjene na ispitu iz statistike
(xi)
Broj studenata
(fi)
5 9
6 13
7 7
8 4
9 1
10 1
Ukupno (): 35 Tabela 11. Tabelarni prikaz statistike serije ostvarenih rezultata na ispitu iz statistike
Poslednji red u prethodnoj tabeli naziva se zbirni red. Zbir frekvencija fi (u posmatranoj
statistikoj seriji iznosi 35), naziva se obim pojave i oznaava broj jedinica statistikog skupa
koji je obuhvaen analizom.
b. Dekartov koordinatni sistem ine dvije prave koje se sijeku pod pravim uglom (uglom
90O), gdje se horizontalna prava naziva osa apscisa i na nju se nanose vrijednosti modaliteta
posmatranog obiljeja, dok se vertikalna osa naziva osom ordinata i na nju se nanose vrijednosti
frekvencija posmatranog obiljeja. Svakom ureenom paru (xi, fi) odgovara jedna taka u
dekartovom koordinatnom sistemu. Kada se nacrtaju sve take i spoje izlomljenom linijom
dobijamo linijski dijagram koji predstavlja grafiki prikaz statistike serije u dekartovom
koordinatnom sistemu, koji u posmatranom primjeru moemo prikazati sljedeom ilustracijom.
22
Slika 4. Grafiki prikaz statistike serije u dekartovom koordinatnom sistemu
Polarni koordinatni sistem sastoji se od odreenog broja polupravih koje polaze iz istog
ishodita i zrakasto se ire od centra ka periferiji. Broj pravih odgovara broju razliitih
modaliteta u statistikoj seriji, dok poluprenik (udaljenost od centra) odreuje frekvenciju
posmatranog modaliteta. Svakom ureenom paru (xi, fi) poluprava; poluprenik odgovara tano
jedna taka u polarnom koordinatnom sistemu. Kada se zatvorenom izlomljenom linijom spoje
sve take dobijene na opisan nain dobijamo linijski dijagram koji predstavlja grafiki prikaz
statistike serije u polarnom koordinatnom sistemu, koji u posmatranom primjeru moemo
ilustrovati sljedeim prikazom.
Slika 5. Grafiki prikaz statistike serije u polarnom koordinatnom sistemu
Dekartov i polarni koordinatni sistem su najee koriteni linijski dijagrami za prikazivanje
statistike serije.
0
2
4
6
8
10
12
14
5 6 7 8 9 10
9
13
7 4
1
1 0
5
10
155
6
7
8
9
10
23
c. Histogram kvadrata jeste povrinski dijagram kojim svaki modalitet prikazujemo
kvadratom ija povrina odgovara njegovoj frekvenciji. Poznato je da se povrina kvadrata
izraunava po sljedeoj formuli:
gdje je a stranica kvadrata;
Iz navedenog proizilazi da je:
P = fi fi = Dakle u narednoj tabeli za svaki modalitet odrediemo stranicu kvadrata ija povrina e
predstavljati svaki modalitet u skladu sa njegovom frekvencijom.
xi fi ai = 5 9 a1 = = 3,000 6 13 a2 = = 3,606 7 7 a3 = = 2,646 8 4 a4 = = 2,000 9 1 a5 = = 1,000
10 1 a6 = = 1,000 35 -
Tabela 12. Radna tabela izraunavanje stranice kvadrata za potrebe prikazivanja statistike serije histogramom kvadrata
Kada se izraunaju duine stranica za kvadrate kojima se predstavljaju pojedini modaliteti,
tada se pristupa crtanju koncentrinih kvadrata poredanih prema duini stranice, povrine tako
nacrtanih kvadrata formiraju povrinski dijagram koji se naziva histogram kvadrata, to se za
posmatrani primjer moe prikazati sljedeom
ilustracijom.
Slika 6. Grafiki prikaz statistike serije pomou
histograma kvadrata
a2 = 3,606 a1 = 3,000 a3 = 2,646 a4 = 2,000 a5 = a6 =1,000
24
Histogram krugova jeste povrinski dijagram kojim svaki modalitet prikazujemo krugom
ija povrina odgovara njegovoj frekvenciji. Poznato je da se povrina kruga izraunava po
sljedeoj formuli:
, gdje je r poluprenik kruga; ludvigov broj ija vrijednost iznosi 3,141592653; Iz navedenog proizilazi da je:
P = fi fi = Dakle u narednoj tabeli za svaki modalitet odrediemo stranicu kvadrata ija povrina e
predstavljati svaki modalitet u skladu sa njegovom frekvencijom.
xi fi ri = 5 9
r1 = = 1,693 6 13
r2 = = 2,034 7 7
r3 = = 1,493 8 4
r4 = = 1,128 9 1
r5 = = 0,564 10 1
r6 = = 0,564 35 -
Tabela 13. Radna tabela izraunavanje poluprenika kruga za potrebe prikazivanja statistike serije histogramom krugova
Kada se izraunaju duine poluprenika krugova kojima se predstavljaju pojedini modaliteti,
tada se crtanje koncentrinih krugova poredanih prema duini poluprenika, povrine tako
nacrtanih krugova formiraju povrinski dijagram koji se naziva histogram krugova, to se za
posmatrani primjer moe prikazati sljedeom ilustracijom.
25
Slika 7. Grafiki prikaz statistike serije pomou histograma krugova
Strukturni krug je povrinski dijagram statistike serije koji se dobije kada se povrina
kruga podijeli na povrinske dijelove (uglove - ) proporcionalno udjelu modaliteta u statistikoj seriji, odnosno:
Dakle u narednoj tabeli za svaki modalitet odrediemo ugao ija povrina e predstavljati
svaki modalitet u skladu sa njegovom frekvencijom.
xi fi =
5 9 = = 92,57o
6 13 = = 133,71o
7 7 = = 72,00o
8 4 = = 41,14o
9 1 = = 10,29o
10 1 = = 10,29o
35 360,00o Tabela 14. Radna tabela izraunavanje dijela kruga za potrebe prikazivanja statistike serije strukturnim
krugom
r2 = 2,034 r1 =1,693 r3 = 1,493 r4 = 1,128 r6 = r5 =0,564
26
Kada se izraunaju veliine uglova kojima se predstavljaju pojedini modaliteti, nacrta se
krug ija povrina se podijeli na uglove prema dobijenim vrijednostima, povrine tako nacrtanih
krunih lukova formiraju povrinski dijagram koji se naziva strukturni krug, to se za
posmatrani primjer moe prikazati sljedeom ilustracijom.
Slika 8. Grafiki prikaz statistike serije pomou strukturnog kruga
Primjer 1.4. Na podruju jedne regije zabiljeeni su podaci o visini ostvarene dobiti za mala i srednja
preduzea, ije se poslovanje i sjedite teritorijalno vezuju za posmatranu regiju. Analiza se odnosila na
period od jedne poslovne (kalendarske) godine, a podaci o visini ostvarene dobiti su sljedei: 8219; 4825;
1218; 1039; -454; 9773; 917;1203; 1200; -823; 7700; 3247; 6502; 7914; 5661; 7317; 1412; 2101; 3954;
1618; 3845; 3775; 4190; -7; 8865; 3759; 7766; 9997; 6925; 7870; 8972; 5935; 308; 6365; 7809; 4486; -
970; 2767; 5341; 8543; -645; 2549; 927; 4260; 7085; 3337; -983; 1398; -764 i 975. Podaci o visini
ostvarene dobiti za 50 posmatranih I istraivanjem obuhvaenih preduzea izraeni su u konvertibilnim
markama.
Potrebno je:
a. Formirati statistiku seriju ostvarene dobiti za mala i srednja preduzea u posmatranoj
regiji. Dobijenu statistiku seriju prikazati tabelarno;
b. Prikazati statistiku seriju pod a) histogramom frekvencija i poligonom frekvencija.
Rjeenje:
a. Prikupljeni podaci u posmatranom primjeru su numeriki podaci, gdje je osobina koja je
predmet posmatranja i analize visina ostvarene dobiti preduzea, koja posluju u
5
6
7
8
9
10
27
odgovarajuoj redaju, realizovan u periodu jedne kalendarske godine. Modaliteti
pojavni oblici mjerene osobine (xi), u posmatranom primjeru su realni brojevi, pri emu
ampituda kolebanja njihovih pojavnih vrijednosti visoka u odnosu na broj opservacija
(zabiljeene vrijednosti kolebaju se u intervalu od 983 do 9997; pri emu je istraivanjem
obuhvaeno 50 preduzea). Poznato je da broj podataka sa istim oblikom obiljeja se naziva
frekvencija (fi). Za potrebe formiranja statistike serije vrijednosti ostvarene dobiti
grupisaemo u intervale, pri emu je potrebno odrediti:
- Broj intervala unutar kojih e biti uvrtene vrijednosti modaliteta u konkretnoj statistikoj
seriji (K). Zatim,
- Veliine formiranih intervala (i).
Pomenute veliine izraunavaju se koritenjem sljedeih obrazaca:
K =1+3,32log N gdje je N obim pojave (broj opservacija)
Uvaavajui prirodu promjenljive K broj intervala mora biti prirodan broj.
gdje su:
Xmax modalitet koji u posmatranoj statistikoj seriji ima najveu vrijednost;
Xmin modalitet koji u posmatranoj statistikoj seriji ima najmanju vrijednost;
K broj intervala u statistikoj seriji.
U posmatranom primjeru je:
Xmax =9997
Xmin = 983
N = 50, pa dobijamo
K = 1 + 3,32log 50 = 1 + 3,321,69897=1 + 5,64058 =6,64058|7
,
Dakle, statistika serija e imati sedam intervala, pri emu e svaki od njih biti veliine 1570
jedinica. Prilikom formiranja statistke serije prvi interval poinje sa modalitetom koji u
statistikoj seriji ima najmanju vrijednost (Xmin), a zavrava sa vrijednou koju dobijemo kada
donju granicu intervala uveamo za veliinu intervala (Xmin+i).
28
Poznato je vie modela formiranja granica intervala, gdje intervali mogu biti otvoreni, to je
uobiajeno za prvi i/ili poslednji interval u statistikoj seriji, pri emu je prvi otvoren sa donju, a
zadnji sa gornju stranu. Navedeni postupak opravdan je injenicom da je, u veini konkretnih
pojava, koncentracija vrijednosti na rubovima domena niska, kao i da su ekstremne vrijednosti
iroko rasporeene.
Svaki sljedei interval nastavlja se vrijednou kojom je prethodni interval zavrio, pri emu
granice intervala mogu biti prave i vjetake. Kada imamo kontinuirane numerike pokazatelje
konvecionano se formiraju prave granice intervala vrijednosti modaliteta (sljedei interval
poinje vrijednou kojom je prethodni zavrio), dok se vjetake granice intervala vezuju za
diskontinuirane numerike pokazatelje ( pravi se razlika meu vrijednostima koje obiljeavaju
donju i gornju granicu pojedinih intervala kako bi se izbjegle greke kod formiranja statistikih
serija zbog nejasnoa oko uvrtavanja graninih vrijednosti u pojedine intervale).
Polazei od konkretnih podataka, u konkretnom primjeru, formiramo statistiku seriju
uvaavajui sljedeu proceduru:
- Formiramo rastui brojni niz zabiljeenih vrijednosti modaliteta kojima iskazujemo
visinu ostvarene dobiti srednjih i malih preduzea teritorijalno vezanih za posmatranu
regiju realizovan u periodu kalenadrske godine, to u konkretnom primjeru odgovara
sljedeem brojnom nizu podataka: -983; -970; -823; -764; -645; - 454; -7; 308; 917; 927;
975; 1039; 1200; 1203; 1218; 1398; 1412; 1618; 2101; 2549; 2767; 3247; 3337; 3759;
3775; 3845; 3954; 4190; 4260; 4486; 4825; 5341; 5661; 5935; 6365; 6502; 6925; 7085;
7317; 7700; 7766; 7809; 7870; 7914; 8219; 8543; 8872;8972; 9773; 9997.
- Ordiniranim poretkom, prema intenzitetu mjerene osobine, ureenih parova modalitet
frekvencija dobijamo statistiku seriju. Kako se vrijednosti modalteta grupiu unutar
odgovarajuih intervala, sreivanjem podataka dobijamo statistiku seriju koja se naziva
intervalna serija distribucija frekvencija. Dakle, ovdje imamo:
Visina ostvarene dobiti preduzea u toku posmatrane kalendarske godine
Xi
Broj preduzea
Fi Do 587 8
587 2157 11 2157 3727 4 3727 5297 8 5297 6867 5
29
6867 8437 9 8437 i vie 5 6 (UKUPNO): 50
Tabela 15. Tabelarni prikaz statistike serije visine ostvarene dobiti malih i srednjih preduzea u posmatranoj regiji realizovanoga u toku kalendarske godine
b. Poligon frekvencija, kao i histogram frekvencija predstavljaju povrinski dijagram, koji
predstavlja modifikovan grafiki prikaz intervalne serije distribucija frekvencija u dekartovom
koordinatnom sistemu. Poligon frekvencija je grafiki prikaz, kod koga se u dekartovom
koordinatnom sistemu nacrtaju ureeni parovi sredina intervala, frekvencija intervala. Tom
prilikom vjetaki se dodaju dva intervala i to interval koji prethodi prvom, te interval koji slijedi
nakon poslednjeg. Jasno je da su frekvencije oba vjetaka intervala jednake nuli. Kada se spoje
sve take dobijene u dekartovom koordinatnom sistemu, nacrtane na prethodno opisan nain,
dobije se zatvorena kriva linija. Povrina koju zatvara tako dobijena izlomljena linija sa osom
apscija (konvencijalno nazvana osa x) naziva se poligon frekvencija. Polazei od konkretnih
podataka u analiziranom primjeru dobijamo poligon frekvencija kao na sljedeoj slici:
Slika 9. Grafiki prikaz statistike serije pomou poligona frekvencija
Histogram frekvencija je povrinski dijagram, kod koga se intervali grafiki prikazuju pomou
pravougaonika ija irina odgovara veliini intervala i odreuje se na osi opscisa, a njegova visina
odgovara frekvenciji toga intervala i oznaava se na osi ordinata. Polazei od konkretnih podataka u
analiziranom primjeru dobijamo histogram frekvencija kao na narednoj slici.
0
2
4
6
8
10
12
do 587 587 -2157
2157 -3727
3727 -5297
5297 -6867
6867 -8437
8437 ivie
30
Slika 10. Grafiki prikaz statistike serije pomou histograma frekvencija
Zadaci:
1.5. Broj pregledanih pacijenata u toku 25 radnih dana u ambulanti hitne pomoi bio je:
1 0 4 3 4 4 4 1 0 1 2 3 5
3 1 3 2 4 5 4 0 1 1 0 1
a. Formirati seriju distribucija frekvencija broja pregledanih pacijenata; definisati statistiku
promjenljivu;
b. Formiranu statistiku seriju prikazati pomou histograma krugova i kvadrata;
c. Formiranu statistiku seriju prikazati pomou prikaza u dekartovom i polarnom koordidatnom
sistemu.
1.6. Na jednom podruju posmatrana je starosna struktura oboljelih od vodenih ospica gdje su kod
stanovnika posmatranog podruja zabiljeene sljedee vrijednosti:
20 0 2 4 22 3 23 4 1 6 34 3 2 7 5 11 5 7 0 8 46 15 9 3 2 16 6 6 5 12 3 7 0 45 2 3 5 4 15 6
Potrebno je:
a. Formirati intervalnu seriju starosne strukture oboljelih od vodenih ospica na posmatranom
podruju;
0
2
4
6
8
10
12
do 587 587 -2157
2157 -3727
3727 -5297
5297 -6867
6867 -8437
8437 ivie
Fi
31
b. Statistiku seriju grafiki prikazati pomou histograma frekvencija, polarnog dijagrama i
strukturnog kruga.
1.7. Za potrebe analize spremnosti i sposobnosti kandidata za igraa, menadment koarkakog kluba
posmatra karakteristike igraa u pogledu njihove visine, izdrljivosti i brzine. Pri tome su dobijeni
sljedei podaci:
Visina igraa cm:
217 194 199 207 191 193 189 211
203 201 196 209 207 199 211 189
186 189 186 214 202 187 194 195
185 209 190 188 190 199 190 190
197 212 185 204 194 198 190 188
202 200 187 192 200 205 194 220
Izdrljivost igraa vrijeme koliko odrazna ruka igraa moe da odri odreeno optereenje dranja
utega teine 24 kg u sekundama:
30 77 35 20 73 81 89 41
13 70 38 32 82 10 81 81
85 29 23 26 99 99 56 30
32 19 24 53 26 29 83 11
12 10 82 58 78 14 19 51
61 39 57 39 96 15 12 100
Brzina igraa iskazuje se vremenom potrebnim da igra pretri stazu duine 100 metara:
13 15 17 18 11 13 17 17
20 11 11 19 15 15 16 17
11 15 17 18 17 19 15 10
14 17 20 13 13 19 14 13
20 16 20 15 17 11 15 15
14 20 19 18 10 11 19 19
Potrebno je:
a. Formirati statistike serije distribucija igraa prema visini, izdrljivosti i brzini;
b. Dobijene statistike serije prikazati pomou poligona frekvencija, histograma kvadrata,
histograma krugova i strukturnog kruga.
32
1.8. U jednom preduzeu zaposleno je 100 radnika, podaci o duini njihovog radnog staa su:
25 1 15 20 11 30 10 17 1 34
1 4 11 5 37 18 19 18 7 37
38 37 15 7 28 9 19 16 11 4
34 33 5 3 6 9 2 13 13 29
14 19 23 8 19 11 22 22 18 10
7 6 36 36 35 5 21 21 21 36
22 10 22 1 22 10 15 13 4 8
16 26 19 24 6 6 5 17 21 20
39 11 1 20 5 39 0 35 10 25
15 36 37 9 14 4 22 1 37 32
Potrebno je:
a. Formirati statistiku seriju distribucije radnika prema visini radnog staa;
b. Dobijenu statistiku seriju prikazati pomou histograma krugova, kvadrata i frekvencije;
c. Dobijenu statistiku seriju prikazati pomou strukturnog kruga.
1.9. Na podruju jedne regije posluje 100 malih i srednjih preduzea. Podaci o posmatranim preduzeima
u pogledu visine angaovanih sredstava i ostvrenoj dobiti u odreenoj godini su:
Angaovana sredstva (000 KM):
68 28 26 74 56 62 45 87 21 39
92 63 40 96 68 58 87 31 35 37
72 12 48 62 95 61 26 99 33 82
53 60 32 86 59 94 30 85 41 62
70 42 52 59 52 87 35 53 51 60
59 28 65 24 56 36 79 68 28 78
82 10 100 25 42 44 18 27 23 99
31 23 62 30 35 5 77 98 83 58
77 20 84 14 67 89 37 100 27 83
82 64 63 53 76 34 25 29 22 9
Ostvarena dobit (KM):
33
12532 22561 21108 4111 711 -119 8819 17963 20815 1480
21700 -2640 5329 -3368 7031 8149 11206 1501 18981 22685
2991 4902 1313 8003 21350 19786 23868 11962 8604 2179
-868 19181 22823 864 18165 23114 22025 15111 2122 15318
9981 22599 7619 5045 13073 6915 2689 10174 16964 944
19469 24604 17527 17775 1217 9557 2627 17795 5353 -2957
4668 -1957 4655 14237 11595 15904 3824 16445 13762 5010
23733 15547 21780 7295 1814 13610 2158 18987 15997 -610
15403 2584 13853 16718 21888 -4747 16166 23715 4065 19879
-2166 11513 -3177 -4227 12013 20152 15604 21832 15467 14422
Potrebno je:
a. Formirati seriju distribucija preduzea prema visini angaovanih sredstava i prema visini
ostvarene dobiti;
b. Dobijene serije podataka prikazati pomou strukturnog kruga, histograma frekvencija i poligona
frekvencija.
34
2. DESKRIPTIVNA ANALIZA
2.1. Mjere centrlane tendencije
Mjere centralne tendencije obuhvataju vrijednosti kojima se predstavljaju brojni nizovi
varijabilnih podataka, meu njima razlikujemo izraunate srednje vrijednosti (sredine) i
pozicione vrijednosti. Postoje i specifine srednje vrijednosti numerikog niza oznaene kao
momenti.
Srednje vrijednosti obuhvataju aritmetiku, harmonijsku i geometrijsku sredinu, a pozicione
modus, medijanu, kvartile, decile, percentile...
2.1.1. Aritmetika sredina prosjek
Aritmetika sredina ili prosjek ( definie se kao kolinik izmeu zbira vrijednosti modaliteta i njihog broja. Aritmetika sredina odreuje se kao prosta ili ponderisana zavisno od
tipa statistike serije, i to:
- Za serije negrupisanih podataka koristi se prosta aritmetika sredina, odnosno naredni
obrazac: - Za serije distibucija frekvencija koristi se ponderisana aritmetika sredina, odnosno
naredni obrazac: - Alternativno aritmetika sredina moe se izraunati kroz vjerovatnou sluajnih
dogaaja, kada se naziva oekivana vrijednost (matematika nada; matematiko
oekivanje), kao zbir proizvoda odgovarajuih vrijednosti modaliteta i vjerovatnoe
njihovog deavanja, odnosno1: , pri emu p(xi) predstavljaju relativne frekvencije pojedinih modaliteta;
1 Obrasci za izraunavanje aritmetike sredine I matematikog oekivanja su ekvivalentni izrazi, odnosno polazei
od obrasca za izraunavanje proste aritmetike sredine
, dobili smo matematiko oekivanje sluajne promjenljive.
Analogno prethodnom polazei od obrasca za ponderisanu aritmetiku sredinu
, ponovno smo dobili matematiko oekivanje sluajne promjenljive
35
- Aritmetika sredina se moe izraunati i postupkom kodiranjem vrijednosti brojnog niza,
odnosno metodom linearne transformacije promjenljive, odnosno: , gdje su a i b konstante, dok se vrijednost promjenljive izraunava na sljedei nain: , pri emu je .
Osobine aritmetike sredine su:
- Vea je od najmanjeg, a manja od najveeg modaliteta u statistikoj seriji,
odnosno: ; - U homogenoj statistikoj seriji vrijednost aritmetike sredine jednaka je vrijednostima
modaliteta, odnosno ako je ; - Zbir odstupanja orginalnih podataka od aritmetike srdine ima vrijednost nula, odnosno:
; - Zbir kvadrata odstupanja orginalnih podataka od aritmetik sredine je minimalan,
odnosno: .
Primjer 2.1. Na proizvodnoj liniji proizvoda P zabiljeene su sljedee vrijednosti teine proizvoda:
109; 119; 97; 94; 114; 98; 97; 101; 110 i 102 g.
Potrebno je:
a) Odrediti prosjenu teinu proizvoda P kao prostu aritmetiku sredinu i kodiranjem; pri
kodiranju koristiti konstante a = 100, b = 8;
b) Dokazati da su zadovoljene osobine aritmetike sredine.
Rjeenje:
a) Ovdje je rije o seriji negrupisanih podataka, tako da se aritmetika sredina rauna kao posta
aritmetika sredina, odnosno, imamo da je:
Xi 109 119 97 94 114 98 97 101 110 102 6
1,125 2,375 -0,375 -0,75 1,75 -0,25 -0,375 0,125 1,25 0,25
5,125
Tabela 16. Radna tabela elementi za odreivanje aritmetike sredine metodom kodiranja
Sada imamo da je aritmetika sredina .
36
Prosjena teina proizvoda P je 104,1g. Koritenjem razliitih metoda odreivanja dobili smo
jednaku vrijednost aritmetike sredine, jer metoda odreivanja je samo analitiki postupak koji ne smije
uticati na izraunatu vrijednost.
b) Kada je rije o osobinama aritmetike sredine dokaze izvodimo na sljedei nain:
- - Modaliteti u statistikoj seriji su razliiti, dakle, statistika serija nije homogena;
- -
Xi 109 119 97 94 114 98 97 101 110 102 6
4,9 14,9 -7,1 -10,1 9,9 -6,1 -7,1 -3,1 5,9 -2,1 0 81 361 9 36 196 4 9 1 100 4 801 24,01 222,01 50,41 102,01 98,01 37,21 50,41 9,61 34,81 4,41 632,9
Tabela 17. Radna tabela izraunavanje elemenata za potrebe dokazivanja osobina aritmetike sredine
Primjer 2.2. Zdravstvena ustanova Z analizira uestalost posjeta pacijenata ljekaru porodine
medicine. Analiza se odnosi na 250 pacijenata registrovanih u posmatranoj zdravstvenoj ustanovi pri
emu su zabiljeeni podaci o broju posjeta svakog pacijenta u toku jednog mjeseca. Podaci su sreeni u
odgovarajuu statistiku seriju i mogu se prikazati sljedeim tabelarnim prikazom:
Broj posjeta u toku jedog mjeseca 0 1 2 3 4 5 6 7 8 9
Broj pacijenata 15 37 34 32 21 47 19 25 14 6
Tabela 18. Distribucija broja posjete pacijenata ljekaru porodine medicine u toku godine
Potrebno je:
a. Odrediti prosjean broj pregledanih pacijenata u toku jednog mjeseca. Dokazati da vrijede
osobine aritmetike sredine;
b. Odrediti relativne frekvencije te izraunati vrijednost matematikog oekivanja;
c. Grafiki prikazati statistiku seriju pomou strukturnog kruga.
Rjeenje:
a. U posmatranom primjeru radi se o numerikoj seriji distribucija frekvenvcija, pomjenljiva u
statistikom modelu je broj posjeta porodinom ljekaru u toku jednog mjeseca, dakle rije je o prekidnoj
(diskontinuiranoj) numerikoj promjenljivoj, uestalost se izraava kao broj pacijenata koji u toku
mjeseca ostvare isti broj posjeta ljekaru porodine medicine. Broj pacijenata predstavlja vrijednost
apsolutnih frekvencija posmatrane statistike promjenljive. Kako je prikazana statistika serija serija
37
distribucija frekvencija, prosjean broj pacijenata koji u toku mjeseca posjete porodinog ljekara
izraunavamo kao ponderisanu aritmetiku sredinu:
U narednoj tabeli prikazani su elementi potrebni za izraunavanje ponderisane aritmetike sredine:
Broj posjeta u toku
jedog mjeseca
Broj
pacijenata
fixi
pi
fi(x - )
fi(x - )2
fi(x -4)2 xi fi 0 15 0 0,060 -58,5 228,15 240 1 37 37 0,148 -107,3 311,17 333 2 34 68 0,136 -64,6 122,74 136 3 32 96 0,128 -28,8 25,92 32 4 21 84 0,084 2,1 0,21 0 5 47 235 0,188 51,7 56,87 47 6 19 114 0,076 39,9 83,79 76 7 25 175 0,100 77,5 240,25 225 8 14 112 0,056 57,4 235,34 224 9 6 54 0,024 30,6 156,06 150
Ukupno (6) 250 975 1,000 0 1460,5 1463 Tabela 19. Radna tabela elementi potrebni za izraunavanje aritmetike sredine, relativnie frekvencije i
elementi za dokazivanje osobina aritmetike sredine
Koristei prethodni obrazac za izraunavanje ponderisane aritmetike sredine i rezultate u radnoj tabeli,
dobijamo:
Klijenti, odnosno pacijenti registrovani u posmatranoj zdravstvenoj ustanovi, u prosjeku 4 (3,9|4) puta mjesno posjete porodinog ljekara.
Osobine aritmetike sredine provjeravamo na sljedei nain:
- Izraunata vrijednost aritmetike sredine vea je od najmanjeg, a manja od najveeg modaliteta
osobine u posmatranoj statistikoj seriji: 0 d 3,9 d 9, gdje su: xmin = 0 i xmax = 9; - Modaliteti u statistikoj seriji su razliiti, dakle, statistika serija nije homogena;
- -
38
b. Relativne frekvencije izraunavamo kao kolinik izmeu apsolutnih frekvencija i njihovog zbira,
odnosno: , pri emu su izraunate vrijednosti prikazane u prethodnoj radnoj tabeli. Matematiko oekivanje (oekivanu vrijednost) izraunavamo na sljedei nain:
c. Izgled strukturnog kruga za posmatranu statistiku seriju moemo prikazati sljedeom
ilustracijom:
Slika 11. Distribucija broja mjesenih posjeta ljekaru porodine medicine prikazana strukturnim krugom
Primjer 2.3. U narednim tabelama predstavljene su distribucija stanovnika prema visini krvnog pritiska
(sistolnog i dijastolnog) na podruju jednog regiona zabiljeeni nakon jednodnevnog mjerenja na javnom
prostoru velikog grada.
1
2
3
4
5
6
7
8
9
10
39
Visina sistolnog pritiska (mmHg)
Broj ispitanika
Do 80 9 80 90 22 90 100 36 100 110 62 110 120 67 120 130 43 130 140 24 140 150 22 150 i vie 15
Tabela 20. Distribucija ispitanika prema visini sistolnog pritiska
Visina dijastolnog pritiska (mmHg)
Broj ispitanika
Do 60 4 60 65 18 65 70 55 70 75 52 75 80 68 80 85 40 85 90 38 90 95 19 95 i vie 6
Tabela 21. Distribucija ispitanika prema visini dijastolnog pritiska
Potrebno je:
a. Odrediti prosjenu visinu sistolnog i dijastolnog pritiska ispitanika, kao ponderisanu aritmetiku
sredinu i kao oekivanu vrijednost;
b. Pokazati da su zadovoljene osobine aritmetike sredine;
c. Prvu statistiku seriju prikazati histogramom frekvencija, a drugu poligonom frekvencija.
Rjeenje:
a. Jedinica posmatranja je sluajni prolaznik zateen na javnoj povrni velikog grada, ispitivanjem je
obuhvaen uzorak od 300 ispitanika. Podaci o visini sistolnog i dijastolnog pritiska su numeriki, a
statistika promjenljiva je kontinuirana. Podaci su grupisani u odgovarajuu statistiku seriju, ovdje
je rije o seriji grupisanih podataka u oba sluaja rije je o intervalnoj seriji distribucija frekvencija.
Prosjenu vrijednost sistolnog i dijastolnog pritiska izraunavamo kao ponderisanu aritmetiku
sredinu. Elementi proterbni za izraunavanje aritmetike sredine prikazani su u sljedeoj tabeli.
Visina sistolnog pritiska (mmHg)
Broj ispitanika
ri
firi
fi(ri - )
fi(ri - )
fi(ri -114)
pi
pixi xi fi
Do 80 9 75 675 -354,30 13947,61 13689 0,030 2,250 80 90 22 85 1870 -646,07 18972,82 18502 0,073 6,233 90 100 36 95 3420 -697,20 13502,44 12996 0,120 11,400 100 110 62 105 6510 -580,73 5439,536 5022 0,207 21,700 110 120 67 115 7705 42,43 26,87444 67 0,223 25,683 120 130 43 125 5375 457,23 4861,914 5203 0,143 17,917 130 140 24 135 3240 495,20 10217,63 10584 0,080 10,800 140 150 22 145 3190 673,93 20644,82 21142 0,073 10,633 150 i vie 15 155 2325 609,50 24766,02 25215 0,050 7,750 Ukupno(6) 300 - 34310 0,00 112379,7 112420 1,000 114,367
Tabela 22. Radna tabela elementi za izraunavanje aritmetike sredine, dokazivanje osobina aritmetike sredine, relativnih frekvencija I oekivane vrijednosti
40
Koristei prethodno navedeni obrazac za izraunavanje ponderisane aritmetike sredine i rezultate u
radnoj tabeli, dobijamo:
Prosjena vrijednost sistolnog pritiska kod ispitanika obuhvaenih statistikim ispitivanjem iznosi
114,367 mmHg.
Relativne frekvencije izraunavamo kao kolinik izmeu apsolutnih frekvencija i njihovog zbira,
odnosno: , pri emu su izraunate vrijednosti prikazane u prethodnoj radnoj tabeli. Matematiko oekivanje (oekivanu vrijednost) izraunavamo na sljedei nain:
Vrijednosti proizvoda vjerovatnoa pojedinih vrijednosti statistike promjenljive i vrijednosti njezinih
modaliteta prikazani su u prethodnoj radnoj tabeli koja sadri elemente vezane za izraunavanje vrijednosti
vezane za sistolni pritisak.
Visina
dijastolnog
pritiska (mmHg)
Broj
ispitanika
ri
firi
fi(ri - )
fi(ri - )
fi(ri -77)
pi
pixi xi fi Do 60 4 57,5 230 -77,67 1508,028 1521 0,013 0,767 60 65 18 62,5 1125 -259,50 3741,125 3784,5 0,060 3,750 65 70 55 67,5 3712,5 -517,92 4877,049 4963,75 0,183 12,375 70 75 52 72,5 3770 -229,67 1014,361 1053 0,173 12,567 75 80 68 77,5 5270 39,67 23,13889 17 0,227 17,567 80 85 40 82,5 3300 223,33 1246,944 1210 0,133 11,000 85 90 38 87,5 3325 402,17 4256,264 4189,5 0,127 11,083 90 95 19 92,5 1757,5 296,08 4613,965 4564,75 0,063 5,858 95 i vie 6 97,5 585 123,50 2542,042 2521,5 0,020 1,950 Ukupno(6) 300 23075 0,00 23822,92 23825 1,000 76,917
Tabela 23. Radna tabela elementi za izraunavanje aritmetike sredine, dokazivanje osobina aritmetike sredine, relativnih frekvencija I oekivane vrijednosti
Koristei prethodno navedeni obrazac za izraunavanje ponderisane aritmetike sredine i rezultate u
radnoj tabeli, dobijamo:
41
Prosjena vrijednost dijastolnog pritiska kod ispitanika obuhvaenih statistikim ispitivanjem iznosi
76,917 mmHg.
Relativne frekvencije izraunavamo kao kolinik izmeu apsolutnih frekvencija i njihovog zbira,
odnosno: , pri emu su izraunate vrijednosti prikazane u prethodnoj radnoj tabeli. Matematiko oekivanje (oekivanu vrijednost) izraunavamo na sljedei nain:
Vrijednosti proizvoda pojedinih vjerovatnoa statistike promjenljive i vrijednosti njezinih modaliteta
prikazani su u radnoj tabeli sa elementima izraunavanja vrijednosti za dijastolni pritisak.
b. Osobine aritmetike sredine provjeravamo na sljedei nain:
- Izraunata vrijednost aritmetike sredine vea je od najmanjeg, a manja od najveeg modaliteta
osobine u posmatranoj statistikoj seriji:
o Kod statistike serije, kod koje je statistika promjenljiva visina sistolnog pritiska, vrijedi: 70 d 114,367 d 160, gdje su: xmin = 70; i xmax = 160;
o Kod statistike serije, kod koje je statistika promjenljiva visina dijastolnog pritiska, vrijedi: 65 d 76,917 d 100, gdje su: xmin = 65; i xmax = 100;
- Modaliteti u obe statistike seriji su razliiti, dakle, statistike serije nisu homogene;
- Ukupna ostupanja od aritmetike sredine imaju vrijednost 0:
o Kod statistike serije, kod koje je statistika promjenljiva visina sistolnog pritiska vrijedi: ;
o Kod statistike serije, kod koje je statistika promjenljiva visina dijastolnog pritiska vrijedi:
- Zbir kvadrata odstupanja vrijednosti statistike promjenljive od prosjene vrijednosti je minimalan,
odnosno za posmatrane statistike serije vrijedi:
o Kod statistike serije, kod koje je statistika promjenljiva visina sistolnog pritiska vrijedi:
o Kod statistike sreije, kod koje je statistika promjenljiva visina dijastolnog pritiska vrijedi:
c. Potrebni grafiki prikazi (povrinski dijagrami) prikazani su na narednim dijagramima:
42
Slika 12. Histogram frekvencija distribucije ispitanika prema visini sistolnog pritiska
Slika 13. Poligon frekvencija distribucije ispitanika prema visini dijastolnog pritiska
2.1.2. Geometrijska sredina
Geometrijska sredina ili geometrijski prosjek (Gdefinie se kao n ti korijen izraunat iz proizvoda vrijednosti modaliteta nekog obiljeja, pri emu je n broj modalitata u statistikoj seriji.
Geometrijska sredina, koristi se kao mjera centralne tendencije, u sluajevima izraunavanja
0
10
20
30
40
50
60
70
80
do 80 80-90 90-100 100-110 110-120 120-130 130-140 140-150 150 i vie
0
10
20
30
40
50
60
70
80
do 60 60-65 65-70 70-75 75-80 80-85 85-90 90-95 95 i vie
43
omjera, indeksa i procenata promjene odgovarajue veliine u vremenu. Geometrijska sredina
odreuje se kao prosta ili ponderisana zavisno od tipa statistike serije, i to:
- Za serije negrupisanih podataka koristi se prosta geometrijska sredina, odnosno naredni
obrazac: ; - Za serije distibucija frekvencija koristi se ponderisana geometrijska sredina, odnosno
naredni obrazac:
- Geometrijska sredina se moe izraunati i prevoenjem navedenih obrazaca u njihov
matematiki ekvivalentan oblik2, koji dobijamo polazei od prethodno navedenih obrazaca
na sljedei nain:
o U sluaju proste serije polazimo od obrasca: , najprije emo izvriti logaritmovanje izraza istovremeno sa lijeve i desne strane, te dobijamo:
Sada primjenimo pravilo o logaritmu stepena3, ime dobijamo:
Nadalje primjenimo pravilo o proizvodu logaritama4, ime dobijamo:
Kako bismo dobili vrijednost geometrijske sredine potrebno je izvriti matematiku operaciju
antilogaritmovanja, ime dobijamo:
o U sluaju ponderisane geometrijske sredine polazimo od obrasca:
,
najprije izvrimo logaritmovanje navedenog izraza (i lijeve i desne strane izraza),
ime dobijamo:
2 Matematiki ekvivalentni izrazi predstavljaju izraze koji imaju razliite matetmatike forme (oblike), ali pomou kojih
dobijamo istu vrijednost. Matematiki ekvivalentni izrazi mogu se odgovarajuim matematikim transformacijama svesti na isti oblik
3 Logaritam stepena jednak je proizvodu stepena i logaritma vrijednosti, tj. log ab = b log a 4 Logaritam proizvoda jednak je zbiru logaritama, tj. log ab = log a + log b
44
Nakon toga, primjenimo pravilo o stepenu logaritma, ime dobijamo:
Nadalje, primjenjujemo pravilo o zbiru logaritama, ime dobijamo:
Na kraju, antilogaritmovanjem prethodnog obrasca, dobijamo konaan oblik obrasca
kojim izraunavamo ponderisanu geometrijsku sredinu:
Osobine geometrijske sredine su:
- Vea je od najmanjeg, a manja od najveeg modaliteta u statistikoj seriji, odnosno: ;
- U homogenoj statistikoj seriji vrijednost geometrijske sredine jednaka je vrijednostima
modaliteta, odnosno ako je ; - Ukoliko za odreenu statistiku seriju izraunamo aritmetiku i geometrijsku sredinu
njihove vrijednosti mogu biti jednake, ukoliko nisu vea je aritmetika, dakle u svakoj
statistikoj seriji vrijedi: .
Primjer 2.4. Broj osoba koji su zatraili pregled kod ljekara porodine medicine u toku neradnih dana u
mjesecu januaru (neradni dani u januaru mjesecu posmatrane godine su: 1.1; 1.2; 6.1; 7.1; 9.1; 14.1 i etiri
nedelje 5.1; 12.1; 19.1 i 26.1) u jednoj zdravstvenoj ustanovi iznosio je:
Broj pacijenata: 89 17 43 33 52 12 54 22 45 7
Potrebno je:
a. Odrediti vrijednost geometrijske sredine posmatrane numerike promjenljive;
b. Uporediti dobijenu vrijednost geometrijske sredine sa vrijednou aritmetike sredine iste
promjenljive.
Rjeenje:
Ovdje je statistika promjenljiva broj pacijenata koji zatrae usluge ljekara porodine medicine u toku
neradnih dana januara. Dati podaci o vrijednosti numerike promjenljive tvore prostu statistiku seriju (seriju
negrupisanih podataka), kod koje se srednje vrijednosti raunaju u jednostavnom obliku, odnosno kao prosta
geometrijska, odnosno aritmetika sredina. Ovdje imamo:
45
a. Vrijednost geometrijske sredine u posmatranoj statistikoj seriji odreuje se na sljedei nain:
Ili
Lako je uoiti da je jednaka vrijednost geometrijske sredine dobijena pomou dva razliita analitika
postupka, odnosno da koriteni analitiki postupak ne utie na izraunatu vrijednost.
Prosjean broj pacijenata koji u toku neradnih dana januara zatrae pregled kod ljekara porodine
medicine iznosi 29, odreeno kao geometrijski prosjek. Drugim rijeima, prosjeno 29 pacijenata zatrai
pregled kod ljekara porodine medicine u toku neradnih dana mjeseca januara. Uoavamo da je dobijena
vrijednost geometrijske sredine vea od najmanjeg, a manja od najveeg modaliteta u statistikoj seriji,
odnosno vrijedi:
xmin d 29,513 d xmax b. Vrijednost aritmetike sredine u posmatranoj statistikoj seriji izraunava se:
Prosjean broj pacijenata koji zatrae pregled kod ljekara porodine medicine u toku neradnih dana
mjeseca januara iznosi 37. Vrijednost aritmetike sredine je vea od vrijednosti geometrijske sredine, to je
jedna od teorijskih pretpostavki, odnosno potvrda tanosti odreene vrijednosti.
Primjer 2.5. Polazei od podataka o uestalosti posjeta pacijenata ljekaru porodine medicine (primjer
2.2) odrediti geometrijsku sredinu formirane distribucije. Uporediti dobijenu vrijednost sa vrijednou
aritmetike sredine.
Rjeenje:
U analiziranom primjeru imamo seriju distribucija frekvencija kod koje vrijednost geometrijske sredine
izraunavamo kao ponderisanu sredinu pomou obrasca:
Elemente potrebne za izraunavanje geometrijske sredine posmatrane statistike serije pri emu uvidom
u empirijsku grau uoavamo da je: x1 = 0 (tabela statistike serije primjer 2.2). Navedena injenica upuuje
46
na zakljuak da geomerijsku sredinu kod posmatrne statistike serije nije mogue izraunati jer vrijednost
matematikog izraza log0 nije definisan!
Zakljuujemo da kod posmatrane statistike serija nije mogue izraunati geometrijsku sredinu.
Primjer 2.6. Polazei od serije distribucije studenata prema uspjehu postignutom na ispitu iz statistike
(primjer 1.3) odrediti geometrijsku sredinu date serije. Dobijenu vrijednost geometrijske sredine uporediti sa
aritmetikom sredinom!
Rjeenje:
Geometrijsku sredinu statistike serije predstavljene u tabeli 11, izraunavamo kao ponderisanu sredinu
pomou obrasca:
Nepraktinost primjene prethodnog obrasca proizilazi iz injenice da je potrebne matematike operacije
zahtjevno odrediti i pomou standardnih raunskih pomagala (kalkulatora). Za izraunavanje ponderisane
geometrijske sredine praktinije je koristiti drugi obrazac uz napomenu da su matematiki obrasci
ekvivalentni. Ekvivalentni matematiki obrasci imaju razliit analitiki oblik, mogu se odgovarajuim
matematikim transformacijama mogu prevesti iz jednog oblika u drugi, a omoguavaju da se razliitim
raunskim postupcima odredi ista vrijednost.
Elemente potrebne za odreivanje aritmetike i geometrijske sredine prikazujemo u narednoj radnoj
tabeli:
xi fi log xi fi log xi fixi
5 9
0,69897 6,29073 45 6 13 0,77815 10,11597 78 7 7 0,84510 5,915686 49 8 4 0,90309 3,61236 32 9 1 0,95424 0,954243 9
10 1 1,00000 1 10 Ukupno (6): 35 - 27,88899 223
Tabela 24. Radna tabela elementi za izraunavanje ponderisane geometrijske I aritmetike sredine
47
Polazei od obrazaca za izraunavanje geometrijske kao i aritmetike sredine, te od elemenata
izraunatih u prethodnoj radnoj tabeli, za vrijednost ponderisane geometrijske sredine dobijamo:
Analogno prethodnom navodu, za vrijednost ponderisane aritmetike sredine dobijamo:
Prosjeno ostvaren uspjeh na ispitu iz statistike dobijen kao geometrijski prosjek iznosi 6,26, dok je
prosjeno ostvaren uspjeh dobijen kao aritmetiki prosjek 6,37. Uavamo da se obje prosjene vrijednosti
nalaze unutar amplitude kolebanja, odnosno da im je vrijednost iznad najloijeg (xmin=5), a ispod najboljeg
uspjeha (xmax=10), pored toga, vrijednost aritmetike sredine je vea od vrijednosti geometrijske sredine
(6,37 > 6,26366).
Primjer 2.7. Odrediti geometrijsku sredinu distribucije stanovnika prema visini sistolnog pritiska iz
primjera 2.3. Uporediti vrijednost geometrijske sredine sa vrijednou aritmetike sredine.
Rjeenje:
U analiziranom primjeru imamao intervalnu seriju disribucija frekvencija kod koje se geometrijska
sredina odreuje kao ponderisana srednja vrijednost. Porebne elemente za odreivanje goeometrijske sredine
posmatrane distribucije prikazujemo u narednoj tabeli.
Visina sistolnog pritiska (mmHg)
xi
Broj ispitanika
fi ri Log xi fi log xi Do 80 9 75 1,875061 16,87555
80 90 22 85 1,929419 42,44722
90 100 36 95 1,977724 71,19805
100 110 62 105 2,021189 125,3137
110 120 67 115 2,060698 138,0668
120 130 43 125 2,09691 90,16713
130 140 24 135 2,130334 51,12801
140 150 22 145 2,161368 47,5501
150 i vie 15 155 2,190332 32,85498
Ukupno (6): 300 - - 615,6015 Tabela 25. Radna tabela elementi za odreivanje geometrijske sredine distribucije stanovnika prema visini
sistolnog pritiska
48
Polazei od obrasca za odreivanje ponderisane geometrijske sredine te vrijednosti sadranih u radnoj
tabeli dobijamo:
Dobijena vrijednost geometrijske sredine vea je od najmanjeg (xmin = 80), a manja od najveeg (xmax =
150) modaliteta u posmatranoj statistikoj seriji, odnosno vrijedi:
80 d 112,72 d 150 Prethodno odreena vrijednost aritmetike sredine iznosi 114,37 prosjena vrijednost dobijena kao
geometrijski prosjek manja je od aritmetikog prosjeka.
2.1.1. Harmonijska sredina
Harmonijska sredina ili harmonijski prosjek (Hdefinie se kao kolinik izmeu broja modaliteta i zbira njihovih recipronih vrijednosti. Harmonijska sredina, koristi se kao mjera
centralne tendencije, u sluajevima kada se veliine dva ili vie skupova elemenata nalaze u obrnuto
proporcionalnom odnosu ili ukoliko se modaliteti neke osobine izraavaju kao razlomci kojima je
brojnik iste vrijednosti. Harmonijska sredina odreuje se kao prosta ili ponderisana zavisno od tipa
statistike serije, i to:
- Za serije negrupisanih podataka koristi se prosta harmonijska sredina, odnosno naredni
obrazac: ; - Za serije distibucija frekvencija koristi se ponderisana harmonijska sredina, odnosno naredni
obrazac:
;
Osobine harmonijske sredine su:
- Vea je od najmanjeg, a manja od najveeg modaliteta u statistikoj seriji, odnosno: ;
- U homogenoj statistikoj seriji vrijednost harmonijske sredine jednaka je vrijednostima
modaliteta, odnosno ako je ; - Ukoliko za odreenu statistiku seriju izraunamo aritmetiku, geometrijsku i harmonijsku
sredinu njihove vrijednosti mogu biti jednake, ukoliko nisu najvea je aritmetika, a
najmanja harmonijska. Dakle, u svakoj statistikoj seriji vrijedi: .
49
Primjer 2.8. Jedno proizvodno preduzee za potrebe proizvodnje proizvoda P koristi 7 maina
razliite starosti I porijekla ali iste namjene. Efektivan rad maina na proizvodnim zadacima iznosi 15 sati
direktnog rada dnevno (pretpostavlja se rad u dvije smjene u trajanju od po 8 sati plus jo po pola sata
pripremno zavrnih radova u svakoj smjeni 2*8 2*0,5 =16 1 =15). Prosjeno vrijeme potrebno za
izradu jedne jedinice proizvoda P u satima na svakoj koritenoj maini moe se prikazati sljedeim
tabelarnim prikazom:
Maina I II III IV V VI VII
Prosjeno utroeno vrijeme po jedinici proizvoda
(h/kom)
0,168 0,696 0,271 0,502 0,363 0,574 0,464
Tabela 26. Prosjean dnevni utroak vremena po jedinici proizvoda kod svake proizvodne maine
Potrebno je:
a. Oderditi prosjenu produktivnost koritenih proizvodnih maina po proizvodu;
b. Kolika je prosjena dnevna proizvodnja u posmatranom preduzeu;
c. Uporediti vrijednost harmonijske sredine sa geometrijskom i aritmetikom sredinom posmatrane
statistike serije.
Rjeenje:
a. Ovdje imamo osobinu ija vrijednost predstavlja kolinik dvije veliine i to: utroeno vrijeme u
efektivan rad maina u toku radnog dana (iznosi 15 sati) i ostvarenog obima proizvodnje u toku
radnog dana na posmatranoj maini. Harmonijska sredina kod posmatrane serije izraunava se kao
prosta srednja vrijednost, odnosno kao kolinik izmeu broja modaliteta i zbira njihovih recipronih
vrijednosti. U narednoj tabeli izraunati su pojedini elementi neophodni za izraunavanje
harmonijske, geometrijske i aritmetike sredine.
Maina Prosjeno utroeno vrijeme po
jedinici proizvoda (h/kom) xi Log xi
I 0,168 5,952381 -0,77469
II 0,696 1,436782 -0,15739
III 0,271 3,690037 -0,56703
IV 0,502 1,992032 -0,2993
V 0,363 2,754821 -0,44009
VI 0,574 1,74216 -0,24109
VII 0,464 2,155172 -0,33348
Ukupno (6): 3,038 19,72338 -2,81307 Tabela 27. Radna tabela elementi za izraunavanje harmonijske, geometrijske i aritmetike sredine
50
Obrazac kojim izraunavamo prostu harmonijsku sredinu je:
Uvrtavanjem konkretnih vrijednosti u ovaj obrazac dobijamo:
Obrazac kojim izraunavamo prostu geometrijsku sredinu je:
Uvrtavajui konkretne vrijednosti u prethodni obrazac, dobijamo:
Obrazac kojim izraunavamo prostu aritmetiku sredinu je:
Uvrtavajui konkretne vrijednosti u prethodni obrazac, dobijamo:
Prosjeno utroeno vrijeme po jedinici proizvoda je 0,355 sati, odnosno 21 minuta i 18 sekundi.
Harmonijska sredina je prosjena vrijednost kojom je relevantno izraziti prosjek u posmatranoj statistikoj
seriji.
Uoavamo da je harmonijska (kao i geometrijska i aritmetika) sredina vea od najmanjeg (xmin =
0,168), a manja od najveeg (xmax = 0,696) modaliteta u statistikoj seriji. Odnosno vrijedi:
b. Prosjeno utroeno vrijeme je kolinik izmeu ukupno utroenog vremena i ostvarenog obima
proizvodnje, pri emu je ukupno utroeno vrijeme jednako proizvodu izmeu broja maina i
efektivnog dnevnog proizvodnog rada maina, odnosno 7 * 15 = 105 sati. Prosjenu vrijednost
dnevne proizvodnje (QD) izraunavamo kao kolinik izmeu ukupnog dnevno utroenog vremena u
proizvodnju i projenog utroka vremena po jedinici proizvoda:
Posmatrano preduzee u toku radnog dana u prosjeku proizvede 296 proizvoda P.
c. Uvidom u izraunate srednje vrijednosti uoavamo da harmonijska sredina ima najmanju vrijednost
meu njima, aritmetika ima najveu vrijednost, dok je geometrijska izmeu njih, dakle vea od
harmonijske, a manja od aritmetike sredine, odnosno vrijedi:
51
H = 0,355 < G = 0,39639 < =0,434 Primjer 2.8. Polazei od podataka o uestalosti posjeta pacijenata ljekaru porodine medicine (primjer
2.2) odrediti harmonijsku sredinu formirane distribucije! Uporediti dobijenu vrijednost sa vrijednou
aritmetike sredine!
Rjeenje:
U analiziranom primjeru imamo seriju distribucija frekvencija kod koje vrijednost harmonijske sredine
izraunavamo kao ponderisanu sredinu pomou obrasca:
Elemente potrebne za izraunavanje harmonijske sredine posmatrane statistike serije pri emu uvidom
u empirijsku grau uoavamo da je: x1 = 0 (tabela statistike serije primjer 2.2). Navedena injenica upuuje
na zakljuak da harmonijsku sredinu kod posmatrne statistike serije nije mogue izraunati jer vrijednost
matematikog izraza nije definisan! (Napomena kod posmatrane statistike serije f1 = 15)
Zakljuujemo da kod posmatrane statistike serija nije mogue izraunati harmonijsku sredinu.
Primjer 2.10. Odrediti harmonijsku sredinu distribucije stanovnika prema visini dijastolnog pritiska iz
primjera 2.3. Uporediti vrijednost harmonijske sredine sa vrijednosu aritmetike i geometrijske sredine.
Rjeenje:
U analiziranom primjeru imamao intervalnu seriju disribucija frekvencija kod koje se harmonijska
sredina odreuje kao ponderisana srednja vrijednost. Porebne elemente za odreivanje harmonijske sredini
posmatrane distribucije prikazujemo u narednoj tabeli.
Visina dijastolnog pritiska (mmHg)
xi
Broj ispitanika fi
ri
Log xi fi log xi Do 60 4 57,5 0,069565 1,759668 7,038671 60 65 18 62,5 0,288 1,79588 32,32584 65 70 55 67,5 0,814815 1,829304 100,6117 70 75 52 72,5 0,717241 1,860338 96,73758 75 80 68 77,5 0,877419 1,889302 128,4725 80 85 40 82,5 0,484848 1,916454 76,65816 85 90 38 87,5 0,434286 1,942008 73,79631 90 95 19 92,5 0,205405 1,966142 37,35669 95 i vie 6 97,5 0,061538 1,989005 11,93403 Ukupno (6): 300 - 3,953119 - 564,9315 Tabela 28. Radna tabela elementi za odreivanje harmonijske sredine distribucije stanovnika prema visini
dijastolnog pritiska
52
Polazei od obrasca za odreivanje ponderisane harmonijske sred