Statistika Borko

11
VARIJABILNA POJAVA-je ona na koju djeluje veliki broj faktorai zbog toga uzima razlicite vrijednosti od jednog do drugog slucaja svoga ispoljavanja. STATISTIKA-je univerzalni kvalitativno-kvantitativninaucni metod analize varijabilnih pojava,zasnovan na teoriji vjerovatnoce.Statistika izucavavarijabilne pojavena 2 nacina.Prvi se sastoji u tomesto se prikupe podaciza svaku vrijednost te pojave.Drugi je da se posmatra samo dio cjeline,koji se naziva uzorak.U oba slucaja cilj je indentican- da se dodje do informacijeo karakteristikama cjeline. EKSTREMNI PODATAK-(opservacija ili vrijednost) je onaj koji znatno odstupa od vrijednosti ostalih podataka,bilo zato sto je znatno veci ili znatno manji.Nekada je ekstremna vrijednost jednostavno nastala kao greska u mjerenju ili unosu.E.V.moze biti signal da se nesto neuobicajno dogadja sa posmatranom pojavom. STATISTICKI SKUP-sku svih elemenata na kojima se izvjesna varijabilna pojava ispoljava i statisticki posmatra naziva se statisticki skupili osnovni skup ili populacija. JEDINICA SKUPA-pojedinacni elementi iz kojih se skup sastoji nazivaju se jedinicama skupa ili jedinicama posmatranja. STATISTICKO OBILJEZJE-osobine po kojima se jedinice statistickog skupa medjusobno razlikuju a koje su predmet statistickog istrazivanja ,nazivamo obiljezima(promjenljivim ili varijabilnim).Sva obiljezja u statistici mozemo klasifikovatiu 2 osnovne grupe: 1.Atributivna (se izrazavaju opisno-rijecima,a varijabilitet se ispoljava kroz pripadnost elemenata razlicitim kategorijama datog obiljezja) 2.Numericka(su takve karakteristike skupa da se mogu iskazati brojevima).Unutar ove grupe razlikujemo :prekidna i neprekidna obiljezja.Sustinska razlika izmedju ove dvije grupe je u tome sto priekidna obiljezja svoje vrijednosti(modelitete) dobijaju na osnovu prebrojavanja,a neprekidna na osnovu mjerenja .Prekidna obiljezja su numericke karakteristike koje mogu uzimati samo izolovane vrijednosti na mjernoj skali.Neprekidna obiljezja predstavljaju numericke karakteristike jedinica skupa koje mogu uzeti bilo koju vrijednost unutar nekog intervala. PARAMETAR SKUPA I STATISTIKA UZORKA-statisticki uzorak prestavlja dio statistickog skupa na osnovu cijih osobina donosimo statisticke zakljucke o odgovarajucim karakteristikama

description

1111

Transcript of Statistika Borko

Page 1: Statistika Borko

VARIJABILNA POJAVA-je ona na koju djeluje veliki broj faktorai zbog toga uzima razlicite vrijednosti od jednog do drugog slucaja svoga ispoljavanja.STATISTIKA-je univerzalni kvalitativno-kvantitativninaucni metod analize varijabilnih pojava,zasnovan na teoriji vjerovatnoce.Statistika izucavavarijabilne pojavena 2 nacina.Prvi se sastoji u tomesto se prikupe podaciza svaku vrijednost te pojave.Drugi je da se posmatra samo dio cjeline,koji se naziva uzorak.U oba slucaja cilj je indentican-da se dodje do informacijeo karakteristikama cjeline.EKSTREMNI PODATAK-(opservacija ili vrijednost) je onaj koji znatno odstupa od vrijednosti ostalih podataka,bilo zato sto je znatno veci ili znatno manji.Nekada je ekstremna vrijednost jednostavno nastala kao greska u mjerenju ili unosu.E.V.moze biti signal da se nesto neuobicajno dogadja sa posmatranom pojavom.STATISTICKI SKUP-sku svih elemenata na kojima se izvjesna varijabilna pojava ispoljava i statisticki posmatra naziva se statisticki skupili osnovni skup ili populacija.JEDINICA SKUPA-pojedinacni elementi iz kojih se skup sastoji nazivaju se jedinicama skupa ili jedinicama posmatranja.STATISTICKO OBILJEZJE-osobine po kojima se jedinice statistickog skupa medjusobno razlikuju a koje su predmet statistickog istrazivanja ,nazivamo obiljezima(promjenljivim ili varijabilnim).Sva obiljezja u statistici mozemo klasifikovatiu 2 osnovne grupe:1.Atributivna (se izrazavaju opisno-rijecima,a varijabilitet se ispoljava kroz pripadnost elemenata razlicitim kategorijama datog obiljezja)2.Numericka(su takve karakteristike skupa da se mogu iskazati brojevima).Unutar ove grupe razlikujemo :prekidna i neprekidna obiljezja.Sustinska razlika izmedju ove dvije grupe je u tome sto priekidna obiljezja svoje vrijednosti(modelitete) dobijaju na osnovu prebrojavanja,a neprekidna na osnovu mjerenja .Prekidna obiljezja su numericke karakteristike koje mogu uzimati samo izolovane vrijednosti na mjernoj skali.Neprekidna obiljezja predstavljaju numericke karakteristike jedinica skupa koje mogu uzeti bilo koju vrijednost unutar nekog intervala.PARAMETAR SKUPA I STATISTIKA UZORKA-statisticki uzorak prestavlja dio statistickog skupa na osnovu cijih osobina donosimo statisticke zakljucke o odgovarajucim karakteristikama populacije iz koje je izabran.Reprezentativni uzorak-je reprezentativan ako svojim osobinama vijerno odslikava osobine statistickog skupa iz kojeg je izabran.Parametar skupa –je neka sumarna numericka karakteristika tog skupa.Na osnovu def.parametra vidimo da je parametar u stvari neki broj koji se odnosi na skup.Statistika uzorka-je neka sumarna karakteristika toga uzorka.MODUS-je vrijednos obiljezja koja se najcesce javlja u seriji,odnosno vrijednost obiljezja sa najvecom frekvenciom.Ako neka serija ima vise modusa naziva se multimodalna serija.Za izracunavanje modusa potrebno je najprije pronaci interval sa najvecom frekvenciom(modelni interval).MEDIJANA-je vrijednost obiljezja koja se nalazi u sredini serije ciji su podaci sredjeni po ni velicini.Mjesto medijane odrezuje se kao N+1/2 podatak u seriji. Modus → Mo=L1+ f2-f1// (f2-f1) + (f2-f3) * i L1-donja granica modalnog intervala f1-frekvencija predmodalnog intervala f2-frekvencija modalnog intervala f3-frekvencija poslemodalnog intervala i-velicina modalnog intervala Me= L1+ N+1/2 -∑f1 //fMe *i L1-donja granica medijalnog intervala N-br.podataka u seriji ∑f1- suma frekv.predmedijalnog intervala fMe-frekvencija medijalnog intervala i- velicina medijalnog intervalaVJEROVATNOCA. Osnovni pojmovi u teoriji vjerovatnoce su:ekstremitet,ishod i prostor uzorka,odnosno elementarnih dogadjaja. Ekstremiteti su potpuno precizirane operacije posmatranja ili prikupljanja podataka,koje se u nepromjenjenim uslovima mogu ponavljati proizvoljno mnogo puta i ciji se ishod ne moze sa sigurnoscu predvidjeti. Realizacije ekstremiteta su ishodi(elementarni dogadjaji) kao skup unaprijed poznatih mogucnosti

Page 2: Statistika Borko

realizacije. U svakom pojedinom izvodjenju ekstremiteta realizuje se samo jedan ishod-elementarni dogadjaj,sto znaci da su elementarni dogadjaji medjusobno iskljucivi. Prostor uzorka ( prostor elementarnih dogadjaja ) je skup svih elementarnih dogadjaja a moze se oznaciti kao: S={e1,e2,...ei..,en}, ei€ S,1≤ i ≥ nSlucajni dogadjaj predstavlja predskup skupa elementarnih dogadjaja koji imaju neku zajednicku osobinu. Siguran dogadjaj (S) jednak je skupu elementarnih dogadjaja i realizuje se svaki put kada se izvodi odredjeni eksperiment. Nemoguc dogadjaj (N) je onaj koji se ne moze realizovat prilikom izvodjenja nekog eksperimenta.AKSIOMETSKA DEF.VJEROVATNOCE DOGADJAJA Aksiomatska teorija vjerovatnoce Kolmogorova zasniva se na pojmu ơ-polja. Neka je Φ familija podskupova skupa S koja ima sledece osobine: 1.SЄΦ, 2.ako AЄΦ tada A ͨ ЄΦ 3.ako A1,A2,...ЄΦ tada i U +҃n=1AnЄΦ Familija Φ sa navedenim osobinama zove se ơ-polje ili ơ-algebra dogadjaja. Vjerovatnoca je realna funkcija definisana na ơ-polju Φ dogadjaja iz S koja ima sledece osobine: 1.Za svako AЄΦ vazi P(A)≥0 (negativnost) 2.P(S)=1 (normiranost) 3.ako su A1,A2,...uzajamno disjunktni dogadjaji,tada je P(∑ ҃n=1 An)=∑ ҃n=1 P(An) (ơ-aditivnost) 1.Vjerovatnoca nemoguceg dogadjaja je nula P( ∞)=0 2.Vjerovatnoca je konacno aditivna funkcija:ako su A1,A2,...An uzajamno disjunktni dogadjaji,tada je P(∑ͫ i=1 Ai)= ∑ͫ i=1 P(Ai) 3.Vjerovatnoca suprotnog dogadjaja: P(A ͨ)=1-P(A) 4.Ako je AЄΦ tada je P(A) ≤ P(B) 5.Za svako AЄΦ vazi 0≤ P(A) ≤ 1 6.Lema o pokrivanju ili Bulova nejednakost: P(A1 U A2...) ≤ ∑∞i=1 P(Ai) 7.Za slucaj da je n=2 bice: P(A U B)=P(A)+P(B)-P(AB) Pravila sabiranja vjerovatnoca (aditivno pravilo) P(E1 U E2) = P(E1) * P(E2) – P(E1∩E2) Pravilo mnozenja vjer.(multiplikativno pravilo) P(E1∩E2) = P(E1) * P(E2/E1) P(E1∩E2) = P(E2) * P(E1/E2) Klasicna def.vjerovatnoce-ako skup elementarnih dogadjaja nekog eksperimenta ima n-elemenata sa jednakim mogucnostima realizacije i ako realizacija ukupno k-elementarnih dogadjaja pri cemu je 0<k<u povlaci realizaciju dogadjaja E,tada je vjerovatnoca dogadjaja E data izrazom P(E)= k/nUSLOVNA VJEROVATNOCA I NEZAVISNOST DOGADJAJA Za dva dogadjaja E1 i E2 uslovna vjerovatnoca oznacava se sa P(E2/E1) i predstavlja vjerovatnocu ostvarenja dogadjaja E2 pod uslovom da se ostvario dogadjaj E1. Ova vjerovatnoca odredjuje se pomocu izraza: P(E2/E1)= P(E1∩E2)// P(E1) uz uslov da je P(E1)>0 Nezavisni dogadjaji su onikod kojih ostvarenje ili neostvarenje jednog dogadjaja nema uticaja na vjerovatnocu ostvarenja drugog dogadjaja tako da je: P(E2/E1) = P(E2) ˄ P(E1/E2)=P(E1) VJEROVATNOCA UZORKA (BAYES-OVA TEOREMA) Opsti oblik Bays-ove teoreme: P(Di/X) = P(Di)//P(X) * P(X/Di)= P(Di)*P(X/Di)//∑P(Di)*P(X/Di) Pri tome se dogadjaji D1,D2,...Dk smatraju uzrocima dogadjaja X koji je dakle njihova posledica. Zato se ova vjerovatnoca oznacava kao vjerovatnoca uzroka. Treba uociti da su vjerovatnoce P(D1) a priori , a vjerovatnoce P(X/D1) a posteriori,sto u konacnom rezultatu daje a posterione vjerovatnoce,koje pokazuju da je neki od dogadjaja D1,D2,...Dk bio uzrok nastanka dogadjaja X.SLUCAJNE PROMJENLJIVE- Promjenljiva koja svoje vrijednosti uzima „na slucaj“ naziva se slucajna promjenljiva. Slucajne promjenljive se najcesce oznacavaju velikim slovima X,Y,Z, a vrijednosti koje one uzimaju odgovarajucim malim slovima x1,x2...y1,y2...z1,z2... Slucajna promjenljiva je numericka funkcija koja svakom ishodu statistickog eksperimenta pridruzuje jedan realan broj.Za slucajne promjenljive kazemo da je prekidna ako moze uzeti konacan broj izolovanih vrijednostiili prebrojiva mnogo vrijednosti slucajne promjenljive je neprekidna ako moze da uzme bilo koju vrijednost u nekom intervalu.RASPORED VJEROVATNOCA PREKIDNE SLUCAJNE PROMJENLJIVE- Prekidna slucajna promjenljiva moze se opisati kao velicina koja uzima odredjene izolovane vrijednosti sa odgovarajucim vjerovatnocama. Ako slucajna promjenljiva X uzima vrijednosti iz prebrojivog skupa Sx=(x1,x2,...),niz Pi=P(X=xi), i=1,2,... naziva se zakon raspodjele slucajne

Page 3: Statistika Borko

promjenljive X. 1.Nijedna vjerovatnoca u rasporedu vjerovatnoce ne moze biti negativna tj. P(X=xi)≥0 za svako i. 2.Suma vjerovatnoca koje odgovaraju svim vrijednostima slucajne promjenljive X mora biti jednaka 1,tj. ∑Pi=1 Razlicite vrijednosti X Vjerovatnoca p Raspored vjerovatnoce je teorijski model koji pridruzuje vjerovatnoce pojedinim vrijednostima slucajne promjenljive.Moze se formirati tek nakon prikupljanja podataka na osnovu statistickog eksperimenta.FUNKCIJA RASPOREDA PREKIDNE SLUCAJNE PROMJENLJIVE- Funkcija rasporeda slucajne promjenljive X se oznacava sa F(x) i data je vjerovatnocom: F(x)=P(X≤x) naziva se jos i kumulativna Φ-ja rasporeda prekidne slucajne promjenljive,gdje x moze biti bilo koji realan broj. Ocekivana vrijednost slucajne promjenljive X oznacava se sa E(X). E(X)=x1,p1+x2,p2+....+xn pn=∑ͫ i=1 xi pi Ocekivana vrijednost naziva se jos matematicko ocekivanje ili jednostavno ocekivanje od X. U praktickim istrazivanjima,pojam ocekivana vrijednost slucajne promjenljive X najcesce se proistovjecuje sa aritmetickom sredinom osnovnog skupa. Zbog toga mozemo i napisati sledecu jednakost: E(X)=μx=μ odnosno ocekivana vrijednost jednaka je aritmetickoj sredini populacije.VARIJANSA PREKIDNE SLUCAJNE PROMJENLJIVE- Mjera dispozicije rasporeda vjerovatnoce slucajne promjenljive naziva se varijansa slucajne promjenljive. Varijansa slucajne promjenljive oznacava se sa Var(X) ili ơ² i dobija se na osnovu obrasca: Var(X)= ơ²x=E[X-E(X)]²=∑[xi-E(X)]²pi ơ²=∑i(xi-μx)²pi Var(X)=ơ²x=E[X-E(X)]²=E(X²)-[E(X)]²=∑xi²pi-μx² Standardizovana slucajna promjenljiva Z= X-E(X)//ơx E(Z)=0 VarZ=1BINOVNI RASPORED- Najcesce koristeni pekidni raspored u primijenjenoj situaciji jeste binovni raspored. (1)Svaki opit rzultira u jednom od dva moguca ishoda,koje tehnicki klasifikujemo kao uspjeh (U) i neuspjeh (N). (2)Vjerovatnoca uspjeha,p=P(U),konstantna je od opita do opita,vjerovatnoca neuspjeha P(N)=1-p oznacava se sa q,tako da je p+q=1. (3)Opiti su nezavisni,odnosno bilo koji ishod da se realizuje u nekom opitu nece imati uticaja na vjerovatnocu ishoda u bilo kom drugom opitu. Binovni raspored: P(X)=( n nad x)pˣ(1-p)na n-x za x=0,1,2,...,n n=boj opita p=vjerovatnoca „uspjeha“ u svakom opitu. Binovni raspored ima dva parametra, n i p. Aritmeticka sredina,varijansa i standardna devijacija binomnog rasporeda dobijaju se na osnovu sledecih formula: aritmeticka sredina μx=E(X)=np vjerovatnoca uspjeha p mora ostati konstantna iz opita u opit,odnosno opiti moraju biti medjusobno zavisni.POASONOV RASPORED- Ukoliko je vjerovatnoca uspjeha p veoma mala(najcesce se uzima da je p≤0,05) i kada je n≥20,umjesto binomnog metoda mozemo koristiti Poasonov model. Poasonov raspored nam ne sluzi samo za aproksimiranje binovnih vjerovatnoca.Pomocu njega mozemo opisivati veliki broj pojava ,bilo u vremenu ili prostoru. Poasonov raspored se moze koristiti da bi se odredila vjerovatnoca broja javljanja nekog dogadjaja u jedinici vremena ili prostora. 1.Broj javljanja dogadjaja je nezavisan od jedne do druge jedinice vremena ili prostora. 2.Vjerovatnoca javljanja nekog dogadjaja je proporcionalna duzini odredjene jedinice vremena ili prostora. 3.Vjerovatnoca istovremenog javljanja dva ili vise dogadjaja u sasvim maloj jedinici vremena ili prostora je zanemarljivo mala. Poasonov raspored: P(X=x)=e na minus λ λˣ//x! x=0,1,2,... λ>0 E(X)=ơ²x=λ Poasonov ja asimetrican udesno,jer slucajna promjenljiva X ne moze uzeti vrijednost manje od nule,i da se povecanjem vrijednosti λ raspored tezi da zauzme simetrican oblik.HIPERGEOMETRIJSKI RASPORED- P(X=x)={[N1 nad x] * [N2 nad n-x] // [N nad n]} x=0,1,...min(n,N1) N-je velicina populacije, n-velicina uzorka, x-broj uspjeha u uzorku, n-x:broj neuspjeha u uzorku, N1-broj uspjeha u prpopulaciji, N2-broj neuspjeha u populaciji, min(n,N1) minimum od n i N1. Hipergeometrijski raspored je prekidan i predstavlja citavu familiju rasporeda.Svaki clan ove familije je odredjen sa 3 parametra: N,N1 i n. Aritmeticka sredina μx=E(X)=np.

Page 4: Statistika Borko

UNIFORMNI RASPORED(DISKRETNA RAVNOMIJERNA RASPODJELA)- Jedan od najjednostavnijih prekidnih rasporeda,koji je posebnu primjenu nasao u kompjuterskoj simulaciji i igrama na srecu,jeste uniformni raspored.Njegova osnovna karakteristika je da svaka vrijednost slucajne promjenljive ima jednaku vjerovatnocu da se ostvari. Uniformni raspored: P(X=x)=1/n x=1,2,..,n n-broj razlicitih vrijednosti koje X moze uzeti Aritmeticka sredina i varijansa uniformnog rasporeda date su sledecim formulama: E(X)=n+1 //2 ơ²x= n²-1 // 12 Funkcija rasporeda ove slucajne promjenljive je: P(X)={ºı x-1//nNEPREKIDNA SLUCAJNA PROMJENLJIVA- Druga kljucna razlika izmedju neprekipnih i prekidnih slucajnih promjenljivih je u tome da prekidne mogu uzimati samo izolovane vrijednosti,a neprekidne sve vrijednosti u nekom intervalu. Matematicka funkcija oznacena sa f(x),ciji je grafik prestavljen tom krivom,naziva se funkcija gustine vjerovatnoce neprekidne slucajne promjenljive X. Osnovne karakteristike funkcije gustine vjerovatnoce su analogne onima kod prekidnih. 1.Funkcija gustine nikada nije negativna,tj. f(x)≥0 2.Ukupna povrsina ispod krive gustine vjerovatnoce uvijek je jednaka 1. P(a<X<b)=F(b)-F(a)NORMALAN RASPORED- Normalan raspored prvi je otkrio 1733 francuski matematicar Abraham de Moivre,kao granicni oblik binomnog rasporeda,tj.posmatrajuci sta se dogadja sa binomnim rasporedom kada se broj opita neograniceno povecava.Za slucajnu promjenljivu X kazemo da ima normalan raspored ako je karakteristisu neprekidne vrojednosti,a njena funkcija gustine vjerovatnoce ima sledeci izraz. Normalan raspored: f(x)=1// ơ korijen iz 2π *e na –(x-μ)²/2ơ² -∞<x<+∞ π-matematicka konstanta,priblizno jednaka 3,14159 e-matematicka konstanta,priblizno jednaka 2,71828 μ-aritmeticka sredina normalne slucajne promjenljive ơ-standardna devijacija normalne slucajne promjenljive Takvu slucajnu promjenljivu oznacavamo sa X:N(μ,ơ²),sto se cita X ima normalan rasporedsa parametrima μ i ơ².OSOBINE NORMALNOG RASPOREDA- 1.Normalna kriva ima oblik zvona,unimodalna je i simetricna u odnosu na vrijednost x=μ. 2.Buduci da je normalan raspored simetrican,njegova aritmeticka sredina,modus i medijana su medjusobno jednaki. 3.Normalna kriva se proteze od -∞ do +∞,tj.asiptotski se priblizava x osi,pa je njen interval varijacije beskonacan (i=∞). 4.Relativna mjera asimetrije α3 jednaka je 0,a relativna mjera spoljasnosti α4 ima vrijednost 3. 5.Ukupna povrsina ispod krive,kao kod svake krive gustine vjerovatnoce,jednaka je 1. 6.Normalan raspored je u potpunosti definisan sa dva parametra,μ i ơ².STANDARDIZIVAN NORMALAN RASPORED- Za normalan raspored kazemo da je u standardizovanom obliku ako je njegova arimeticka sredina jednaka nuli,a varijansa,odnosno standardna devijacija jednaka jedinici. Uobicajeno je da se standardizovana normalna promjenljiva oznacava sa Z,pa se formula za njen raspored vjerovatnoce moze napisati u vidu: f(z)=1// korijen iz 2π * e na z²/2 -∞ <z< +∞ DESKRIPTIVNE STATISTICKE MJERE- Smisao ovih mjera je da: a) jednim brojem opišu bitne karakteristike posmatranih podataka, b) da omoguće poređenje između više statističkih serija. Deskriptivne mjere klasifikujemo u četiri grupe: 1) mjere centralne tendencije rasporeda (srednje vrijednosti),

2)mjere varijabiliteta (disperzije ili raspršenosti),

3)mjere oblika rasporeda, i

4)relativno učešće (proporciju). Deskriptivne mjere koje se izračunavaju na osnovu svih podataka skupa nazivaju parametri skupa, a deskriptivne mjere koje se odnose na uzorak nazivaju se statistikama uzorka.

Page 5: Statistika Borko

ARITMETICKA SREDINA- Aritmetička sredina (obilježena simbolom - čitaj mi) skupa (ili posmatranog obilježja) izračunava se na sljedeći način: = = Ako je u pitanju uzorak veličine n, aritmetička sredina (koju ćemo obilježiti sa ) iz negrupisanih podataka izračunava se na sljedeći način: ili, jednostavnije:

ponderisana aritmetička sredina: =

odnosno, jednostavnije: , ponderisana aritmetička sredina

uzorka biće: Prosta aritmetička sredina Za skup Za

uzorak Ponderisana aritmetička sredna Za skup Za uzorak

OSOBINE ARITNETICKE SREDINE- Aritmetička sredina, kao prosječna vrijednost obilježja svih jedinica skupa, izravnava apsolutne razlike između podataka posmatrane serije. Zbir odstupanja svih vrijednosti obilježja od njihove aritmetičke sredine jednak je nuli, tj.

, odnosno u slučaj grupisanih podataka: .

Y = ,

UZORACKA DISTRIBUCIJA- Uzoračka distribucija određene statistike predstavlja distribuciju vjerovatnoće svih mogućih vrijednosti koje ta statistika može da uzme, a koje se dobiju izračunavanjem svih uzoraka iste veličine, slučajno izabranih iz posmatrane populacije.

UZORACKA DISTRIBUCIJA ARTIMETICKE SREDINE- Uzoračka distribucija aritmetičke sredine predstavlja distribuciju vjerovatnoće svih mogućih vrijednosti koje slučajna promjenljiva može da uzme, a koje se dobiju izračunavanjem iz svih uzoraka veličine n, slučajno izabranih iz posmatrane populacije.

STANDARDNA GRESKA ARTIMETICKE SREDINE UZORACKE DISTRIBUCIJE-

U slučaju uzoraka sa ponavljanjem izračunava se na osnovu izraza: Kod

uzoraka bez ponavljanja iz konačnih skupova, čiji broj elementa N je poznata veličina,

standardna greška aritmetičke sredine izračunava se na osnovu izraza:

Potkorijena veličina naziva se korektivni (popravni) faktor za konačne skupove i

očigledno je da korekciju standardne greške vrši u manjoj ili većoj mjeri s obzirom na veličinu uzorka, odnosno s obzirom na odnos veličine uzorka i veličine osnovnog skupa n/N.

UZORACKA DISTRIBUCIJA PROPORCIJE- Kao što je aritmetička sredina uzorka nepristrasna ocjena aritmetičke sredine populacije, tako je i P nepristrasna ocjena proporcije populacije. Prema analogiji sa uzoračkom distribucijom aritmetičke sredine, standardna

Page 6: Statistika Borko

greška proporcije data je izrazom: Prilikom uzorkovanja sa ponavljanjem iz

konačne populacije, uzoračka distribucija proporcije slijedi binomni raspored, a u slučaju bez ponavljanja hipergeometrijski. Razlika između proporcije uzorka i proporcije populacije u

jedinicama standardnog normalnog rasporeda je:

OCJENJIVANJE PARAMETARA POPULACIJE- Postoje dva načina statističkog ocjenjivanja: tačkasto ocjenjivanje i intervalno.Tačkasto ocjenjivanje ili ocjenjivanje jednim brojem kao polazište ima statistiku uzorka koja se koristi za ocjenu stvarne vrijednosti parametra populacije. Tačkasto ocjenjivanje podrazumijeva da se aritmetička sredina uzorka

proglasi tačkastom ocjenom aritmetičke sredine populacije , odnosno da se bilo koja statistika uzorka (proporcija, varijansa i sl.) odredi kao ocjena vrijednosti parametra populacije.Intervalno ocjenjivanje podrazumijeva proceduru u kojoj se formira interval u kojem se sa određenom vjerovatnoćom očekuje vrijednost parametra osnovnog skupa. Interval povjerenja je raspon (područje) vrijednosti za koje se vjeruje da uključuju nepoznatu vrijednost parametra populacije.

OSOBINE OCJENA- Poželjne osobine ocjena su: nepristrasnost, efikasnost, konzistentnost i dovoljnost.Ocjena parametra populacije je nepristrasna ako je njena očekivana vrijednost (prosjek) jednaka parametru populacije.Efikasnost ocjene podrazumijeva njenu karakteristiku varijabiliteta. Ocjena je utoliko efikasnija ukoliko ima manju varijansu, odnosno standardnu grešku, za uzorke iste veličine. Konzistentnost, kao osobina ocjena, veže se za tendencije ocjene u odnosu na vrijednost parametra populacije u slučajevima kada se veličina uzorka mijenja. Za ocjenu se može konstatovati da je konzistentna ako, sa povećanjem veličine uzorka, ona teži vrijednosti parametra populacije. Ocjena je dovoljna ako uzima u obzir cjelovitu informaciju iz uzorka. Tako, na primjer, je dovoljna ocjena, jer koristi cjelovitu informaciju iz uzroka.

STUDENTOVA T-DISTRIBUCIJA- Ako je populacija normalno raspoređena, tada

standardizovana statistika: ima t raspored sa n – 1 stepeni slobode. Karakteristike t

distribucije- Aritmetička sredina t distribucije je 0. Za df 2, varijansa t distribucije jednaka je df/(df – 2). Stepeni slobode- Broj stepeni slobode predstavlja broj nezavisnih vrijednosti u uzorku, koji se dobije kada se broj raspoloživih vrijednosti umanji za broj ograničenja koja se nameću ovim vrijednostima.

TESTIRANJE STATISTICKIH HIPOTEZA- Dva osnovna metoda inferencijalne statistike su:ocjenjivanje i testiranje statistickih hipoteza. Statisticka hipoteza je precizno formulisano tvrdjenje ili pretpostavka o nekoj vaznoj karakteristici jednog ili vise skupova. Statisticki metod kojim se empirijska evidencija uzoraka koristi radi procjenjivanja njene prifvatljivosti naziva se testiranjem hipoteze,a procedura statistickim testom.Ocjenjivanje se koristi kada je potrebno samo doci do informacije o nepoznatom parametru osnovnog skupa. Testiranje hipoteze se primjenjuje ako su istovremeno ispunjena sledeca dva uslova: a)Na istrazivacko pitanje (problem) postoje samo dva moguca odgovora,da ili ne, b)Problem se resava koristenjem uzoraka.

NULTA I ALTERNATIVNA HIPOTEZA- Nulta hipoteza (H0) je postavka (iskaz) o vrijednosti nepoznatog parametra skupa. Testiranje hipoteze je tako koncipirano da se procijeni jacina dokaza protiv nulte hipoteze. Da bi se H0 odbacila potrebno je pronaci dovoljno ubjedljive dokaze u uzroku. Konkretna nultahipoteza varira od problema do

Page 7: Statistika Borko

problema,ali tipicno se ona postavlja u vidu status quo,tj.da „nema razlike“,“nema uticaja“,ili da „nema promjene“. Nulta hipoteza moze biti prosta i slozena.Nultu hipotezu,npr.mozemo simbolicki napisati H0:μ=100 gr i citamo: „nulta hipoteza glasi da je artimeticka sredina skupa jednaka 100 grama“. Alternativna hipoteza je tvrdjenje o parametru skupa koje ce biti prihvaceno samo kada se nadju dovoljno ubjedljivi dokazi u uzorku. Najcesce se postavlja u vidu da „ima razlike“,da „postoji uticaj“ ili da je „doslo do promjene“. Nivo znacajnosti testa je vjerovatnoca da cemo odbaciti istinitu nultu hipotezu. Obiljezava se sa α. Jacina testa je vjerovatnoca da se odbaci pogresna nulta hipoteza.Obiljezava se sa π. Statistika testa je kriterijum na osnovu kojeg vrsimo testiranje i na osnovu kojeg u konceptu testiranja na osnovu kriticnih vrijednosti donosimo odluku o odbacivanju ili neodbacivanju nulte hipoteze.U nasem „integralnom“ konceptu testiranja statistika testa je samo medjukorak ka izracunavanju p-vrijednosti. Ako je p-vrijednost manja od nivoja znacajnosti α nulta hipoteza se odbacuje.U suprotnom,kazacemo da nemamo dovoljno argumenata da odbacimo H0. Statistika znacajnost-ako je p-vrijednost jednaka ili manja od nivoa znacajnosti α kazemo da je rezultat statisticki znacajan na nivou α.