Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika
description
Transcript of Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika
![Page 1: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/1.jpg)
1
Slučajna spremenljivka, ki zavzame vrednostiizračunane iz vzorca, se imenuje statistika
Najpogosteje jih uporabljamo za ocenjevanje parametrov populacije iz katere je izbran slučajni vzorec
Statistiko, ki jo uporabljamo za ocenjevanjeparametra populacije imenujemo cenilka.
Vrednost cenilke je ocena parametra populacije
Cenilka je postopek po katerem iz izbranega vzorca izračunamo oceno parametra.
![Page 2: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/2.jpg)
2
Če iz populacije z aritmetično sredino in standardnim odklonom izberemo slučajni vzorec velikosti n, katerega aritmetična sredina je x
potem je veličina
Xn
tudi slučajna spremenljivka in teži k standardizirani normalni, ko velikost vzorca raste.
Centralni limitni izrek
![Page 3: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/3.jpg)
3
Praktično to pomeni, da je aritmetična sredina vzorca X porazdeljena normalno z matematičnim
upanjem in standardnim odklonom n
Za n 30 zelo dobri rezultati
Zaradi centralnega limitnega izreka velja
( )M X
![Page 4: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/4.jpg)
4
Lastnost cenilke, da je njeno matematično upanje enako parametru populacije, ki ga s cenilkoocenjujemo, imenujemo nepristranskost
Sami cenilki pa pravimo nepristranska cenilka
Tudi za varianco vzorca velja
2 2( )M S
Vrednost cenilke s katero ocenjujemo neki parameter populacije imenujemo točkasta ocenatega parametra
![Page 5: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/5.jpg)
5
Interval na katerem z določeno verjetnostjo leži neznani parameter, imenujemo interval zaupanjatega parametra, verjetnosti pa pravimokoeficient zaupanja.
Neznani parameter tako ocenimo z nekim intervalom, ki mu pravimo intervalska ocena parametra.
![Page 6: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/6.jpg)
6
Vzemimo normalno porazdeljeno populacijo N(,) z neznano aritmetično sredino in znanim standardnim odklonom
Izberimo iz nje slučajni vzorec velikosti n :
1 2, ,..., nx x x
Aritmetična sredina vzorca
1
1 n
ii
X xn
Ocenjevanje aritmetične sredine populacije
![Page 7: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/7.jpg)
7
je normalna slučajna spremenljivka z istim matematičnim upanjem kot populacija iz kateresmo izbrali vzorec in standardnim odklonom
n
torej
,X Nn
Za izbrani vzorec je vrednost aritmetične sredinevzorca točkasta ocena za matematično upanje populacije iz katere izhaja vzorec.
![Page 8: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/8.jpg)
8
Z vpeljavo standardizirane slučajne spremenljivke
, xx
XZn
in predpisane verjetnosti obstoja natankodoločeno realno število k, da velja:
P kx
kx
1
![Page 9: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/9.jpg)
9
Iz te enačbe dobimo intervalsko oceno za
x k x kn n
temu intervalu pravimo interval zaupanja aritmetične sredine
Verjetnost pri kateri smo določili realno število k, imenujemo koeficient tveganja ali tudi napaka I.vrste, medtem ko verjetnost 1- imenujemo koeficient zaupanja.
![Page 10: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/10.jpg)
10
Če predpišemo napako vzorca x d
potem je velikost vzorca določena z
2.knd
![Page 11: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/11.jpg)
11
Postavljanje odločitev o parametrih populacijeimenujemo testiranje hipotez
Testi so parametrični kadar se nanašajo na kvantitativne parametre populacije, če pa se nanašajo na nekvantitativne parametre, pa so testi neparametrični
Testiranje hipotez
![Page 12: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/12.jpg)
12
Ničelna hipoteza 0Hje predpostavka o vrednosti nekega parametra populacije.
Alternativna ali nasprotna hipoteza 1H
je predpostavka,da izbrani parameter nima vrednosti,kot jo predpostavlja ničelna hipoteza.
Odločitev o sprejetju ali zavrnitvi hipoteze je zasnovana na statistiki, ki jo imenujemo test hipoteze in jo izračunamo iz podatkov vzorca.
![Page 13: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/13.jpg)
13
Interval sprejemanja hipoteze določa vrednosti testa hipoteze pri katerem ničelno hipotezo sprejmemo
Zavrnitev ničelne hipoteze, če je ta pravilnaimenujemo napaka I.vrste
Verjetnost, da to napako naredimo označimo z
Sprejetje ničelne hipoteze, če je ta napačna imenujemo napaka II.vrste. Verjetnost, da to napako napravimo, označimo z .
![Page 14: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/14.jpg)
14
Postopek testiranja hipotez izvedemo v naslednjih korakih:
1.Postavimo 0H proti 1H in določimo 2.Izberemo primerno statistiko testa hipotezein določimo območje sprejemanja ničelne hipoteze velikosti 3.Izračunamo vrednost statistike testa hipoteze iz podatkov vzorca
4. Preverimo,če vrednost statistike testa hipoteze pade v območje sprejemanja ničelne hipoteze in skladno s tem ničelno hipotezo sprejmemo ali pa jo ne sprejmemo
![Page 15: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/15.jpg)
15
V populaciji N(,) je neznano aritmetična sredinain poznan standardni odklon.
H A0: 1 :H A kjer je A izbrano realno število
Test aritmetične sredine populacije
Postavimo ničelno hipotezo
![Page 16: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/16.jpg)
16
Statistika
x At n
je za n30 standardizirana normalna slučajna spremenljivka N(0,1).
![Page 17: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/17.jpg)
17
Pri napaki I.vrste z verjetnostjo je intervalsprejemanja ničelne hipoteze množica realnih številt (-k,k), kjer je števiko k določeno z zvezo:
P kx A
n k
1
Intervalu (-k,k) pravimo tudi intervalsprejemanja ničelne hipoteze.
![Page 18: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/18.jpg)
18
Regresija
O regresiji govorimo,kadar sta dva ali več pojavov(količin) v medsebojni odvisnosti. Regresija je enostavna kadar nastopata v medsebojni odvisnosti samo dva pojava(količini). Naloga regresije je, poiskati tako funkcijo , ki najbolje podaja medsebojno odvisnost količin.
![Page 19: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/19.jpg)
19
Odvisnost je enostranska , kadar je količina X vzrok, količina Y pa posledica.
Odvisnost je dvostranska , kadar ni možno določiti, kaj je vzrok in kaj posledica.
Količina Y je slučajna spremenljivka, njene vrednosti ne moremo natanko vnaprej predvideti, ko je vrednost neodvisne spremenljivke x znana, to je, da količina X zavzame vrednost x
![Page 20: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/20.jpg)
20
Določimo lahko matematično upanje slučajne spremenljivke Y, dejanske vrednosti pa “nihajo” okrog matematičnega upanja v skladu Z porazdelitvenim zakonom slučajnespremenljivke Y.
Lahko zapišemo le zvezo
M Y x f x ( )
![Page 21: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/21.jpg)
21
Če je odmik realizirane vrednosti slučajne spremenljivke(pojava) Y od matematičnega upanja M Y x
/ /Y x M Y x
lahko zapišemo model
/ / ( )Y x M Y x f x
Količina je slučajna spremenljivka in se imenujenapaka, modelu pa pravimo regresijski model
![Page 22: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/22.jpg)
22
Kadar iščemo odvisnost v obliki linearne funkcije
M Y x x
govorimo o linearni regresiji
Sam regresijski model pa zapišemo v obliki
Y x
![Page 23: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/23.jpg)
23
Parametra in ocenimo na naslednji način
Pri predpostavki,da je količina X neodvisnaY pa odvisna spremenljivka in sta količini podani vsaka z slučajnim vzorcem velikosti n :
1 2, ,... nX x x x
1 2, ,... nY y y y
izračunamo točkovni oceni a in b za parametra in .
![Page 24: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/24.jpg)
24
Po metodi najmanjših kvadratov jih dobimo kot minimum funkcije dveh spremenljivk a in b :
F y a bx imumi ii
n
= -=
1
2
min
Iz tega pogoja dobimo za oceni a in b formuli
ax y x x y
n x x
i i i i ii
n
i
n
i
n
i
n
i ii
n
i
n= ====
==
2
1111
2
1
2
1
bn x y x y
n x x
i i i ii
n
i
n
i
n
i ii
n
i
n= ===
==
111
2
1
2
1
![Page 25: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/25.jpg)
25
2 2 2
1 1
n n
x x i ii i
S x x x n x
2 2 2
1 1
n n
y y i ii i
S y y y n y
1 1
n n
x y i i i ii i
S x x y y x y n x y
.
Vpeljimo naslednje oznake
![Page 26: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/26.jpg)
26
S temi oznakami oceno b koeficienta lahko zapišemo
xy
xx
Sb
S
Ocenjeno regresijsko premico zapišemo
y a bx
in če vzamemo povprečne vrednosti v obeh vzorcih,dobimo
y a bx
![Page 27: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/27.jpg)
27
Odtod dobimo oceno za
.a y b x
Na ta način pridemo po enostavnejši poti do oceneza parameter
![Page 28: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/28.jpg)
28
Varianco 2 količine(v pojavu) Y imenujemo skupna ali začetna varianca
Njena točkovna ocena za izbrani vzorec
y y yn1 2, ,...je
n
22Y i
i=1
1 y yn-1
s ki jo lahko tudi zapišemo krajše
2
1yy
Y
SS
n
![Page 29: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/29.jpg)
29
Delimo jo v dva dela : na nepojasnjeno varianco 2es
katere ocena za izbrani vzorec je
sn
y a bxe i ii
n2
1
212
-
=
kar lahko tudi zapišemo
2 1 . .2e yy xys S b S
n
![Page 30: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/30.jpg)
30
in pojasnjeno varianco
s s sXY Y e2 2 2
![Page 31: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/31.jpg)
31
Korelacijska analiza proučuje, kako dobra jematematična povezava med količinama X in Y , ki ju povezuje regresijska premica
Determinacijski koeficient (koeficient določenosti) nam v primeru enostranske odvisnosti meri linearno povezavo med vzrokom X in posledico Y in ga ocenimo :
2 2 2
2 2= 1y e e
y y
s s sDs s
![Page 32: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/32.jpg)
32
Mejni primeri
a./ D=1 med količino X in količino Y obstoja popolna matematična povezava v obliki linearne funkcije (napaka v modelu je 0)
b/ D=0 med količinama X in Y ni nobene linearne odvisnosti c./ 0 < D <1 med X in Y obstoja verjetna linearna povezava.
![Page 33: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/33.jpg)
33
Koeficient korelacije
meri linearno odvisnost med dvostransko odvisnima količinama X in Y, njegova točkovna ocena je
r
y y x x
y y x x
i ii
n
i ii
n
i
n= =
==
1
2 2
11
ki jo lahko tudi zapišemo na naslednji način
.xy
yy xx
Sr
S S
![Page 34: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/34.jpg)
34
Vrednosti koeficienta korelacije leže med -1 in +1
Za vrednost -1 imamo strogo negativno linearnoodvisnost in za +1 strogo pozitivno linearno odvisnost
V primeru,ko je koeficient korelacije 0 ni nobene linearne odvisnosti.
Koeficient določenosti D in koeficient korelacije r sta povezana z naslednjo zvezo :
2n-1D=1- 1 rn-2
![Page 35: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/35.jpg)
35
Koeficient korelacije ranžirnih vrst
meri odvisnost dveh ranžirnih vrst. Za dve vrsti
v v v n1 2, , . . . in w w w n1 2, , . . . ,
je določen s formulo
2
2=1
61 -1
n
S i ii
r w vn n
![Page 36: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/36.jpg)
36
O časovni vrsti govorimo, kadar sta v medsebojni odvisnosti čas t in neka količina Y.
Pomembna uporaba pri prognoziranju
Prognoza je napoved, da bo količina Y imela vnekem prihodnjem času neko določeno vrednost
Pri prognozah ekstrapoliramo stanja časovne vrste v prihodnost.Označimo 1 2, ,..., ty y y stanja časovne vrste
1 2, ..., ty y y napovdi
![Page 37: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/37.jpg)
37
Metoda drsečih sredin
ty dejanska vrednost količinne Y v času t
ty napovedana vrednost v času t in m korakali periodo drsenja
Vrednost napovedi pojava Y v času t+1 izračunamo po obrazcu
-+1
t t mt t
y yy ym
![Page 38: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/38.jpg)
38
Napoved v času t = m+1(začetno napoved za periodo m) pa dobimo
1 21
... mm
y y yym
![Page 39: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/39.jpg)
39
Metoda eksponentnega glajenja
Pri tej metodi z ocenjenim faktorjem glajenja
0 1g
Napovedano vrednost s preteklimi vrednostmieksponentno večamo ali manjšamo po formuli :
+1t t t ty y g y y
Za začetno napoved vzamemo,da je
1 1y y
![Page 40: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/40.jpg)
40
Model časovne vrste
je neka funkcija , odvisna od časa, ki jo določimo z metodo najmanjših kvadratov in ji rečemotrend časovne vrste Problem določanja funkcije je zato enak kot pri regresiji.
![Page 41: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/41.jpg)
41
Kazalci dinamike časovne vrste
Variabilnost časovne vrste merimo s parametri, ki jim pravimo kazalci dinamike časovne vrste.
Tempo rasti pokaže relativno razliko med dvema zaporednima členoma
1
1
100%k kk
k
y yTy
![Page 42: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/42.jpg)
42
Koeficient dinamike kKkaže relativno spremembo dveh zaporednih členov
1
kk
k
yKy
Verižni indeks kIje v procentih izražen koeficient dinamike
1
100%kk
k
yIy
![Page 43: Slučajna spremenljivka, ki zavzame vrednosti izračunane iz vzorca, se imenuje statistika](https://reader035.fdocument.pub/reader035/viewer/2022062410/56815b0e550346895dc8b9c5/html5/thumbnails/43.jpg)
43
Bazni indeks 0kIdobimo, če v verižnem indeksu vzamemo za
nek karakteristični člen
1ky
0y
00
100%kk
yIy