Kon š truovanie predpoved í
description
Transcript of Kon š truovanie predpoved í
![Page 1: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/1.jpg)
KonKonšštruovanie predpovedtruovanie predpovedíí
Jeden z hlavných dôvodov analýzy časových radov – predpovedanie budúcich hodnôt časového radu. Predpovedná technika spočíva v rozšírení minulých skúseností do budúcnosti. Predpokladom je, že vonkajšie podmienky pôsobiace na vývoj časového radu ostanú nezmenené - princíp ceteris paribus. Predpoveď bude presná do tej miery, do akej je splnená táto podmienka (pokiaľ nie je predpoveď modifikovaná rozhodnutím prognostika).
Pretože predpovedné techniky pracujú s údajmi, ktoré vznikli v minulosti, predpovedný proces pozostáva z nasledujúcich krokov:
zber údajov a ich redukcia zostavenie modelu vyhodnotenie modelu prognóza.
Jednou z najdôležitejších častí predpovedného procesu je získavanie vhodných a overených údajov. Ak sú údaje nevhodné alebo nesprávne, prognóza bude nepresná.
![Page 2: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/2.jpg)
Typická stratégia vyhodnocovania rôznych predpovedných metód obsahuje nasledujúce kroky:
1: Na základe analýzy modelu minulých dát sa vyberie predpovedná metóda
2: Súbor dát sa rozdelí do dvoch častí: vstupná (inicializačná, testovacia) a skúšobná časť
3: Zvolená predpovedná metóda sa overí na údajoch vstupnej časti
4: Model sa použije na predpovedanie hodnôt skúšobnej časti; vypočítajú a vyhodnotia sa chyby predpovedí
5: Urobí sa rozhodnutie o modele (prijatie modelu v jeho súčasnej podobe, modifikácia modelu, použitie iného modelu a porovnanie výsledkov, zamietnutie modelu)
6: Použitie vybraného predpovedného modelu na prognózu budúcich hodnôt časového radu.
Skutočná prognóza by mala byť kvantitatívna aj kvalitatívna. Predpovedný model poskytne kvantitatívnu hodnotu; posúdenie inžiniera poskytne príslušné kvalitatívne ohodnotenie.
![Page 3: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/3.jpg)
KonKonšštruovanie bodovtruovanie bodovýých predpovedch predpovedíí
Predpokladajme, že máme časový rad {x1, x2, …, xn} ako realizáciu stochastického procesu {Xt, t = 1, 2, ...}. Ďalej predpokladajme, že sme našli vhodný lineárny model ARMA(p, q):
Xt - 1 Xt-1 - ... - p Xt-p = Zt + 1 Zt-1 + ... + q Zt-q
Symbolom budeme označovať predpoveď hodnoty xt+k kon-štruovanú v čase t, ktorú nazývame predpoveď v čase predpoveď v čase tt o o kk krokov krokov dopredudopredu (k-kroková predpoveď v čase t).
tx kt
Hodnotu budeme konštruovať ako lineárnu predpoveď, ktorá bu-de lineárnou funkciou hodnôt xt, xt-1, ... alebo ekvivalentne (predpokladáme stacionárny a invertibilný stochastický proces ARMA(p, q) ) lineárnou funkciou hodnôt zt, zt-1 ...
tx kt
Chceme zostrojiť predpoveď, ktorá má v triede všetkých lineárnych predpovedí najmenšiu strednú kvadratickú chybu (MSE – Mean Square Error) definovanú:
2ktkt
2 txxEket
![Page 4: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/4.jpg)
t. j. ako podmienenú strednú hodnotu Xt + k pri daných hodnotách Xt = xt,
Xt – 1 = xt – 1, ... .
Platí:
tk1t1k1kt1ktkt zzzztx
Ak budeme hľadať predpoveď v tvare:
1t1ktkkt zztx
hľadáme vlastne koeficienty , ktoré minimalizujú výraz: ,, 1kk
.1 2z
kj
2jj
21k
21
Tento výraz nadobúda minimálnu hodnotu pre :
... 1,k k, j ,jj
Odvodili sme:
1t1ktkkt zztx
resp.
,X,X|XEtx 1ttktkt
![Page 5: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/5.jpg)
Chyba predpovedi:
txxte ktktkt 1t1k1kt1ktktktkt zzztxxte
Platí:
0teE kt
2z
21k
21kt 1teD
Špeciálne:
tttt z1txx1te
Praktický výpočetPraktický výpočet:
Platí:
xt + k = 1 xt + k - 1 + ... + p xt + k - p + zt + k + 1 zt + k - 1 + ... + q zt + k - q
![Page 6: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/6.jpg)
kde:
0 j pre xx
0 j pre ,X,X|XEtxx
jtjt
1ttjtjtjt
(2a)
0. j pre 1-jtx-xzz
0 j pre 0,X,X|ZEz
jtjtjtjt
1ttjtjt
(2b)
qktq1kt1ktpktp1kt1kt zzzxxtx
Potom:
(1)
Zásady pre praktický výpočetZásady pre praktický výpočet :
1. Postupujeme rekurentne, t. j. najprv vypočítame predpovede
,1qx,qx 2q1q
2. V každom kroku dosadíme do vzorca (1) vzťahy (2a) a (2b).
3. Pred začiatkom rekurentného výpočtu položíme z1 = z2 = ... = zq = 0.
![Page 7: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/7.jpg)
V systéme Mathematica: BestLinearPredictorBestLinearPredictor[[dáta, model, kdáta, model, k]]
Výstupom je k jednokrokových predpovedí a im odpovedajúce MSE v tvare:
1knxMSE,,nxMSE,1knx,,nx kn1nkn1n
![Page 8: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/8.jpg)
KonKonšštruovanie truovanie intervalovýchintervalových predpoved predpovedíí
95%-ný predpovedný interval konštruovaný v čase t pre predpoveď 95%-ný predpovedný interval konštruovaný v čase t pre predpoveď
o k krokov dopredu (ak uvažujeme stacionárny a invertibilný ARMA o k krokov dopredu (ak uvažujeme stacionárny a invertibilný ARMA
model)model):
te2tx;te2tx ktktktkt
Keď dosadíme za smerodajnú odchýlku (et+k(t)):
1k
1j
2jzkt
1k
1j
2jzkt 12tx;12tx
Pri výpočte bodových aj intervalových predpovedí dosadzujeme do
príslušných vzorcov odhadnuté hodnoty parametrov. Tieto vzorce však
nie sú veľmi citlivé na chyby, ktoré vznikli pri výpočte odhadov
parametrov.
![Page 9: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/9.jpg)
Meranie chýb predpovedí
Metódy na meranie chýb, ktorých sa dopustíme použitím príslušného predpovedného modelu, sa v podstate skladajú z výpočtu predpove-dí pre skúšobnú časť údajov a porovnania týchto predpovedaných hodnôt so skutočnými hodnotami. Rozdiel medzi predpovedanou (odhadovanou) a pozorovanou hodnotou je podobný reziduálnemu členu v regresnej analýze. Na výpočet chyby pre každé predpovedné obdobie sa používa nasledujúca rovnica:
eT = xT - FT
kdeeT chyba predpovede v časovom období T
xT skutočná hodnota v časovom období T
FT predpovedaná hodnota v časovom období T.
Označme P počet časových úsekov, na ktoré robíme prognózu
![Page 10: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/10.jpg)
Druhá odmocnina z aritmetického priemeru druhých mocnín odchýliek (root mean squared error) RMSE:
P
FX
RMSE
P
TTT
1
2
MAE (mean absolute error):
P
Fx
MAE
P
TTT
1
Aritmetický priemer druhých mocnín odchýliek (mean squared error) MSE:
P
Fx
MSE
P
TTT
1
2
![Page 11: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/11.jpg)
1. testovacia časť vzorky (rozsah 1 až M, M < n)
Metódy na výpočet predpovedí v časových radoch
2. skúšobná časť vzorky (P je počet hodnôt jednokrokovej pred-povede, n + 1= M + P)
Uvažujme časový rad xt, t = 1, …, n + 1. Dáta sa rozdelia na dve časti:
Hodnota predpovedanej premennej , t = M, …, n, je genero-vaná pomocou parametrického modelu g( ), ktorý treba najskôr odhadnúť.
1tx
![Page 12: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/12.jpg)
West a McCracken navrhli tri schémy pre výpočet predpovede
1. rekurzívna metódarekurzívna metóda: predpovede sa generujú na základe
modelu, ktorého parametre sa upravujú a odhadujú postupne
pomocou všetkých hodnôt časového radu pribúdajúcich s jednotli-
vými krokmi predpovede
Prvá predpovedaná hodnota gM+1( ) sa vypočíta na základe
parametrov modelu odhadnutých pomocou členov radu x1 až
xM, druhá predpoveď gM+2( ) sa vypočíta na základe paramet-
rov odhadnutých pomocou členov x1 až xM+1, atď.
Všeobecne pre t = M, …, n, predpoveď gt+1( ) hodnoty xt+1 sa
vyčísli na základe parametrov modelu odhadnutých pomocou
členov x1 až xt .
M
M
1Mˆ
1Mˆ
t
t
![Page 13: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/13.jpg)
West a McCracken navrhli tri schémy pre výpočet predpovede
2. Metóda rolujúceho horizontu Metóda rolujúceho horizontu : predpovede sa generujú na
základe modelu, ktorého parametre sa odhadujú postupne vždy
pomocou posledných M hodnôt časového radu
Prvá predpovedaná hodnota gM+1( ) sa vypočíta na základe
parametrov modelu odhadnutých pomocou členov radu x1 až
xM, druhá predpoveď gM+2( ) sa vypočíta na základe paramet-
rov odhadnutých pomocou členov x2 až xM+1, atď.
Všeobecne pre t = M, …, n, predpoveď gt+1( ) hodnoty xt+1 sa
vyčísli na základe parametrov modelu odhadnutých pomocou
členov xt M +1 až xt .
M
M
1Mˆ
1Mˆ
t
t
![Page 14: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/14.jpg)
West a McCracken navrhli tri schémy pre výpočet predpovede
3. fixná metódafixná metóda: všetky predpovede sa generujú na základe
jedného modelu, ktorého parametre sa odhadnú pomocou prvých
M členov časového radu
Odtiaľ vyplýva, že pre každú predpoveď hodnoty xt+1 sú parametre
modelu rovnaké gt+1( ) = gt+1( ), pre t = M, …, n.
Predpoveď sa vyčísli na základe toho istého modelu s
parametrami = odhadnutými pomocou členov x1 až xM .M
Mt
t
![Page 15: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/15.jpg)
Diebold - Marianov testDiebold - Marianov test
Diebold a Mariano (1995) sa zaoberali rôznymi štatistikami, ktoré je možné použiť na porovnanie, či chyby MSE dvoch alternatívnych schém sú navzájom štatisticky významne odlišné.Tento test sa v súčasnosti všeobecne používa na vyhodnotenie bodových predpovedí dvoch porovnávaných modelov a je
hodnotený ako jedna z najlepších diagnostických mier.
Uvažujme dve h-krokové predpovede časového radu xt, označené
ako počítané pre t = M + h, …, M + P + h - 1
(t. j. celkovo P predpovedí), kde M je počet dát v testovacej časti
vzorky. Nulová hypotéza je, že obidva modely dávajú rovnako
presné predpovede.
a htx t,1 htx t,2
![Page 16: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/16.jpg)
Postup pri testovaní:
Určí sa „stratová“ (loos) funkcia g , kde je odpo-vedajúca chyba pre h-krokovú predpoveď, t. j. , i = 1, 2.
hte t,i hte t,i htxxhte t,itt,i
Vypočíta sa rozdiel dt , pre ktorý pri rov-nakej
presnosti predpovedí platí E[ dt ] = 0.
hteghteg t,2t,1
Za predpokladu kovariančnej stacionarity časového radu dt je
asymptotické rozdelenie výberového priemeru
dané vzťahom , kde
1hPM
hMttd
P
1d~
dV,0Ndn
1h
1ii0 2
P
1dV
![Page 17: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/17.jpg)
Testovacia štatistika DM pre H0: E[ dt ] = 0 má za predpokladu platnosti H0 asymptoticky normálne rozdelenie N(0, 1). Definovaná je vzťahom:
DM = kde je konzistentný odhad založený na výberových autokovarianciách
dV
d
dV dV
1hPR
ihRtitti dddd
P
1ˆ
Výsledky testu sa zapisujú do tabuľky, ktorá má v riadkoch aj
stĺpcoch uvažované modely.Prvok v i-tom riadku a j-tom stĺpci tejto tabuľky je rovný a) 11 b) -1-1 c) 00ak je kvalita predikcie modelu v riadku i v porovnaní s modelom v stĺpci j a) štatistickyštatisticky významne lepšíavýznamne lepšía b) štatistickyštatisticky významne horšíavýznamne horšía c) nie je medzi nimi štatisticky významný rozdiel.nie je medzi nimi štatisticky významný rozdiel.
![Page 18: Kon š truovanie predpoved í](https://reader036.fdocument.pub/reader036/viewer/2022081506/56814592550346895db280ee/html5/thumbnails/18.jpg)
test[d1_, d2_, d3_, P_, h_]:= Module[{E1, E2, d, dp, V, DM, nr, qh, qd}, g[x_]:=x^2; E1 = d1 - d2; E2 = d1 - d3; d = g[E1] - g[E2]; dp = Mean[d]; g[i_]:=1/P*Sum[(d[[t - (h - 1)]] - dp) (d[[t -(h - 1) - i]] - dp), {t, h + i, P + h -1}]; V = g[0] + 2*Sum[g[i], {i, h - 1}]; DM = dp/Sqrt[Abs[V/P]]; nr =NormalDistribution[0,1]; qh=Quantile[nr,0.975]; qd=Quantile[nr,0.025]; TS = Which[DM<qd,1,qd DM qh, 0, True, -1]]
k=h;Ma[1]=model1[k]; Ma[2]=model2[k]; ...; Ma[pocet]=modelx[k];
Apom={}; Do[If[I == j, Apom = Append[Apom, "x"],
Apom = Append[Apom,test[sv,Ma[i],Ma[j],Np,k]]],{i, pocet},{j, pocet}];
A = Partition[Apom, pocet];TableForm[A, TableHeadingsAutomatic]
Diebold - Mariano dvojstranny test (a = 0.05)Diebold - Mariano dvojstranny test (a = 0.05)
H0: H1:0ee 22
21 0ee 2
221
pocet – počet modelov, h – krok predpovede, sv – skúšobná vzorka,
Np - počet predpovedí