UNIVERSITETI I TIRANËS FAKULTETI I SHKENCAVE TË NATYRËS · Tabela 3.18 Fuqia (empirike), në...
Transcript of UNIVERSITETI I TIRANËS FAKULTETI I SHKENCAVE TË NATYRËS · Tabela 3.18 Fuqia (empirike), në...
UNIVERSITETI I TIRANËS
FAKULTETI I SHKENCAVE TË NATYRËS
PROGRAMI I STUDIMIT:
Metodat Probabilitare, Statistike
dhe Metodat e Analizës Numerike
TEZË DOKTORATURE
METODA BOOTSTRAP TEK MODELET
E SERIVE KOHORE, NË VEÇANTI TEK
MODELET ARFIMA
Doktoranti: Udhëheqësi:
Argjir BUTKA Prof. Llukan PUKA
Tiranë, 2015
i
UNIVERSITETI I TIRANËS
FAKULTETI I SHKENCAVE TË NATYRËS
DISERTACION
i paraqitur nga
Msc. Argjir BUTKA
Udhëhequr nga
Prof. Llukan PUKA
Për marrjen e gradës shkencore
DOKTOR
Me temë:
METODA BOOTSTRAP TEK MODELET
E SERIVE KOHORE, NË VEÇANTI TEK
MODELET ARFIMA
Mbrohet më datë _____ /_____/_____ , para jurisë:
1. Prof._______________________________________Kryetar
2. Prof._______________________________________Anëtar (Oponent)
3. Prof._______________________________________Anëtar (Oponent)
4. Prof._______________________________________Anëtar
5. Prof._______________________________________Anëtar
ii
PËRMBAJTJA
LISTA E FIGURAVE .................................................................................................. iii
LISTA E TABELAVE .................................................................................................. iv
FALENDERIME .......................................................................................................... vi
HYRJE .........................................................................................................................vii
1 PROCESET ME MEMORIE TË GJATË .............................................................. 1
1.1 Koncepti i memories së gjatë .......................................................................... 3
1.1.1 Shënime paraprake për memorien e gjatë ................................................ 3
1.1.2 Disa shembuj të serive kohore me memorie të gjatë ............................... 6
1.2 Përcaktimi i memories së gjatë ........................................................................ 9
1.3 Disa procese me memorie të gjatë ................................................................. 13
1.3.1 Proceset me vetëngjashmëri ................................................................... 13
1.3.2 Lëvizja brouniane ................................................................................... 16
1.3.3 Procesi zhurma thyesore gausiane ......................................................... 19
1.4 Diferencimi (integrimi) thyesor dhe modelet ARFIMA ............................... 20
1.4.1 Procesi i integruar pjesërisht (thyesor) .................................................. 23
1.4.2 Proceset ARFIMA ................................................................................. 27
1.5 Vlerësimi i memories së gjatë ....................................................................... 28
1.5.1 Zbulimi vizual i memories së gjatë ........................................................ 28
1.5.2 Vlerësues paramertikë ose gjysmë parametrikë. .................................... 36
2 METODA BOOTSTRAP TEK MODELET E SERIVE KOHORE .................... 44
2.1 Metodologjia bootstrap ................................................................................. 44
2.2 Metodat bootstrap me blloqe ......................................................................... 46
2.2.1 Bootstrap me blloqe të mbivendosur ..................................................... 47
2.2.2 Bootstrap me blloqe të ndarë ................................................................. 48
2.2.3 Bootstrap stacionar ................................................................................. 48
2.3 Bootstrap parametrik ..................................................................................... 50
2.4 Bootstrap sitë ................................................................................................. 52
2.5 Vlerësimi intervalor bootstrap ....................................................................... 54
2.6 Metoda bootstrap dhe kontrolli i hipotezave ................................................. 57
3 METODA BOOTSTRAP ME BLLOQE ME CIKLE ......................................... 59
3.1 Përcaktimi i blloqeve të përbërë nga cikle .................................................... 60
3.2 Gjatësia e ciklit .............................................................................................. 64
iii
3.2.1 Disa konsiderata teorike ......................................................................... 64
3.2.2 Cikli i serisë së vrojtuar ......................................................................... 66
3.3 Simulime Monte Carlo .................................................................................. 72
3.3.1 Vlerësimi pikësor ................................................................................... 72
3.3.2 Vlerësimi intervalor ............................................................................... 75
3.3.3 Kontrolli i hipotezës për praninë e memories së gjatë. .......................... 76
PËRFUNDIME ............................................................................................................ 89
SHTOJCA .................................................................................................................... 90
1. Shpërndarja e gjatësisë së ciklit ........................................................................... 90
2. Karakteristikat e shpërndarjes së gjatësisë së ciklit ............................................. 91
3. Një shënim për komandën “b.star” ...................................................................... 92
LITERATURA ............................................................................................................ 94
LISTA E FIGURAVE
Figura 1.1 Grafikët e dy modeleve që ilustrojnë dallimin vizual midis memories së
shkurtër dhe asaj të gjatë. ............................................................................................... 4
Figura 1.2 Prurjet minimale vjetore të lumit Nil, funksioni i autokorrelacioneve dhe
rendi i zvogëlimit të tyre. ............................................................................................... 6
Figura 1.3 Rrathët e pemëve të malit Campito, funksioni i autokorrelacioneve dhe
rendi i zvogëlimit të tyre. ............................................................................................... 7
Figura 1.4 Numri i bajts për milisekondë në rrjetin e ethernetit në Bellcore, funksioni i
autokorrelacioneve dhe rendi i zvogëlimit të tyre. ......................................................... 8
Figura 1.5 Autokorrelacionet teorike dhe kufijtë e sipërm të
intervalit të besimit me nivel 0.95 për vlera të ndryshme të vëllimit të zgjedhjes. ..... 11
Figura 1.6 Koeficienti i korrigjimit të devijimit standard të mesatares i një procesi me
autokorrelacione teorike (si raport me devijimin normal). .............. 12
Figura 1.7 Ilustrim i vetëngjashmërisë së bashkësisë së Mandelbrot. ......................... 13
Figura 1.9 Grafiku i metodës së variancës së grumbulluar për dy seritë kohore të
simuluara. ..................................................................................................................... 34
Figura 1.11 Peshat e dritares Parzen tek periodograma e lëmuar. ............................... 43
Figura 2.1 Formimi i blloqeve tek metodat MBB dhe NBB. ....................................... 48
Figura 3.1 Ilustrim i formimit të cikleve. ..................................................................... 61
Figura 3.2 Ilustrim i metodës bootstrap me blloqe me cikle........................................ 62
0.2( ) 0.1k k
0.2( ) 0.1k k
iv
Figura 3.3 Grafikët e një serie të simuluar dhe e replikimeve të saj duke përdorur
metoda të ndryshme boostrap me blloqe. .................................................................... 63
Figura 3.4 Densiteti dhe funksioni i shpërndarjes për gjatësinë e ciklit të një procesi
zhurmë e bardhë. .......................................................................................................... 65
Figura 3.5 Varësia e gjatësisë mesatare të ciklit nga parametri i memories, d për një
seri kohore e modelit ARFIMA(p,d,q). ....................................................................... 70
Figura 3.6 Mesatarja e gjatësive të ciklit të një zgjedhje rasti të modeleve zhurmë e
bardhë, AR(1) dhe ARFIMA(0,d,0). ........................................................................... 71
Figura 3.7 Efikasiteti relativ (në përqindje) i vlerësimeve GPH me metodat bootstrap
MBB, SB dhe BBC kundrejt vlerësimeve të zakonshme GPH, referuar rrënjës katrore
të gabimit mesatar katror. ............................................................................................ 74
LISTA E TABELAVE
Tabela 1.1 Rendi i konvergjencës për zhvendosjen, dispersionin dhe shpërndarjen
asimptotike të statistikave të zgjedhjes për një seri kohore normale me funksion të
autokovariancës kur n → ∞. ...................................................................... 26
Tabela 1.2 Rendi i konvergjencës së autokorrelacioneve empirike për një seri kohore
të modelit ARFIMA(p,d,q). ......................................................................................... 29
Tabela 3.1 Densiteti probabilitar i gjatësisë së ciklit të formuar nga një zhurme e
bardhë gausiane. ........................................................................................................... 64
Tabela 3.2 Rastet e mundshme për vlerat e numrit të cikleve të një zgjedhje me vëllim
n nga një zhurmë e bardhë gausiane. Raste gjithsej janë 2n-1
. ..................................... 69
Tabela 3.3 Gjatësia mesatare e ciklit të një serie kohore me vëllim n e gjeneruar nga
një proces ARFIMA(0,d,0). ......................................................................................... 69
Tabela 3.4 Zhvendosja (β) për vlerësimet e d-së në proceset ARFIMA(0,d,0). .......... 79
Tabela 3.5 Devijimi standard (SD) për vlerësimet e d-së në proceset ARFIMA(0,d,0).
...................................................................................................................................... 79
Tabela 3.6 Rrënja e gabimit katror mesatar (RMSE) për vlerësimet e d-së në proceset
ARFIMA(0,d,0). .......................................................................................................... 80
Tabela 3.7 Efikasiteti (në përqindje) i përdorimit të metodave bootstrap kundrejt
metodës përkatse të zakonshme. .................................................................................. 80
Tabela 3.8 Mbulimi i vrojtuar (në përqindje) i intervaleve të besimit të vlerësuesit
GPH, me nivel 1 0.95 , për parametrin d, tek modelet ARFIMA(0,d,0). ........... 81
Tabela 3.9 Gjatësia e vrojtuar (si mesatare) e intervaleve të besimit të vlerësuesit
GPH, me nivel 1 0.95 , për parametrin d, tek modelet ARFIMA(0,d,0). ........... 81
Tabela 3.10 Mbulimi i vrojtuar (në përqindje) i intervaleve të besimit të vlerësuesit
SP, me nivel 1 0.95 , për parametrin d, tek modelet ARFIMA(0,d,0). ............... 82
k k
v
Tabela 3.11 Gjatësia e vrojtuar (si mesatare) e intervaleve të besimit të vlerësuesit SP,
me nivel 1 0.95 , për parametrin d, tek modelet ARFIMA(0,d,0). ..................... 82
Tabela 3.12 Gabimi (empirik) i llojit të parë, në përqindje, i kriterit bootstrap SP për
verifikimin e hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti AR(1). ....................... 83
Tabela 3.13 Fuqia (empirike), në përqindje, e kriterit bootstrap SP për verifikimin e
hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti ARFIMA(1,d,0), 0.1d . .............. 84
Tabela 3.14 Fuqia (empirike), në përqindje, e kriterit bootstrap SP për verifikimin e
hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti ARFIMA(1,d,0), 0.2d . .............. 85
Tabela 3.15 Fuqia (empirike), në përqindje, e kriterit bootstrap SP për verifikimin e
hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti ARFIMA(1,d,0), 0.3d . .............. 86
Tabela 3.16 Fuqia (empirike), në përqindje, e kriterit bootstrap SP për verifikimin e
hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti ARFIMA(1,d,0), 0.4d . .............. 87
Tabela 3.17 Gabimi (empirik) i llojit të parë, në përqindje, i kriterit R/S i modifikuar
për verifikimin e hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti AR(1). ................. 88
Tabela 3.18 Fuqia (empirike), në përqindje, e kriterit R/S i modifikuar për verifikimin
e hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti ARFIMA(0,d,0). .......................... 88
vi
FALENDERIME
Mbërritja në fund të një rrugëtimi të gjatë të jep kënaqësinë e arritjes së objektivit.
Por sigurisht, ardhja deri këtu nuk do të ishte e mundur pa ndihmën dhe përkrahjen e
gjithë miqve dhe shokëve të mi. Ndaj dua të falenderoj të gjithë miqtë që më kanë
mbështetur, që nga fillimi e deri në mbarim.
Një falenderim shumë special dhe gjithë mirënjohja ime i shkon udhëheqësit tim
shkencor profesor Llukan Puka, për këshillat e çmueshme që më ka dhënë dhe për
konsulencën e tij profesionale.
Falenderime u shpreh edhe kolegëve të mi të Departamentit të Matematikës me të
cilët jam këshilluar gjatë periudhës së realizimit të doktoraturës.
Falenderoj përgjegjësin e Departamentit dhe mikun tim profesor Lorenc Ekonomi,
për ndihmën dhe inkurajimin që më ka dhënë që ta vazhdoja këtë objektiv të
rëndësishëm.
Falenderime nga zemra kam edhe për familjen time, për durimin dhe mirëkuptimin që
kanë treguar, sidomos në këto kohët e fundit, gjatë hartimit përfundimtar të tezës.
vii
HYRJE
Duke folur jo rigorozisht, konceptet “varësi afatgjatë” (long range dependence) dhe
“memorie e gjatë” (long memory) janë sinonime që përdoren për të cilësuar një seri
kohore, që karakterizohet nga një varësi statistikore e rëndësishme midis vrojtimeve
edhe për distanca të largëta midis tyre. Në vijim ne do të përdorim më shpesh termin
“memorie e gjatë”. Funksioni i autokorrelacionit të një procesi me memorie të gjatë
zvogëlohet shumë ngadalë kur distanca rritet pambarimisht. Rendi i këtij zvogëlimi
është hiperbolik, në ndryshim me rendin eksponencial të zvogëlimit të
autokorrelacioneve të proceseve të modelit ARIMA (AutoRegressive Integrated
Moving Average) të propozuara nga Box dhe Jenkins (1970). Literatura është e pasur
me punime rreth proceseve me memorie të gjatë; mund të përmendim Beran (1994),
Palma (2007) midis të tjerësh. Megjithatë përkufizimi i memories së gjatë nuk është
përcaktuar në mënyrë të vetme. Në literaturë ekzistojnë disa përcaktime jo të gjitha
ekuivalente midis tyre të memories së gjatë (për një përmbledhje të përcaktimeve të
memories së gjatë shih Guegan, 2005).
Modelet autoregresive me mesatare të lëvizshme pjesërisht të integruara, (të
integruara në mënyrë thyesore) ARFIMA(p,d,q) (AutoRegressive Fractionally
Integrated Moving Average) të prezantuara nga Granger dhe Joyeux (1980) si dhe nga
Hosking (1981), pavarësisht nga njëri tjetri, ofrojnë një mjet të dobishëm për të
modeluar strukturën e varur të rendit të dytë (funksionet e autokovariancës dhe të
autokorrelacionit) për një seri kohore të vrojtuar me memorie të gjatë. Parametrin d do
ta quajmë parametri thyesor i integrimit dhe shpesh njihet edhe si parametri i
memories së gjatë. Literatura është e pasur me punime mbi identifikimin e procesit që
gjeneron të dhënat, që shfaqin veti të memories së gjatë, si dhe vlerësimin e
parametrave përkatës. Këto vlerësime mund të jenë parametrikë ose gjysmë
parametrikë.
Fox dhe Taqqu (1986), Dahlhaus (1989) si dhe Beran (1994) kanë shkrojtur rreth
vlerësimit të përgjasisë maksimale të parametrit thyesor d. Hurst (1951), Geweke dhe
Porter-Hudak (1983), Higuchi (1988), Robinson (1995a, 1995b) si dhe Hurvich etj.
(1998) kanë zhvilluar metodat gjysmë parametrike për vlerësimin e parametrave.
Siç ndodh shpesh në statistikë, është e pamundur të përcaktohet metoda më e mirë; në
lidhje me situatën konkrete secila metodë shfaq përparësitë dhe të metat e veta.
Megjithëse vlerësimet parametrike janë asimptotikisht normale dhe për rrjedhojë janë
më efikasët, në rast se modeli i përzgjedhur është i gabuar vlerësimet e përftuara
mund të jenë shumë të zhvendosura. Nga ana e vet, vlerësimet gjysmë parametrike
ofrojnë mundësinë e vlerësimit të parametrit të memories së gjatë, d, nëpërmjet pjesës
së memories së shkurtër, me defektin e një shpejtësie më të ngadaltë të konvergjencës
se sa konvergjenca e vlerësimeve me teknikat parametrike.
Ndër vlerësimet gjysmë parametrike të parametrit d, do të veçonim vlerësuesin e
njohur si vlerësuesi GPH, i cili është propozuar nga Geweke dhe Porter-Hudak (1983)
dhe është gjerësisht i përdorur në literaturë. Agiakloglou etj. (1993) tregoi që
vlerësimi GPH është i zhvendosur në prezencë të parametrave të pjesës ARMA afër
zonës jostacionare.
Për të përmirësuar vlerësimet klasike që mbështeten në teorinë asimptotike shpesh
përdoren metodat e rizgjedhjes. Një nga metodat gjerësisht të përdorura është metoda
bootstrap, e propozuar nga Efron (1979). Shënojmë se emërtimi “bootstrap” (lexohet
ˈbuːtˌstræp), i përdorur fillimisht nga propozuesi i kësaj metode, tregon një teknikë e
viii
cila, duke u nisur nga burimet ekzistuese dhe pa përdorur ndihma të jashtme, krijon
diçka më komplekse dhe efikase.
Në vitet e fundit janë zhvilluar shumë metoda bootstrap për seritë kohore. Disa nga
metodat më të spikatura janë:
(a) Bootsrap me blloqe (Block Bootstrap) (Carlsttein, 1986 dhe Kunsch, 1989).
(b) Bootstrap lokal (Local Bootstrap) (Paparoditis dhe Politis, 1999).
(c) Bootstrap i periodogramës (Periodogram Bootstrap) (Kreiss dhe Paparoditis,
2003).
(d) Bootstrap "sitë" (Sieve Bootstrap) (Buhlmann, 1997).
(e) Bootstrap parametrik (Parametric Bootstrap) (Andrews etj., 2006).
Ndër to më të përdorshme janë metodat bootstrap me blloqe.
Metodat bootstrap për seritë kohore përdoren tashmë gjerësisht për të gjetur intervalet
e besimit, sidomos në rastet kur teoria asimptotike nuk jep rezultate të kënaqshme
(shih p.sh. Arteche dhe Orbe, 2009; DiCiccio dhe Efron, 1996; Hall, 1988, 1992).
Zbatimi i metodave bootstrap në rastin e të dhënave të tipit seri kohore kërkon
përdorimin e teknikave të ndryshme të cilat varen nga natyra e serisë si dhe nga
qëllimi i përfundimeve statistikore. Problemi është ende i hapur për rastin kur ne
duam të kopjojmë (përsëritim) strukturën e varësisë të një procesi me memorie të
gjatë siç është rasti i modeleve ARFIMA(p,d,q).
Në këtë tezë ne do të zhvillojmë një metodë të re bootstrap për seritë kohore,
bootstrapin me blloqe të formuar nga cikle. Cikli është përcaktuar si një çift vargjesh
me vrojtime të njëpasnjëshme që ndodhen nën dhe mbi vlerën mesatare (ose
anasjelltas).
Teza është ndarë në tre kapituj: dy kapitujt e parë rishikojnë disa literatura, kapitulli i
tretë është kontribut i tezës.
Kapitulli 1 rishikon literaturë rreth proceseve me memorie të gjatë, vetitë e tyre,
funksionet e autokovariancës dhe të autokorelacionit së zgjedhjes dhe vlerësuesit
parametrikë dhe gjysmë parametrikë të intensitetit të memories, më të përdorshëm. Në
kapitullin 2 prezantohen shkurtimisht konceptet bazë të metodave bootstrap si dhe
përshkruhen disa metoda bootstrap për seritë kohore. Në kapitullin 3 ne prezantojmë
metodën bootstrap me blloqe të përbërë nga cikle. Disa pohime dhe konkluzione janë
treguar për këtë metodë. Më tej në këtë kapitulli, metoda e prezantuar do të përdoret
për të përmirësuar performancën e vlerësuesve gjysmë parametrike për parametrin d
të një procesi ARFIMA(0,d,0) në kuptimin e gabimit standard më të vogël, gabimit
mesatar kuadratik më të vogël si dhe mbulim më të mirë për intervalet e besimit. Me
ndihmën e eksperimenteve Monte Carlo kjo metodë do të krahasohet me metodat
ekzistuese bootstrap. Një zbatim tjetër i metodës bootstrap të propozuar është
procedura e kontrollit të hipotezës për praninë e memories së gjatë. Për vlerësuesit
gjysmëparmetrik, përdorimi i bootstrapit përmirëson mbulimin e intervaleve të
besimit të parametrit d dhe rrit fuqinë e kriterit në kontrollin e hipotezave për
memorien e gjatë, në rastet kur procesi është i modelit ARFIMA(1,d,0). Për
vlerësuesin gjysmë parametrik GPH, intervali i besimit i mbështetur në shpërndarjen
bootstrap ka një mbulim afër nivelit teorik, edhe në se gjatësia e serisë kohore të
vrojtuar është relativisht e vogël.
1
Kapitulli 1
1. PROCESET ME MEMORIE TË GJATË
Në këtë kapitull ne prezantojmë proceset me memorie te gjatë. Klasa e proceseve me
memorie të gjatë përmban një numër të madh procesesh, megjithatë ato kanë disa veti
të përbashkëta. Memoria e gjatë është vënë re te disa procese për arsye të shkallës së
zvogëlimit të dispersionit së mesatares së zgjedhjes e cila është proporcionale me n
për 0,1 , ndërkohë që shkalla e zakonshme për një zgjedhje nga vrojtime me
shpërndarje të njëjtë dhe të pavarura (i.i.d., independent and identically distributed),
ose nga të dhëna të korreluara dobët, është 1n (n është gjatësia e serisë). Një veti
tjetër e përbashkët në seritë me memorie të gjatë është fakti që funksioni i
autokovariancës zvogëlohet drejt zeros shumë ngadalë, aq sa që vrojtimet shumë larg
në të shkuarën kanë akoma efekt në sjelljen prezente të serisë. Për më tepër, edhe në
se seria mund të duket stacionare (e qëndrueshme), do të shfaqen trende lokale dhe
perioda të gjata me vrojtime shumë të mëdha (ose shumë të vogla) pa cikle
këmbëngulëse.
Fillimisht, le të bëjmë shënimet e mëposhtme të cilat do t’i përdorim përgjatë këtij
kapitulli.
Një proces rasti (stochastic process) përkufizohet si një familje ndryshoresh rasti,
{ , }tX t T , e indeksuar nga një bashkësi numrash realë T R . Në se bashkësia e
indekseve është nënbashkësi e numrave të plotë, T Z , procesi quhet proces rasti me
kohë diskrete. Kur bashkësia T përmban një interval procesi quhet proces rasti me
kohë të vazhduar. Bashkësitë e indekseve më të përdorshëm janë {0, 1, ,...}Z ,
{0,1,2,...}N , ( , )R dhe [0, )R .
Një seri kohore është një bashkësi të dhënash { }tx të vrojtuara njëra pas tjetrës në
momente të specifikuara, t, të kohës. Seria kohore konsiderohet si një varg vrojtimesh
1 2{ , ,..., }nx x x i n vrojtime të para të një procesi rasti, { , }tX t T , dhe shpesh referohet
si një realizim i procesit në fjalë. Termi “seri kohore” përdoret gjithashtu edhe për
proceset e rastit me kohë diskrete.
Le të jetë { , }tX t T një proces rasti me dispersion të fundëm, ( )tD X , për çdo
t T . Atëherë, përcaktohen funksioni i mesatares ( ) ( )X tt E X , për t T dhe
funksioni i kovariancës ( , ) ( , )X r sr s Cov X X për ,r s T .
Një seri kohore { , }tX t Z quhet seri stacionare e dobët (weakly stationary), ose
stacionare e rendit të dytë, në qoftë se
(i) ( )tD X për çdo t Z
(ii) ( )X t për çdo t Z (funksioni i mesatares është konstant kundrejt kohës)
(iii) ( , ) ( , )X Xr s r t s t për çdo , ,r s t Z (funksioni i kovariancës është
konstant kundrejt kohës; kovarianca varet vetëm nga largësia midis të dhënave dhe jo
nga momenti i vrojtimit të tyre).
2
Gjithashtu në literaturë përdoret dhe përkufizimi i stacionaritetit rigoroz (strictly
stationary), i cili kërkon që vektorët e rastit 1 2
( , ,..., )kt t tX X X dhe
1 2( , ,..., )
kt h t h t hX X X të kenë shpërndarje të njëjta për çdo 1,2,...k , për çdo varg
momentesh 1 2, ,..., kt t t dhe për çdo h Z .
Përgjatë materialit ne do të përdorim vetëm stacionaritetin e dobët. Në vazhdim me
shprehjen “stacionare” nënkuptohet “stacionare e dobët”.
Për një seri stacionare përcaktohen funksioni i autokovariancës (ACVF,
autocovariance function), ( ) ( , ) [( )( )]X t h t t h X t Xh Cov X X E X X , si dhe
funksioni i autokorrelacionit (ACF, autocorrelation function) ( )
( )(0)
XX
X
hh
.
Së fundmi po përmendim dy operatorë që përdoren shpesh në modelimin e serive
kohore.
(i) Operatori i vonesës ose i zhvendosjes prapa (përdoret shënimi L, lag operator ose
B, backshift operator), që përcaktohet nga barazimi 1t tBX X , dhe
(ii) Operatori i diferencimit (differencing operator) që shënohet me ose , dhe
përcaktohet sipas barazimit 1 (1 )t t t tX X X B X (këtu 1 tregon operatorin
identik).
Shembulli më i thjeshtë i një procesi rasti është procesi i zhurmës së bardhë (white
noise). Një proces { , 0, 1, 2, ...} t t quhet zhurmë e bardhë me pritje
matematike dhe dispersion të fundëm 2 , në qoftë se
( ) tE dhe 2 , për
( , )0, për
t s
t sCov
t s
(1.1)
Kur pritja matematike është zero zhurma e bardhë quhet e qendërzuar dhe, në se
ndryshoret e rastit t janë me shpërndarje normale, atëherë zhurma e bardhë quhet
normale.
Në disa literatura zhurma e bardhë përcaktohet si një varg ndryshoresh rasti të
pavarura dhe me shpërndarje të njëjtë me pritje matematike zero dhe dispersion të
fundëm 2 . Ky rast referohet si zhurmë e bardhë e pavarur, ose e fortë, dhe përdoret
shënimi 2~ . . .(0, )t i i d .
Një proces stokastik { , 0, 1, 2, ...}tZ t quhet proces i endjes së rastit (random
walk) në se procesi 1t t tZ Z , i përftuar nga diferencimi i tij, është një zhurmë e
bardhë e pavarur. Prej këtej rrjedh se 1t t tZ Z për çdo indeks (hap, lag). Në rastin
e kohës pozitive mund të gjejmë 1
t
t j
j
Z
për 0t . Shpesh supozohet që 0 0Z .
Kur zhurma e bardhë t është normale (ose siç quhet ndryshe, gausiane), atëherë
endja e rastit tZ quhet endje e rastit normale (ose gausiane).
3
Endja e rastit modelohet gjithashtu nga barazimi 1t t tZ Z , ku t janë ndryshore
rasti i.i.d., prej nga mund të shkruajmë (1 ) t tB Z . Pra ecja e rastit mund të shihet
si një proces ARMA(0,1,0).
Analogu i endjes së rastit normale në kohën e vazhduar është procesi i lëvizjes
brouniane (Brownian motion). Duke përgjithësuar lëvizjen brouniane mund të
përftohet lëvizja brouniane thyesore (fBm, fractional Brownian motion). Duke ndjekur
analogjinë e mësipërme, analogu i një procesi lëvizje brouniane thyesore, për rastin e
kohës diskrete, do të ishte procesi i përftuar nga diferencimi “thyesor” i procesit endje
e rastit gausiane. Më tej, nëpërmjet shtesave të një lëvizje brouniane thyesore mund të
përftohet zhurma gausiane thyesore (fGn, fractional Gaussian noise). Këto procese ne
do t’i shohim më hollësisht në paragrafin 1.3.
Në vijim me { }tX do të shënojmë një proces rasti me kohë diskrete, me hapësirë
gjendjesh një nënbashkësi të numrave realë dhe me dispersion të fundëm. Për një seri
të tillë, dispersioni i mesatares së zgjedhjes varet gjithashtu tek autokorrelacioni. Në
se seria është me pritje matematike dhe dispersion të fundëm dhe konstant në lidhje
me kohën, është i vërtetë barazimi (shih për shembull Beran, 1994):
2 2 2
2 2, 1 1 , 1 , 1
1( ) ( , ) [ ( , ) ( , )] [1 ( , )]
n n n n
i j i i j i ji j i j
D X i j i i i j i jn n n n
(1.2)
Barazimi i mësipërm ndryshon nga formula standarde e dispersionit të mesatares së
një zgjedhje rasti të thjeshtë nga termi korrigjues
, 1
1( ) ( , )
n
n
i ji j
i jn
(1.3)
me shënimet ( )iE X , 2 var( )tX , ( , ) [( )( )]i ji j E X X dhe
2
( , )( , )
i ji j
. Termi i korrigjimit i përcaktuar nga barazimi (1.3) është zero në se
ndryshoret tX janë të pakorreluara. Gjithashtu, në se { }tX është me varësi të dobët
(memorie të shkurtër), siç është rasti i proceseve ARMA, ky term është afërsisht
konstant për vlera të mëdha të vëllimit n të zgjedhjes. Megjithatë, në se procesi në
fjalë përmban memorie të gjatë, termi ( )n rritet së bashku me rritjen e n-së duke
ndikuar në rendin e zvogëlimit të dispersionit të mesatares.
1.1 Koncepti i memories së gjatë
Fillimisht po shohim disa shënime dhe shembuj që çojnë në kuptimin e memories së
gjatë.
1.1.1 Shënime paraprake për memorien e gjatë
Shkurtimisht po japim një ide rreth pasojave të prezencës së memories së gjatë tek një
seri kohore. Për të krijuar një ide paraprake rreth memories së gjatë, në figurën 1.1
janë paraqitur dy seri kohore të simuluara përkatësisht, nga një proces me memorie të
shkurtër dhe nga një proces me memorie të gjatë. Për të pasur një krahasim më të
qartë proceset janë parametrizuar në mënyrë të tillë që autokorrelacionet e rendit të
parë të jenë të njëjta për të dy proceset. Gjithashtu, gjatë simulimit është përdorur e
4
njëjta seri e zhurmës së bardhë. Ne kemi simuluar 1000 vrojtime dhe më pas kemi
larguar 200 të parat.
Modelet e simuluara janë përkatësisht modeli AR(1) me memorie të shkurtër,
1
0.3
1 0.3t t tX X
dhe modeli ARFIMA(0,d,0) me memorie të gjatë
0.3(1 ) t tB X ,
ku t është një proces zhurmë e bardhë gausiane, e njëjtë për të dyja modelet.
Figura 0.1 Grafikët e dy modeleve që ilustrojnë dallimin vizual midis memories së
shkurtër dhe asaj të gjatë.
Një dallim që mund të vërehet në një shikim të parë është se ciklet e procesit me
memorie të gjatë (figura 1.1b) janë më të çrregullt se ciklet në rastin e memories së
shkurtër (figura 1.1a). Në përgjithësi proceset me memorie të gjatë kanë tendencë të
krijojnë cikle të çrregullt.
5
Një tjetër “veti” e proceseve me memorie të gjatë është se ata duken sikur janë me
nivel të ndryshueshëm. Kjo nënkupton që vrojtimet kanë tendencë të qëndrojnë në një
nivel të lartë të vlerave për një periudhë kohore relativisht të gjatë dhe pastaj në një
nivel të ulët të vlerave përsëri për një periudhë kohore relativisht të gjatë, dhe
anasjelltas. Sigurisht kjo veti është e kombinuar me vetinë e cikleve të çrregullt. Siç
do shohim më poshtë (në paragrafin 1.4.1) këto veti janë të vërteta për modelet
ARFIMA(0,d,0) me vlera pozitive të d-së).
Një nga përkufizimet e memories së gjatë është përcaktuar nëpërmjet barazimit
limn
in
i n
(shih përkufizimin 1.1, më poshtë).
Kjo nënkupton që koncepti i memories së gjatë përcaktohet vetëm për seritë
stacionare, përderisa funksioni i autokokorrelacioneve, ( , ) i t t icorr X X , përcaktohet
vetëm për seritë stacionare.
Përkufizimet e memories së gjatë nuk përcaktojnë ndonjë kufizim për ndonjë
autokorrelacion të veçantë, kufizimi ka lidhje vetëm me sjelljen asimptotike të
autokorrelacioneve, pra me autokorrelacionet në “distancë infinit”. Një implikim i
menjëhershëm i kësaj është vështirësia që, bazuar në një zgjedhje të dhënash seri
kohore (që është gjithmonë e fundme), të përcaktojmë (testojmë) në se sjellja
asimptotike e autokorrelacioneve të procesit që ka gjeneruar të dhënat, është me
memorie të gjatë apo të shkurtër. Ky këndvështrim na bën të ndërgjegjshëm për
vështirësitë që dalin në procesin e verifikimit të hipotezave për praninë e memories së
gjatë në një seri kohore të vrojtuar.
Një implikim tjetër i përkufizimit të memories së gjatë është se, në se ne njohim ose
kemi vlerësuar relativisht saktë procesin stokastik që ka krijuar (gjeneruar) të dhënat,
edhe vrojtimet që janë larg në të shkuarën mund të jenë të dobishme për parashikimin
e vlerave të ardhshme të serisë. Pra, ne presim një parashikueshmëri më të “mirë” për
proceset me memorie të gjatë.
Një tjetër ndikim i prezencës së memories së gjatë lidhet me supozimet standarde që
përdoren në statistikë. Një nga rezultatet kryesore të statistikës klasike është se
dispersioni i mesatares (aritmetike) të një zgjedhje rasti të thjeshtë (të pavarur) është i
barabartë me dispersionin e një vrojtimi të vetëm (me dispersionin e ndryshores së
rastit në shqyrtim) pjesëtuar me vëllimin e zgjedhjes. Një përafrim i ngjashëm është i
vërtetë edhe për mesataren e një serie kohore për korrelacionet e së cilës limiti
1lim ( , )n
i j
i jn
ekziston dhe është i fundëm. Pikërisht, në këtë rast ka vend përafrimi
1( )nD X c
n për n , ku n është vëllimi i zgjedhjes dhe c një konstante që nuk
varet nga n. Ky përafrim është i vlefshëm për shumicën e modeleve të njohura të
serive kohore si proceset e Markovit dhe modelet ARMA. Ndërkohë, Beran (1994) ka
treguar se kur tX është një seri stacionare dhe ka vetinë e memories së gjatë, atëherë
për n është i vërtetë përafrimi
1 2
1ˆ( )n dD X C
n ,
6
ku 0C dhe 1
02
d . Pra rendi i zvogëlimit të dispersionit së mesatares së
zgjedhjes për seritë me memorie të gjatë është më i vogël se ai i pranuar në supozimet
e statistikës klasike. Nga ana tjetër, rendi i zvogëlimit të dispersionit të mesatares
është i lidhur ngushtë me kontrollin e hipotezave apo intervalet e besimit për pritjen
matematike. Në këtë këndvështrim mund të themi se memoria e gjatë nuk “përputhet”
me supozimet e statistikës klasike. Injorimi i ekzistencës së memories së gjatë mund
të ketë efekte të tejskajshme (“shkatërrimtare”) në përfundimet apo vendimet
statistikore.
1.1.2 Disa shembuj të serive kohore me memorie të gjatë
Shembull 1.1 Niveli minimal vjetor i prurjeve të lumit Nil.
Të dhënat janë matur përgjatë viteve 622-1281 në ishullin Roda afër Kairos dhe janë
të disponueshme në programin R nëpërmjet paketës “FGN”.
Figura 0.2 Prurjet minimale vjetore të lumit Nil, funksioni i autokorrelacioneve dhe
rendi i zvogëlimit të tyre.
Në figurën 1.2 paraqitet grafiku i prurjeve mesatare të lumit Nil (sipër majtas), grafiku
i 100 autokorrelacioneve empirike të para (sipër djathtas), grafiku i të gjitha
7
autokorrelacioneve (poshtë majtas) si dhe grafiku i logaritmit të vlerës absolute të
autokorrelacioneve kundrejt logaritmit të distancës (poshtë djathtas). Nga figura 1.2
mund të kuptohet se autokorrelacionet e vrojtuara zvogëlohen shumë ngadalë.
Historikisht studimi i të dhënave të prurjeve të lumit Nil ka çuar në zbulimin e të
ashtuquajturit fenomeni i Hurst-it (Hurst, 1951). Hurst studioi gjetjen e një modeli për
të modeluar prurjet e lumit Nil, me qëllim ndërtimin e një sistemi rezervuarësh me
përmasë të përshtatshëm. Ai vuri re se prurjet e lumit Nil kishin tendencë për të
ruajtur nivelin e prurjes për një kohë relativisht të gjatë në vlera të përafërta. Më vonë,
Mandelbrot dhe Wallis (1968, 1969a,b,c) dhe Mandelbrot dhe van Ness (1968)
prezantuan zhurmën thyesore (të pjesshme) të Gausit, si një model statistikor me
memorie të gjatë.
Shembull 1.2 Rrathët e pemëve të malit Campito.
Një tjetër shembull është seria kohore e vrojtimeve të madhësisë së rrathëve të
pemëve në malin Campito në Kaliforni (në .01 mm).
Figura 0.3 Rrathët e pemëve të malit Campito, funksioni i autokorrelacioneve dhe
rendi i zvogëlimit të tyre.
8
Kjo seri kohore përmban 5405 vrojtime njëvjeçare prej vitit 3436 para Krishtit deri në
vitin 1969 pas Krishtit dhe është studiuar nga Hurst (1951), duke e motivuar atë në
formulimin e konceptit të memories së gjatë. Këto të dhëna janë të disponueshme në
programin R nëpërmjet paketës “FGN” ose në linkun
http://datamarket.com/data/list/?q=provider:tsdl
Në figurën 1.3 paraqiten grafikët e njëjtë si tek figura 1.2 për serinë e rrathëve të
pemëve. Edhe në këtë shembull, prania e një varësie të fortë midis vrojtimeve është
evidente.
Shembull 1.3 Trafiku i Ethernetit
Në figurën 1.4 tregohen grafikët analogë si tek figurat 1.2 dhe 1.3 për të dhënat e
serisë kohore me numrin e bajts (bytes) për milisekondë të grumbulluara në disa LAN
(Local Area Network) etherneti në qendrën e kërkimit Bellcore në Morristown, New
York. Këto të dhëna janë të disponueshme në paketën “longmemo” të programit R.
Figura 0.4 Numri i bajts për milisekondë në rrjetin e ethernetit në Bellcore, funksioni
i autokorrelacioneve dhe rendi i zvogëlimit të tyre.
9
Leland etj. (1994) tregoi se të dhënat janë statistikisht me vetëngjashmëri. Siç do të
shohim më poshtë proceset me vetëngjashmëri kanë lidhje të ngushtë me proceset me
memorie të gjatë (paragrafi 1.3.1).
Këta shembuj ilustrojnë faktin se korrelacionet mund të shfaqen edhe në largësi të
gjata midis të dhënave, dhe për më tepër ato mund të jenë statistikisht të rëndësishme.
Disa nga vetitë e përbashkëta të vrojtimeve të mara nga seri kohore me memorie të
gjatë, të cilat mund të dallohen dhe në shembujt e mësipërm, mund të përmblidhen si
më poshtë.
Veti te serive me memorie të gjatë:
1) Veti cilësore të një zgjedhje tipike nga procese me memorie të gjatë.
a) Ekzistojnë periudha kohore relativisht të gjata përgjatë të cilave vrojtimet
tentojnë të qëndrojnë në një nivel të lartë, dhe nga ana tjetër periudha të gjata
ku vrojtimet tentojnë të qëndrojnë në një nivel të ulët. Mandelbrot e quajti një
sjellje të tillë si efekti i Jozefit, duke iu referuar Biblës, ku Jozefi parashikoi 7
vjet begati të ndjekura nga 7 vjet urie në Egjiptin e lashtë (Bibla, Fillesat 41:29
- 41:30).
b) Në se fokusohemi vetëm në periudha të shkurtra kohore, atëherë vrojtohen
cikle ose trende lokale. Megjithatë, në se fokusohemi në gjithë serinë, atëherë
nuk vrojtohen ndonjë trend apo cikël i dukshëm. Më tepër të krijohet ideja se
ciklet e shfaqura janë të mbivendosura dhe në një renditje të rastit.
c) Në vështrim të përgjithshëm seria duket stacionare.
2) Veti sasiore
a) Autokorrelacionet e zgjedhjes zvogëlohen drejt zeros me një shpejtësi më të
vogël se zvogëlimi eksponencial. Ky zvogëlim mund të përafrohet me një
funksion hiperbolik, pra ˆ( )k k për 0 1 (pra i ndryshëm nga rendi
eksponencial i zvogëlimit të modeleve ARIMA)
1.2 Përcaktimi i memories së gjatë
Megjithëse proceset me memorie të gjatë kanë tërhequr vëmendjen e shumë
studiuesve përcaktimi i memories së gjatë nuk është dhënë në një mënyrë të unifikuar.
Në literaturë ekzistojnë disa përkufizime për memorien e gjatë jo detyrimisht
ekuivalente midis tyre (për një përmbledhje të kuptimeve të memories së gjatë shih
Guegan, 2005). Përcaktimi i proceseve me memorie të gjatë realizohet në disa mënyra
të lidhura ngushtë me njëra tjetrën. Më poshtë po japim disa prej tyre që përdoren më
shpesh në literaturë.
Le të jetë { , 1,2,...}tX t një proces i rastit stacionar me dispersion të fundëm.
Stacionariteti nënkupton që pritja matematike dhe funksioni i autokovariancës nuk
varen nga çasti t, pra ( )tE X dhe ( , ) ( )t t kCov X X k për çdo çast t. Gjithashtu
përcaktohet dhe funksioni i autokorrelacionit ( ) ( ) / (0)k k .
Çdo proces rasti stacionar mund të karakterizohet nëpërmjet funksionit të densitetit
spektral të tij, i cili përcaktohet nga barazimi 1
( ) ( )cos( )2 k
f k k
.
10
Përkufizim 1.1 (McLeod dhe Hipel, 1978).
Procesi { }tX quhet proces stacionar me memorie të gjatë (ose me varësi të fortë; ose
me varësi për periudhë të gjatë), në qoftë se shuma e vlerave absolute të
autokovariancave (pra dhe të autokorrelacioneve) është e pafundme, pra kur kemi
( ) lim ( )n
nk k n
k k
(1.4)
Përkufizim 1.2 (Brockwell dhe Davis, 1991).
Procesi { }tX quhet proces stacionar me memorie të gjatë, në qoftë se ekziston një
numër real 0.5d dhe një konstante 0C , të tilla që
2 1( ) dk Ck , kur k (1.5)
Konstantet C dhe d nuk varen nga argumenti k i funksionit të autokorrelacionit ( )k ,
por vetëm nga procesi në shqyrtim.
Një përkufizim i ngjashëm jepet edhe tek Beran (1994). Përdoren edhe shprehjet
proces me varësi në distancë të gjatë, ose me varësi afatgjatë; ose proces me varësi të
fortë, ose proces me korrelacione që zvogëlohen ngadalë apo me korrelacione në
distancë të gjatë. Më poshtë ne po japim një përkufizim tjetër nga Beran (1994).
Përkufizim 1.3 (Beran, 1994).
Procesi { }tX quhet proces stacionar me memorie të gjatë, në qoftë se ekziston një
numër real 0,1 dhe një konstante 0fc , të tilla që:
0
( )lim 1
f
f
c
, pra ( ) ff c kur 0 (1.6)
Përkufizimet 1.2 dhe 1.3 janë ekuivalente.
Rendi i konvergjencës së funksionit të autokorelacionit, i përcaktuar tek përkufizimi
1.2, sjell që, për një proces me memorie të gjatë kemi
( )k
k
(1.7)
Disa autorë e përdorin këtë veti si përkufizim për memorien e gjatë.
Është e rëndësishme të theksohet se përkufizimet e mësipërme të varësisë afatgjatë
janë përkufizime asimptotike. Ato përcaktojnë sjelljen e korrelacioneve të procesit kur
distanca midis vrojtimeve shkon në infinit (pambarim). Në këtë kuptim, përkufizimet
e memories së gjatë nuk specifikojnë ndonjë veçori të autkorrelacioneve për ndonjë
distancë të fundme. Për më tepër, përkufizimet e mësipërme përcaktojnë vetëm
shkallën e konvergjencës të autokorrelacioneve dhe jo masën absolute të saj. Çdo
autokorrelacion individual mund të jetë arbitrarisht (sado) i vogël. E rëndësishme
është në se rendi i zvogëlimit të korrelacioneve është i vogël. Kjo e bën verifikimin e
zvogëlimit të ngadaltë të korrelacioneve më të vështirë. Në se përdorim intervalin e
11
zakonshëm 1.96
n për testimin e korrelacioneve të ndryshëm nga zero, ku n është
vëllimi i një zgjedhje seri kohore, atëherë një korrelacion empirik (i zgjedhjes) ˆ( )k
do të konsiderohet i rëndësishëm në se plotësohet mosbarazimi ˆ( ) 1.96k n
(Priestly, 1981). Megjithatë, mund të ndodhë lehtë që në rastin e një zvogëlimi të
ngadaltë të korrelacioneve, të gjithë korrelacionet empirike të jenë brenda intervalit
1.96
n . Le të shohim shembullin e mëposhtëm.
Shembull 1.4
Supozojmë se autokorrelacionet teorikë të një procesi stacionar jepen nëpërmjet
barazimit 2 2
( )H
k C k
, ku 0.1C dhe 0.9H (pra plotësohet përkufizimi 1.2
me 0.1C dhe 0.5 0.4d H ).
Figura 0.5 Autokorrelacionet teorike dhe kufijtë e sipërm të
intervalit të besimit me nivel 0.95 për vlera të ndryshme të vëllimit të zgjedhjes.
0.2( ) 0.1k k
12
Në figurën 1.5 paraqitet grafiku i autokorrelacioneve si dhe kufijtë e sipërm të
intervalit të besimit me nivel 0.95, që janë të trajtës 1.96 / n , për n=100, 200, 400,
dhe 1000. Mund të shihet qartë se, edhe pse korrelacionet e zgjedhjes janë
zëvendësuar me korrelacionet e vërteta, ato janë të gjitha të parëndësishme, të paktën
për 400n . Ndërkohë, ndikimi i autokorrelacineve në dispersionn e mesatares është i
konsiderueshëm edhe për n të vogla. Ky ndikim tregohet në figurën 1.6. Figura 1.6
paraqet grafikun e raportit të devijimit standard teorik të mesatares me devijimin
standard normal, pikërisht vlerën e 1 ( )n , ku ( )n është përcaktuar në
barazimin (1.3) (shih gjithashtu barazimin (1.2)). Mund të dallohet qartë se ky
koeficient rritet me rritjen e n-së duke qenë i konsiderueshëm edhe për n relativisht të
vogla.
Figura 0.6 Koeficienti i korrigjimit të devijimit standard të mesatares i një procesi me
autokorrelacione teorike (si raport me devijimin normal). 0.2
( ) 0.1k k
13
1.3 Disa procese me memorie të gjatë
Është e mundur të veçojmë dy procese themelore të Gausit, me memorie të gjatë. Ato
kanë të njëjtën origjinë, por një është i përcaktuar për kohë të vazhdueshme dhe quhet
zhurmë e Gausit thyesore, ndërsa i dyti është versioni diskret (i ndërprerë) i tij dhe
quhet zhurmë e integruar thyesore (pjesërisht). Ne do ti diskutojmë ato në paragrafin
1.3.3 dhe 1.4.1. Në paragrafin 1.4.1 ne gjithashtu do të shqyrtojmë materialin rreth
funksionit asimptotik dhe funksionit të zgjedhjes të autokovariancës dhe
autokorlacionit. Paragrafi 1.5. i kushtohet problemit të identifikimit dhe vlerësimit të
memories së gjatë.
Zhurma thyesore e Gausit është pjesë e familjes së gjerë të proceseve me
vetëngjashmëri (self-similar processes). Për arsye të plotësisë së materialit, ne do
japim një prezantim për konceptin e vetëngjashmërisë në paragrafin 1.3.1. Kjo do
ndihmojë në realizimin e një kuptimi më të mirë të memories së gjatë në përgjithësi,
dhe të metodave të vlerësimit për parametrin e memories në veçanti. Më poshtë
shënimin tX do ta përdorim për të treguar një proces diskret, ku indeksi t merr vlera
të plota 0, 1, 2,...t , ndërsa shënimi ( ), X t t T është më i përgjithshëm; T
mund të jetë një interval i bashkësisë së numrave realë R (domethënë ( )X t është një
proces rasti me kohë të vazhduar).
1.3.1 Proceset me vetëngjashmëri
Shpesh në natyrë ndeshen objekte ose procese që shfaqin vetëngjashmëri. Për
shembull valët, lëvizja e atomeve, gjethet, etj. Vetëngjashmëria është e lidhur me
idenë e pjesës dhe tërësisë; proceset apo objektet me vetëngjashmëri shfaqin të njëjtën
strukturë apo mënyrë të sjelluri në të gjitha nivelet e saj. Kështu çdo degë e një
gjetheje përsërit në një shkallë më të vogël vetë gjethen. Figura 1.7 tregon një
shembull klasik të vetëngjashmërisë, shembull i krijuar nga një bashkësi e
Mandelbrot. Bashkësia e Manderbrot përftohet nga një ekuacion rekursiv i shkallës së
dytë, duke filluar nga një element 0z C në planin kompleks, sipas formulës 2
1n nz z C (për një përkufizim të bashkësisë së Mandelbrot shih psh Devaney,
1999).
Figura 0.7 Ilustrim i vetëngjashmërisë së bashkësisë së Mandelbrot.
http://en.wikipedia.org/wiki/Fractal#mediaviewer/File:Mandelbrot-similar-x1.jpg
14
Çdo pjesë e bashkësisë e treguar në figurën 1.7, shfaq model te njëjtë në çdo zmadhim
të saj, dhe kjo duket se është e mundshme të ruhet sa herë zmadhohet bashkësia, pra
në pafundësi.
Proceset me vetëngjashmëri janë prezantuar teorikisht nga Kolmogorov (1941) dhe
më tej janë prezantuar në statistikë fillimisht nga Mandelbrot dhe bashkëpuntorët e tij
(shih p.sh. Mandelbrot dhe van Ness (1968), Mandelbrot dhe Wallis 1969 a,b,c, si dhe
Mandelbrot 1983). Në kontekstin e proceseve të rastit (stokastike), vetëngjashmëria
përkufizohet nëpërmjet shpërndarjes së procesit.
Përkufizim 1.4 (Samorodnitsky dhe Taqqu, 1994)
Procesi me vlera reale ( ), X t t T quhet proces me vetëngjashmëri (self-similar
process) me tregues 0H në qoftë se për çdo 0a shpërndarjet me dimension të
fundëm të ( )X at janë të njëjta (identike) me shpërndarjet me dimension të fundëm të
( )Ha X t , domethënë, në qoftë se për çdo 1 21, , ,..., kk t t t T dhe për çdo 0a të
kemi
1 2 1 2( ( ), ( ),..., ( )) ( ( ), ( ),..., ( ))d
H H H
k kX at X at X at a X t a X t a X t (1.8)
Këtu, H shtë parametri (treguesi) i vetëngjashmërisë dhe luan një rol kyç në studimin
e këtyre proceseve.
Në teorinë e probabilitetit, të gjitha shpërndarjet probabilitare që mund të merren si
shpërndarje limite të shumave të ndryshoreve të rastit me shpërndarje të njëjtë dhe të
pavarura (të normalizuara në mënyrë të përshtatshme) quhen shpërndarje të
qëndrueshme (stabël; stable), shiko p.sh. Davidson (1997). Për shembull shpërndarja
normale është e tillë; ajo merret si limit i ndryshoreve i.i.d. me dispersion të fundëm.
Një rezultat i ngjashëm vlen edhe për proceset e rastit. Lamperti (1962) ka treguar se
teoremat limite për shumat e proceseve të rastit japin në përgjithësi procese limite që
janë me vetëngjashmëri (ai përdori termin gjysmë të qëndrueshme (semi-stable)).
Për të treguar lidhjen midis proceseve me vetëngjashmëri dhe proceseve me memorie
të gjatë le të shqyrtojmë shembullin e mëposhtëm.
Shembull 1.5. Shqyrtojmë një proces Yt me vetëngjashmëri me parametër
vetëngjashmërie 0H , me shtesa stacionare dhe të tillë që 0 0Y me probabilitet 1.
Për të thjeshtuar shënimet, supozojmë gjithashtu se 1( ) 0E Y . Me që Yt është me
vetëngjashmëri, atëherë nga barazimi 1
dH
tY t Y , që merret nga barazimi (1.8) për 1k ,
1 1t dhe c t , rrjedh se 1( ) ( ) 0H
tE Y t E Y dhe 2 2 2
1( ) ( )H
tE Y t E Y . Shënojmë
1t t tX Y Y procesin e shtesave, i cili është stacionar. Dispersioni i procesit të
shtesave do të jetë
2 2 2 2
1 1 1 0 1var( ) var( ) [( ) ] [( ) ] [ ] X t t t t tX Y Y E Y Y E Y Y E Y .
Atëherë, për s t , kemi
2 2 2 2 2
0[( ) ] [( ) ] [ ] ( ) H
t s t s t s XE Y Y E Y Y E Y t s (1.9)
Nga ana tjetër është i vërtetë barazimi
2 2 2 2 2 2 2[( ) ] [( ] [ ] 2 [ ] 2cov( , )H H
t s t s t s X X t sE Y Y E Y E Y E YY t s Y Y (1.10)
15
Atëherë, nga barazimet (1.9) dhe (1.10) marrim barazimin e mëposhtëm për
funksionin e autocovariancës të procesit tY me vetëngjashmëri
2 2 2 21( , ) [ ( ) ]
2
H H H
Y Xt s t t s s (1.11)
Më tej njehsojmë autokovariancat e procesit të rritjeve, tX . Për 0k ka vend
barazimi 2 2 2 2
1 1
1( ) cov( , ) cov( , ) [( 1) 2 ( 1) ]
2
H H H
X i i k k Xk X X X X k k k
(shih Beran, 1994, barazimi (2.11)).
Gjithashtu, për 0k kemi ( ) ( )X Xk k . Prej këtej rrjedh se autokorrelacionet e
procesit të rritjeve tX jepen nëpërmjet barazimeve
2 2 21( ) co ( , ) [( 1) 2 ( 1) ]
2
H H H
X i i kk rr X X k k k
2 2 2 21 1 1 1 1[(1 ) 2 (1 ) ] ( )2 2
H H H Hk k gkk k
për 0k dhe, ( ) ( ) X Xk k për 0k . Këtu me g kemi shënuar funksionin
2 2( ) (1 ) 2 (1 )H Hg x x x .
Pas zbërthimit të Tejlorit për funksionin g tek barazimi i fundit, rrotull pikës 0x
(ose 1
0k , pra kur k ; gjithashtu supozohet që 0 1H dhe
1
2H ) marrim
barazimin
221 '(0)( 0) ''(0)( 0)
( ) (0) ...2 2 6
H
X
g x g xk k g
(1.12)
Por, (0) 1 2 1 0g , 2 1 2 1
0'(0) 2 (1 ) 2 (1 ) 0H H
xg H x H x
dhe
2 2 2 2
0''(0) 2 (2 1)(1 ) 2 (2 1)(1 ) 4 (2 1)H H
xg H H x H H x H H
Zëvendësojmë tek barazimi (1.12) dhe marrim
2
2 2 2
14 (2 1)
1 1( ) 0 0 ... (2 1) ...
2 6 3
H H
X
H Hk
k k H H k
(1.13)
Pra mund të themi që
2 2( ) (2 1) , kur H
X k H H k k (1.14)
(termat mbetës të zbërthimit (1.13) shkojnë më shpejt në zero se termi i parë).
Prej ekuivalencës (1.14) rrjedh se kur 0.5 1 H , autokorrelacionet ( )X k
zvogëlohen drejt zeros aq ngadalë sa që seria ( )X
k
k
divergjon. Pra, procesi i
16
shtesave { , 1,2,...}tX t , është proces me memorie të gjatë sipas përkufizimit 1.2, me (2 1) C H H dhe 0.5 d H (shih barazimin (1.5)).
Për 0.5H kemi ( ) 0X k për të gjitha 0k , pra vrojtimet tX janë të
pakorreluara, ndërsa për 0 0.5 H autokorrelacionet janë të shumueshëm dhe për
më tepër ka vend barazimi
( ) 0X
k
k
(1.15)
Në rastin e fundit thuhet se procesi është antikëmbëngulës (antipersistent). Megjthatë,
ky rast është shumë rrallë i ndeshur në praktikë, kryesisht për arsye se kushti (1.15)
është shumë i paqëndrueshëm.
Përfundimisht mund të themi se, proceset me vetëngjashmëri me parametër 1
12
H
dhe me shtesa stacionare (të qëndrueshme) janë procese me shtesa me memorie të
gjatë.
Ky shembull tregon se ekziston një lidhje e ngushtë midis parametrit të
vetëngjashmërisë, H, dhe “sasisë” së memories së procesit. Siç e përmendëm më lart,
teoremat limite, në përgjithësi, japin procese me vetëngjashmëri, dhe shembulli i
mësipërm tregon se mund të themi se proceset me memorie të gjatë përbëjnë një
nënbashkësi të proceseve limite të shumave të ndryshoreve të rastit, prej nga rrjedh
dhe rëndësia teorike e studimit të tyre.
Procesi më i rëndësishëm i proceseve me vetëngjashmëri është procesi i lëvizjes
brouniane, të cilin e shqyrtojmë në nënparagrafin e mëposhtëm 1.3.2.
1.3.2 Lëvizja brouniane
Historikisht, emërtimi i lëvizjes brouniane lidhet me botanistin skoces Robert Brown
(1773-1858). Në vitin 1827, Brown vrojtoi në mikroskop lëvizjen e grimcave të
polenit në ujë dhe vuri re se ato kryenin një lëvizje kaotike të vazhdueshme. Në se ne
do të projektonim këtë lëvizje sipas një drejtimi, atëherë do merrnim lëvizjen
brouniane njëpërmasore, të përcaktuar si më poshtë.
Përkufizim 1.5 (Puka, 2010).
Procesi i rastit ( ), 0B t t quhet lëvizje brouniane (një përmasore) me dispersion
2 në qoftë se plotësohen kushtet e mëposhtme.
a) (0) 0B
b) Procesi ( )B t është me shtesa të pavarura. Me fjalë të tjera, për çdo varg
momentesh kohe 0 10, ,..., nt t t , për çdo n N , të tilla që 0 1 20 ... nt t t t ,
ndryshoret e rastit 1 0 2 1 1( ) ( ), ( ) ( ),..., ( ) ( )n nB t B t B t B t B t B t janë të pavarura.
c) Procesi ( )B t është me shtesa stacionare. Me fjalë të tjera, për çdo 0 s t ,
shtesa ( ) ( )B t B s varet vetëm nga t s .
d) ( )B t ka shpërndarje normale 2(0, )N t për çdo 0t .
e) Trajektoret ( )t B t janë të vazhdueshme për çdo 0t .
17
Kur 2 1 themi se ( )B t është lëvizje brouniane standarde.
Menjëherë nga përkufizimi 1.5 rrjedhin barazimet e mëposhtme.
[ ( ) ( )] 0E B t B s (1.16)
2[ ( ) ( )]D B t B s t s (1.17)
Këto barazime përdoren shpesh edhe tek përkufizimi i lëvizjes brouniane (duke
zëvendësuar kushtet c) dhe d), por duke supozuar shpërndarjen normale). Është i
vërtetë pohimi i mëposhtëm.
Pohim 1.1
Lëvizja brouniane është një proces me vetëngjashmëri me parametër 0.5H .
Vërtet, nga kushti d) i përkufizimit 1.5 kemi 1
2[ ( )] 0 [ ( )]E B at a E B t për çdo 0a
dhe 0t . Shqyrtojmë tani kovariancën [ ( ), ( )]Cov B t B s , për t > s.
Me që ( ) ( )B t B s është e pavarur me ( ) (0) ( )B s B B s (kushti b) dhe a)), kemi
0 [ ( ) ( ), ( )] [ ( ), ( )] [ ( )] [ ( ), ( )] [ ( ) (0)]Cov B t B s B s Cov B t B s D B s Cov B t B s D B s B
Atëherë, nga barazimi (1.17), gjejmë se 2 2[ ( ), ( )] min( , )Cov B t B s s t s . Prandaj,
duke përdorur dhe simetrinë e indekseve t dhe s, ne mund të shkruajmë 1 1
2 2 2 2[ ( ), ( ] min( , ) min( , ) [ ( ), ( )] [ ( ), ( )]Cov B ct B cs ct cs c t s cCov B t B s Cov c B t c B s
Përfundimisht, duke pasur parasysh se ( )B t ka shpërndarje normale, e cila
përcaktohet plotësisht nga pritja matematike dhe kovariancat e saj, ne konkludojmë se
( )B ct dhe 1
2 ( )c B t kanë të njëjtën shpërndarje, pra ( )B t është një proces me
vetëngjashmëri me parametër të vetëngjashmërisë 1
2H .
Për lëvizjen brouniane, nga barazimi (1.17), mund të shkruajmë
2[ ( ) ( )]D B t T B t T për 0T .
Pra,devijimi standard i shtesave të një lëvzje brouniane standarde (2 1 ) është
12[ ( ) ( )]SD B t T B t T T (1.18)
ndërsa për lëvzjen brouniane të çfarëdoshme kemi
12[ ( ) ( )]SD B t T B t T (1.19)
Ky fakt referohet në literaturë si “ligji 1
2T ”.
Për më shumë pohime dhe procese që përftohen prej lëvizjes brouniane shih Puka
(2010).
Gjithashtu mund të tregohet se procesi i shtesave i një lëvizje brouniane është një
proces stacionar i cili ka densitet konstant, pra është analogu i zhurmës së bardhë
Gausiane, në hapësirën kohore të vazhdueshme. Pra, lëvizja brouniane mund të
interpretohet si analogu i një procesi endje rasti Gausiane, në hapësirën kohore të
vazhdueshme.
18
Duke përgjithësuar lëvizjen brouniane mund të marrim lëvizjen brouniane thyesore
me parametër 0 1H si më poshtë.
Përkufizim 1.6 (Mandelbrot dhe Van Ness, 1968).
Le të jetë 0 1H , 0b një numër real çfarëdo dhe ( )B t një lëvizje brouniane
standarte. Atëherë, procesin ( )HB t të përcaktuar sipas barazimeve:
0(0)HB b ,
0 1 1 1
2 2 2
12 0
1( ) (0) [( ) ( ) ] ( ) ( ) ( )
( )
tH H H
H HB t B t s s dB s t s dB sH
për 0t
dhe në mënyrë të ngjashme për 0t ,
e quajmë lëvizje brouniane thyesore me parametër H.
Lëvizjet brouniane thyesore ndahen në tre klasa të dallueshme esencialisht njëra nga
tjetra, që u korrespondojnë respektivisht vlerave 1
02
H , 1
12
H dhe 1
2H .
Në qoftë se 0 0b dhe 1
2H , atëherë merret lëvizja brouniane e zakonshme,
1
2
( ) ( )B t B t . Pohimet e mëposhtëm motivojnë propozimin e lëvizjes brouniane
thyesore (Mandelbrot dhe Van Ness, 1968, Teorema 3.3).
Pohim 1.2
Shtesat e një procesi lëvizje brouniane thyesore janë stacionare dhe me
vetëngjashmëri me parametër të vetëngjashmërisë H.
Në fakt, tregohet se lëvizja brouniane thyesore është i vetmi proces gausian me shtesa
stacionare që është me vetëngjashmëri (Cox, 1984).
Pohim 1.3
Proceset e lëvizjes brouniane thyesore ndjekin një “ligj HT ” në kuptimin e devijimit
standard të shtesave të tij.
Ky pohim justifikohet nga vërtetësia e barazimit
2 2[{ ( ) ( )} ] H
H H HE B t T B t T C (1.20)
ku konstantja HC varet vetëm nga parametri H.
Pohim 1.4
Funksioni i kovariancave të një procesi lëvzje brouniane thyesore është proporcional
me 2 2Hk
.
Pohim 1.5
Funksioni i densitetit spektral i një procesi lëvzje brouniane thyesore është
proporcional me 2 1H
.
Mund të përmendim, gjithashtu, se lëvzja brouniane thyesore nuk e plotëson kushtin e
përzieries së fortë (strong mixing) për seritë kohore.
19
Proceset e lëvizjes brouniane thyesore u propozuan nga Mandelbrot dhe Van Ness me
qëllim për të krijuar një familje procesesh rasti me sa më pak parametra, të tilla që në
një farë mënyre të jenë të përshtatshme për modelimin e asaj që mund të ndodhë në
procese (fenomene), që karakterizohen nga mungesa e pavarësisë asimptotike.
Integrali i përdorur në përkufizimin 1.6 jepet në kuptimin e integrimit pikësor dhe
mund të interpretohet si një integrim thyesor i lëvizjes brouniane. Hosking (1981) e
interpreton lëvizjen brouniane thyesore si derivat thyesor të rendit 1
( )2
H të lëvizjes
brouniane të zakonshme. Një këndvështrim më intuitiv të këtij derivimi thyesor jepet
nga Beran (1994).
Vlen të përmendim se teorema qëndrore limite nuk është e vlefshme për mesataren e
zgjedhjes nga procesi i shtesave të një lëvizje brouniane thyesore me parametër të
vetëngjashmërisë 1
2H . Kjo bëhet e qartë në se vemë re se mesatarja e shtesave
(1) (0)H HB B , (2) (1)H HB B ,..., ( ) ( 1)H HB n B n është e formës
1[ ( ) (0)]H Hx B n B
n dhe, nga barazimi (1.20), kemi 2 2( ) HD x n .
1.3.3 Procesi zhurma thyesore gausiane
Mund të tregohet se procesi i shtesave i një lëvizje brouniane është një proces
stacionar i cili ka densitet konstant, pra është analogu i zhurmës së bardhë gausiane,
në hapësirën kohore të vazhdueshme. Pra, lëvizja brouniane mund të interpretohet si
analogu i një procesi endje rasti gausiane, në hapësirën kohore të vazhdueshme. Duke
ruajtur këtë analogji, derivati ' ( )HB t , pra procesi i shtesave i një lëvizje brouniane
thyesore, mund të interpretohet si një zhurmë e bardhë thyesore me hapësirë të
vazhdueshme.
Ky interpretim na lejon mundësinë e përftimit të procesit që quhet zhurmë thyesore (e
pjesshme) gausiane në hapësirën diskrete. Mandelbrot dhe Wallis (1969a) e
përcaktuan zhurmën e bardhë thyesore gausiane me hapësirë diskrete si një proces
stacionar, funksioni i autokorrelacioneve të të cilit është i njëjtë me atë të procesit të
shtesave me një njësi të një lëvizje brouniane thyesore.
Përkufizim 1.8 (Mandelbrot dhe Wallis (1969a)
Le të jetë ( )HB t një lëvizje brouniane thyesore me parametër të vetëngjashmërisë H .
Atëherë, procesi tZ që jepet nga barazimi
( 1) ( ), 0, 1, 2,...t H HZ B t B t t (1.22)
quhet zhurmë e bardhë thyesore gausiane (e Gausit) me parametër thyesor H (ose
thjesht zhurmë thyesore e Gausit; në literaturë përdoret shkurtimi fGn, fractional
Gaussian noise).
Nga përkufizimi rrjedh se zhurma thyesore gausiane është një proces stacionar.
Gjithashtu, tregohet se kovariancat e një zhurme thyesore gausiane jepen sipas
barazimit të mëposhtëm (Samorodnitsky, 2006)
20
222 2( , ) [( 1) 1 2 ]
2
HH HHk t k t
CCov Z Z k k k
(1.23)
për 1t dhe 0k . Këtu, HC është një konstante pozitive e përcaktuar vetëm nga
parametri H. Prej këtej, rrjedh se zhurma thyesore gausiane është një proces stacionar.
Në varësi të vlerave e parametrit H mund të dallojmë tre raste:
(i) Për 0.5H procesi Zt është i pakorreluar, pra imiton zhurmën e bardhë.
(ii) Për 0.5H procesi Zt është me autokorrelacione negative (vlerat luhaten më
shpesh (shpejt) se tek zhurma e bardhë).
(iii) Për 0.5H procesi Zt është me autokorrelacione pozitive (vlerat luhaten më
rrallë (ngadalë) se tek zhurma e bardhë).
Gjithashtu, nga barazimi (1.23) rrjedh se për 0,5H kemi
2(1 )(2 1) H
k H H k , kur k
Pra, funksioni i autokorrelacionit të një zhurme thyesore gausiane konvergjon drejt
zeros kur distanca rritet pambarimisht. Rendi i këtij zvogëlimi është hiperbolik, sipas
ligjit 2 2Hk . Kur 0.5 1H rendi i zvogëlimit është i tillë që procesi Zt është me
memorie të gjatë. Gjithashtu, densiteti spektral i një zhurme thyesore gausiane jepet
nga barazimi (shih Samorodnitsky, 2006, shembull 5.1).
2(1 2 )
( ) (1 cos ) 22
H
H
k
f C k
, për1
2H (1.24)
Prej këtej rrjedh se
1 2( )
Hf
, kur 0 (1.24a)
Në qoftë se , kemi 0
lim ( )f
; në këtë rast thuhet se densiteti spektral
ka (shfaq) pol në origjinë.
Siç përmendëm në fillim të paragrafit, analogu i lëvizjes brouniane për rastin e kohës
diskrete është endja e rastit me diferenca normale. Kjo lejon mundësinë e përftimit të
zhurmës thyesore gausiane si një varg shtesash “thyesore” të endjes së rastit (sikundër
lëvizja brouniane thyesore merret nga lëvizja brouniane nëpërmjet integrimit thyesor).
Një këndvështrim i tillë e çoi Hosking (1981) në prezantimin e modeleve ARFIMA si
përgjithësim i modeleve ARMA. Paragrafi vijues i kushtohet përcaktimit dhe vetive të
modeleve ARFIMA.
1.4 Diferencimi (integrimi) thyesor dhe modelet ARFIMA
Qëllimi i modeleve ARFIMA, sipas Hosking (1981) është që të prezantohet një
familje modelesh që të kenë vetitë për:
(a) të modeluar në mënyrë shtjelluese (eksplicite) varësinë afatgjatë midis vrojtimeve.
(b) të qenë mjaftushëm të manovrueshëm (fleksibël) për të shpjeguar njëkohësisht
strukturën afatshkurtër dhe afatgjatë të korrelacioneve të serisë.
(c) të gjeneruar sa më thjesht seri kohore me veti të memories së gjatë.
0.5 1H
21
Deri ne vitet ‘80, para punimeve të Granger dhe Joyeux (1980) dhe të Hosking
(1981), seritë kohore lineare grupoheshin në dy grupe:
- seri kohore stacionare me memorie te shkurtër, dhe
- seri kohore jo stacionare (ose të integruara të rendit 1).
Tipi i parë i proceseve është procesi ARMA(p,q) dhe është një mjet i dobishëm për të
modeluar sjelljen e memories së shkurtër. Ai është zgjidhja stacionare e ekuacionit së
diferencës të rastit
( )( ) ( )t t tB X X (1.25)
ku është pritja matematike e procesit, B është operatori i kthimit prapa,
1( )t tB X X , t është një zhurmë e bardhë 2. . .(0, )i i d , si dhe
2
1 2( ) 1 ... p
pz z z z dhe 2
1 2( ) 1 ... q
qz z z z janë polinomet e
pjesës AR dhe MA respektivisht.
Për të siguruar stacionaritetin supozohet se polinomet dhe nuk kanë rrënjë në
rrethin njësi. Që procesi të jetë i identifikueshëm, duhet që polinomet dhe të
mos kenë rrënjë të përbashkëta dhe, që procesi të jetë shkakësor (causal) dhe i
kthyeshëm duhet që të dy polinomet ti kenë të gjitha rrënjët jashtë rrethit njësi,
domethënë ( ) 0z dhe ( ) 0z për të gjitha 1z (për më tepër detaje për
proceset ARMA shih për shembull Brockwell dhe Davis, 1991).
Pa e humbur përgjithësimin ne mund të supozojmë që ( ) 0tE X . Densiteti
spektral i një procesi ARMA(p,q) jepet nga barazimi:
2 ( )( ) ,
2 (
i
i
ef
e
(1.26)
Box dhe Jenkins (1976) kanë prezantuar modelin ARIMA(p,d,q) për seritë kohore
lineare jo stacionare si një përgjithësim të proceseve ARMA, në kuptimin që tY është
një proces ARIMA(p,d,q), për ndonjë numër të plotë pozitiv d, në qoftë se, pas një
numri të fundëm diferencash (pikërisht d herë) të tY , d
t tY X , ne marrim një proces
ARMA(p,q), sipas ekuacionit ( ) ( )T TB X B . Operatori d nënkupton kryerjen e
njëpasnjëshme d herë të operatorit të diferencës dhe jepet sipas barazimit
0 1
!(1 ) ( )
!( )!
d dd d j j
t t d t t t j
j j
dX B X C B X X X
j d j
(1.27)
Proceset ARIMA(p,d,q) quhen gjithashtu, edhe procese të integruara të rendit d dhe
shënohen I(d). Në këtë kuptim, proceset ARMA(p,q) janë rast i veçantë i proceseve
ARIMA(p,d,q), kur d=0, pra ato janë procese I(0). Një rast tjetër shumë i zakonshëm
merret për d=1, pra kur seria tX është jo stacionare, por seria e diferencave
1t t tY X X është një proces ARMA(p,q). Një shembull i këtij rasti është dhe
procesi i endjes së rastit.
Edhe pse klasa e proceseve ARIMA është mjaft e gjerë, pasi ajo mund të përshkruajë
statistikisht mjaftueshëm procesin që gjeneron të dhënat në shumë situata, në praktikë
ndeshen seri kohore të cilat nuk janë as I(0) as I(1), sjellja e të cilave duket se është
22
midis këtyre dy modeleve. Për këtë arsye Granger dhe Joyeux (1980) si dhe Hosking
(1981), pavarësisht nga njëri tjetri, morën në konsideratë mundësinë që d të marrë
çfarëdo vlerë reale.
Në këtë paragraf përshkruhen bazat teorike të modelit ARFIMA, i cili është një model
parametrik, që mund të përmbajë memorie të gjatë dhe përdoret gjerësisht në
literaturë për të modeluar seri kohore me veti të memories së gjatë.
Fillimisht për qëllimet e këtij paragrafi po japim dy shënimet e mëposhtme.
Shënim 1.1. Funksioni gama, , përcaktohet sipas barazimit (Brockwell dhe Davis
(1991))
1
0
, 0
( ) , x=0
1( 1), x 0
x tt e dt x
x
xx
(1.28)
Disa veti të këtij funksioni janë: (Abramowitz dhe Stegun 1964, faqe 255-258) )
(1) 1 .
1
2
.
( ) ( 1)!n n për çdo n natyror.
( 1) ( )x x x .
(1 ) ( )sin( )
x xx
, prej nga rrjedh se
( 1) ( ) (1 )( )
( 1 )
n x xx n
n x
për çdo n natyror.
( )lim 1
( )n
n
n n
për n dhe R (forma limite e përafrimit të Stirlingut), prej
nga rrjedh se
( ) kur
( )
nn n
n
.
Shënim 1.2. Funksioni i autokovariancave inverse i një serie kohore stacionare
përcaktohet nëpërmjet funksionit të densitetit spektral, në mënyrë të ngjashme si
funksioni i autokovariancës, por duke zëvendësuar funksionin e densitetit spektral
( )f me të përmbysurin e tij, 1
( )f (kur ky i fundit është i integrueshëm). Më
formalisht shih Cleveland, 1972.
1
2
,
0
1
( )
k
inv k e df
23
Më tej, funksioni i autokorrelacioneve inverse është
,
,
,0
inv k
inv k
inv
Autokovariancat inverse interpretohen në mënyrë të ngjashme me autokovariancat e
pjesshme, megjithëse ato disa herë japin një ide më të qartë për diagnostikimin e
modelit. Kur procesi që duam të identifikojmë është i tipit MA(q), autokovariancat
inverse kanë avantazh në lidhje me autokovariancat e pjesshme (shih dhe Chatfield,
1980).
1.4.1 Procesi i integruar pjesërisht (thyesor)
Endja e rastit mund të modelohet nga barazimi 1t t t tX X X ku t janë
ndryshore rasti i.i.d.. Duke përdorur operatorin e vonesës (ose të kthimit një hap
prapa) formalisht mund të shkruajmë (1 ) t tB X . Pra ecja e rastit mund të shihet si
një proces ARMA(0,1,0).
Granger dhe Joyeux (1980) dhe Hosking (1981) e përgjithësuan shprehjen e
mësipërme duke marrë diferencat thyesore (e pjesshme) të procesit. Pikërisht,
Hosking (1981) përdori zbërthimin binomial për të shkruar barazimin e pafundmë të
mëposhtëm
2 3
0
1 11 1 (1 ) (1 )(2 ) ...
2! 3!
d kd k
d
k
B C B dB d d B d d d B (1.29)
(shenja merret gjithmonë negative për arsye të ndërrimit një numër tek ose çift herësh
të vendeve të kufizave d − k me k – d).
Atëherë, një proces , 0, 1, 2...tX t quhet pjesërisht i integruar (ose i integruar
në mënyrë thyesore; fractionally integrated) me parametër d në qoftë se ai mund të
shkruhet nëpërmjet barazimit:
(1 )d
t tB X , (1.30)
ku 2~ . . .(0, )t i i d është një proces zhurmë e bardhë e pavarur me pritje matematike
( ) 0tE dhe dispersion 2( )tD . Hosking e përkufizoi një proces të tillë si
proces ARMA(0,d,0) me d thyesor por në literaturën e sotme shpesh referohet si
proces i pjesërisht i integruar (ose i integruar thyesor) dhe përdoret shënimi FI(d)
(Fractionally Integrated).
Atëherë, duke përdorur barazimet (1.29) dhe (1.30) kemi:
1 2 3
1 1(1 ) (1 )(2 ) ....
2 6t t t t tX dX d d X d d d X , ose
1 2 3
1 1(1 ) (1 )(2 ) ....
2 6t t t t tX dX d d X d d d X
Pra marrim kështu një paraqitje të pafundme autoregresive, AR(∞), sipas barazimit
1
t k t k t
k
X X
(1.31)
24
ku koeficientët k jepen sipas barazimeve
1
(1 )(2 )...( 1 ) 1
!k k
d d d k d k d
k k
, për 1, 2,...k (1.32a)
Këta koeficientë kanë shenjë të njëjtë me , kur 1d d . Duke përdorur funksionin
gama ata mund të shkruhen me anë të barazimeve
( ) ( )
(1 ) ( 1) ( ) ( 1)k
d k d k d
d k d k
(1.32b)
Barazimi i parë përdoret kur 0d , ndërsa kur 0d mund të përdoret barazimi i
dytë.
Gjithashtu nga barazimi (1.30) dhe duke përdorur formalisht barazimin (1.29) për
d d , marrim
1 2 3
1 1(1 ) (1 )(2 ) ...
2 6t t t t tX d d d d d d
Pra, kemi një paraqitje të pafundme të mesatares rrëshqitëse, MA(∞) sipas barazimit
0
t k t k
k
X
(1.33)
ku koeficientët k jepen sipas barazimeve
0 1 dhe
1
(1 )(2 )...( 1 ) 1
!k k
d d d k d k d
k k
, për 1, 2,...k (1.34)
Duke përdorur funksionin gama ata mund të shkruhen me anë të barazimeve
( ) ( )
( ) ( 1) (1 ) ( 1)k
k d d k d
d k d k
(1.35)
Barazimi i parë përdoret kur 0d , ndërsa kur 0d mund të përdoret barazimi i
dytë.
Përsëri, këta koeficientë kanë shenjë të njëjtë me d kur 1d . Vërejmë se
koeficientët k dhe k mund të merren nga njëri-tjetri nëpërmjet zëvendësimit të d
me d .
Barazimet e mësipërme që ne i shkruajtëm formalisht, janë të përligjura nga teorema e
mëposhtme treguar nga Hosking (1981) (Hosking, 1981, teorema 1, faqe 167). Kjo
teoremë jep gjithashtu karakteristikat statistikore të procesit FI(d).
Teorema 1.1
Le të jetë tX një proces ARIMA(0,d,0).
(a) Kur 0.5d , procesi tX është stacionar dhe ka një paraqitje të pafundme të
mesatares rrëshqitëse MA(∞) sipas barazimit (1.33) me koeficientë sipas (1.34)
Gjithashtu, kur k , kemi 1
( 1)!
d
k
k
d
(1.36)
25
(b) Kur 0.5d , procesi tX është i kthyeshëm dhe ka një paraqitje të pafundme
autoregresive, AR(∞) sipas barazimit (1.31) me koeficientë si tek (1.32a,b).
Gjithashtu, kur k , kemi 1
( 1)!
d
k
k
d
(1.37)
Për pikat pasardhëse supozohet se 1 1
2 2d .
(c) Funksioni i densitetit spektral për procesin tX është
22
( ) 2sin2 2
d
f
për 0 (1.38)
dhe kemi 2( ) kur 0df (1.39)
(d) Funksioni i autokovariancës i tX është
( 1) ( 2 )!cov( , ) ( )
( )!( )!
k
k t t k t t k
dX X E X X
k d k d
(1.40)
(kujtojmë se kemi supozuar që ( ) 0tE X ).
Gjithashtu mund të shkruajmë
( ) (1 2 )
( 1 ) (1 ) ( )k
k d d
k d d d
(Brockwell dhe Davis (1991))
Funksioni i autokorrelacionit i tX është
0
( )!( 1)!, ( 0, 1,...)
( 1)!( )!
kk
d k dk
d k d
(1.41)
ose ( ) (1 )
( 1 ) ( )k
k d d
k d d
(Brockwell dhe Davis (1991)).
ose akoma (1 )...( 1 )
, ( 1, 2, ...)(1 )(2 )...( )
k
d d k dk
d d k d
(1.41a)
Në veçanti, 0 2
( 2 )!
[( )!]
d
d
dhe
11
d
d
(1.42)
Gjithashtu, kur k , kemi
2 1( )!
( 1)!
d
k
dk
d
(ose, 2 1(1 )
( )
d
k
dk
d
) (1.42a)
(e) Autokorrelacionet inverse të procesit tX janë
2 1
,
!( 1)! !
( 1)!( )! ( 1)!
d
inv k
d k d dk
d k d d
për k (1.43)
(f) Autokorrelacionet e pjesshme të { }tX janë
26
, ( 1, 2, ...)kk
dk
k d
(1.44)
Më tej do shohim disa veti asimptotike për zhvendosjen, dispersionin, dhe
shpërndarjen asimptotike të mesatares së zgjedhjes dhe për autokovariancën dhe
autokorrelacionin e serive me memorie të gjatë.
Supozojmë se plotësohen kushtet e mëposhtme:
Kushti 1.1. Seria tX mund të paraqitet në formën
0
t j t j
j
X
(1.45)
ku t është një zhurmë e bardhë e pavarur.
Kushti 1.2. Kur k , funksioni i autokovariancës k plotëson relacionin
k k , 0 , 0 1 (1.46)
Kushti 1.3. Koeficientet j , të përdorur tek barazimi (1.45), plotësojnë relacionin
j j kur j , ku >0 dhe 1
= (1 )2
(1.47)
Kushti 1.4. Për më tepër supozojmë se shpërndarja e t plotëson një nga kushtet e
mëposhtme:
2 2( )tE (1.48a)
4 4( ) (3 )tE (1.48b)
( )m
tE për çdo numër të plotë pozitiv m (1.48c)
2~ (0, )t N (1.48d)
Atëherë, Hosking (1996) ka treguar se janë të vërteta rezultatet e tabelës 1.1 së
mëposhtme.
Tabela 0.1 Rendi i konvergjencës për zhvendosjen, dispersionin dhe shpërndarjen
asimptotike të statistikave të zgjedhjes për një seri kohore normale me funksion të
autokovariancës kur n → ∞.
Statistika Vlerat e Zhvendosja Dispersioni Shpërndarja
asimptotike
Mesatarja e
zgjedhjes 0 1 0 n Normale
Autokovariancat
dhe
autokorelacionet
empirike
10
2 n 2n
Rosenblatt i
modifikuar
1
2 n
1 logn n Normale
11
2 n 1n Normale
k k
27
Disa nga kushtet e mësipërme janë më shumë shtrënguese se sa është e nevojshme,
por janë vendosur për të lehtësuar prezantimin.
Tregohet se zhurma e pjesshme e Gausit si dhe proceset ARFIMA plotësojnë kushtin
1.1 me koeficientë që plotësojnë kushtin 1.3. Megjithatë ekzistojnë procese me
shpërndarje jo normale me memorie të gjatë për të cilat nuk ekziston një paraqitje
lineare si tek kushti 1.1 (për më tepër shih Hosking, 1996).
1.4.2 Proceset ARFIMA
Procesi pjesërisht i integruar FI(d), i përkufizuar nga barazimi (1.30) përshkruhet
vetëm nga një parametër, d (përveç 2
). Për këtë arsye klasa e modeleve FI(d) është
një klasë e kufizuar, ku forma e funksionit të autokorrelacioneve është e përcaktuar
vetëm nga një parametër. Zvogëlimi i ngadaltë i autokorrelacioneve është një
fenomen që është vërejtur në një sërë faktesh empirike në ekonomi dhe për këtë arsye,
ai është një cilësi e vlefshme e modelit FI(d). Por, megjithatë ky model është tepër i
kufizuar në modelimin e dinamikave afatshkurtra. Për këtë qëllim procesi FI(d)
përgjithësohet duke marrë modelin ARFIMA(p,d,q) (AutoRegressive Fractionally
Integrated Moving Average) të proceseve autoregresive të integruara pjesërisht me
mesatare të lëvizshme. Në mënyrë të përmbledhur, një model ARFIMA është një
model ARIMA ku mbetjet (inovacionet) janë një zhurmë e bardhë thyesore.
Përpara punimeve të Granger dhe Joyeux (1980) dhe Hosking (1981), seritë kohore
lineare përgjithësisht ndaheshin në seri stacionare me memorie të shkurtër dhe në seri
jostacionare (ose seri të integrueshme të rendit një). Tipi i parë i proceseve është
modeluar nga klasa e gjerë e modeleve ARMA(p,q), propozuar nga Box dhe Jenkins
(1970). Ky model është një mjet shumë i dobishëm për të modeluar sjelljen me
memorie të shkurtër. Ai paraqitet sipas barazimit (1.25) dhe ka densitet spektral të
dhënë sipas barazimit (1.26). Prej barazimit (1.26) gjejmë se
22
20
(1)lim ( ) konstante
2 (1)f
(1.49)
Një model ARIMA(p,d,q), ku 1, 2, ...d , mund të shihet si një model ARMA(p,q) i
zbatuar pasi seria fillestare është diferencuar d herë për t’u bërë stacionare, pra në
serinë 1t t tY X X kur 1d , ose 1 1 2t t t t tY X X X X kur 2d , e
kështu me radhë. Parametri i integrimit d mund të marrë edhe vlera të plota negative
dhe në këtë rast seria fillestare integrohet d herë (p.sh. kur 1d seria e re është t
t j
j
Y X
).
Granger dhe Joyeux (1980) dhe Hosking (1981), pavarësisht nga njëri tjetri, i
përgjithësuan modelet ARIMA(p,d,q), duke lejuar që d të marrë edhe vlera thyesore
dhe duke përftuar në këtë mënyrë modelet ARFIMA.
Modeli ARFIMA(p,d,q) përcaktohet nga barazimi:
( )(1 ) ( )d
t tB B X B (1.50)
për t , ku t janë ndryshore rasti i.i.d. me pritje matematike ( ) 0tE dhe
dispersion 2( )tD , ndërsa është pritja matematike e procesit. Pra, ky proces
28
mund të mendohet si një model ARMA(p,q) i ndërtuar për ndryshoren e përftuar nga
diferencimi i pjesshëm (d herë) i ndryshores fillestare, ku me diferencim d herë
nënkuptohet barazimi (1.27) i përdorur në modelin FI(d). Supozohet se parametri
thyesor d i merr vlerat në intervalin ( 0.5,0.5) , përndryshe procesi diferencohet një
numër të plotë herësh deri sa të arrihet ( 0.5,0.5)d .
Edhe modeli ARFIMA(p,d,q) mund të paraqitet si një model AR(∞) ose si një model
MA(∞) duke supozuar të njëjtat kushte si tek modelet ARMA(p,q). Mund të tregohet
se sjellja asimptotike e funksionit të autokovariancës (dhe autokorrelacionit) të
procesit ARFIMA(p,d,q)është e njëjtë me atë të procesit FI(d) përkatës. Kjo ndodh
pasi efektet e parametrave të memories së shkurtër, që përfaqësohet nga pjesa
ARMA(p,q) e modelit, janë të neglizhueshme (parëndësishme) për distancat e largëta
(kur k ). Për më tepër, densiteti spektral i një procesi ARFIMA(p,d,q) jepet sipas
barazimit
2
( ) ( ) 2sin2
d
ARMAf f
(1.51)
ku ( )ARMAf është densiteti spektral i pjesës ARMA të modelit (pra i procesit
(1 )d
t tU B X ). Prej këtej rrjedh se 2( ) kur 0df , ashtu si tek barazimi
(1.39) për proceset FI(d). Duke iu referuar barazimeve (1.49) dhe (1.51) mund të
kuptojmë dallimin e serive me memorie të gjatë nga ato me memorie të shkurtër për
sa i përket sjelljes së densitetit spektral afër origjinës (zeros).
Proceset e diferencuara thyesore ARFIMA(p,d,q), zotërojnë mjaft veti të mira
(Hosking, 1981); ato janë mjaft fleksibël dhe lejojnë modelimin e njëkohshëm të
sjelljes afatshkurtër dhe asaj afatgjatë të serisë. Gjithashtu, është mjaft e lehtë për të
krijuar (simuluar) një seri artificiale nga modeli (i supozuar i njohur).
1.5 Vlerësimi i memories së gjatë
Ekziston një literaturë e gjerë rreth problemit të identifikimit dhe të vlerësimit të një
procesi ARFIMA(p,d,q). Beran (1994) jep një paraqitje të gjerë të këtyre metodave.
Metodat e vlerësimit të memories së gjatë mund të përmblidhen në tre klasa:
- metoda vizuale (heuristike)
- metoda gjysmë parametrike
- metoda parametrike
Ne do të konsiderojmë disa nga metodat më të përdorshme, për evidentimin dhe
vlerësimin e memories së gjatë.
1.5.1 Zbulimi vizual i memories së gjatë
Në literaturë ekzistojnë disa metoda të thjeshta grafike për evidentimin dhe vlerësimin
e parametrit të memories d. Zakonisht hapi i parë në një zbatim praktik është ndërtimi
i korrelogramit të serisë, pra i grafikut të autokorrelacioneve empirike. Një zvogëlim i
ngadaltë i autokorrelacioneve është një tregues i memories së gjatë. Autokorrelacionet
e zgjedhjes janë vlerësuesa konvergjent të autokorrelacioneve teorikë të një serie me
memorie të gjatë (Baillie, 1996). Duke iu referuar tabelës 1.1 dhe barazimit (1.42a)
për rastin e modeleve FI(d), rendi i konvergjencës të autokorrelacioneve të zgjedhjes
29
nga një seri e modelit ARFIMA(p,d,q) jepet sipas tabelës 1.2, së mëposhtme (rendi
gjendet nga tabela 1.1 duke pozuar 1 2d dhe duke shumëzuar formalisht rendin
e konvergjencës së zhvendosjes me rrënjën katrore të rendit të konvergjencës së
dispersionit).
Tabela 0.2 Rendi i konvergjencës së autokorrelacioneve empirike për një seri kohore
të modelit ARFIMA(p,d,q).
Vlerat e d-së Shkalla e konvergjencës
0.5 0.25d 0.5n
0.25d
0.5
ln( )
n
n
0.25 0.5d 0.5 dn
Megjithatë, Newbold dhe Agiakloglou (1993) treguan se autokorrelacionet e
zgjedhjes të zhurmës thyesore janë në përgjithësi të zhvendosur, dhe se vetia e
zvogëlimit të ngadaltë e autokorrelacioneve të një serie me memorie të gjatë, shpesh
herë nuk vrojtohet tek autokorrelacionet e zgjedhjes. Një gjë e tillë shpesh rrjedh për
arsye të rendit të ngadaltë të konvergjencës së dispersionit të mesatares së zgjedhjes.
Në vijim ne prezantojmë tre metoda vizuale për evidentimin e memories së gjatë.
Metodat e mëposhtme japin një vlerësim të katrorëve më të vegjël për parametrin e
vetëngjashmërisë H, i cili lidhet me parametrin e memories d sipas barazimit
0.5H d (1.52)
Për secilën nga metodat e prezantuara më poshtë është e mundur dhe ndërtimi i
grafikut të drejtëzës së regresit për metodën përkatëse, por saktësia e tyre varet shumë
nga parametrat përkatës, të cilët siç do të shohim, mund të përcaktohen vetëm në
mënyrë orientuese.
(i) Vlerësusi R/S.
Vlerësuesi R/S është përdorur gjerësisht nga hidrologu i famshëm Hurst (1951) gjatë
investigimeve të tij të prurjeve të lumit Nil. Ai vuri re të ashtuquajturën efekti Jozef,
domethënë, periudha të gjata me prurje të skajshme dhe periudha të gjata me prurje të
ulëta. Problemi ishte i lidhur me ndërtimin e një rezervuari ideal për ujin. Hurst mundi
të përshkruante kapacitetin ideal të një rezervuari uji nëpërmjet statistikës së
përshtatur të amplitudës ,R t k të dhënë nga barazimi
00
, max mint i t t i t t i t t i ti ki k
i iR t k Y Y Y Y Y Y Y Y
k k
(1.53)
ku 1
j
j i
i
Y X
është seria e shumave të pjesshme.
Kjo amplitudë standardizohet nga devijimi empirik i mëposhtëm
2
,
1,
t k
i t k
i t
X X
S t kk
(1.54)
30
ku ,
1
1 t k
t k i
i t
X Xk
.
Atëherë, statistika
,,
,
R t kQ t k
S t k (1.55)
është quajtur amplituda e rregulluar e rishkallëzuar ose statistika R/S dhe, shpesh
shënohet thjesht Q. Duke vizatuar grafikun e logaritmit log ,Q t k kundrejt log(k)
do të vrojtonim një vijë të drejtë. Kjo drejtëz mund të vlerësohet me metodën e
katrorëve më të vegjël (me term të lirë) për të matur lidhjen lineare ndërmjet
dhe log(k). Përcaktohet se në rastin kur të dhënat janë të pakorreluara
ose me memorie të shkurtër, pjerrësia β, e drejtëzës së regresit tenton të jetë afërsisht
1
2, ndërsa në prezencën e memories së gjatë ajo tenton drejt një konstante me vlerë
më të madhe, ndërmjet 1
2 dhe 1. Tregohet se për proceset ARFIMA(p,d,q) ka vend
barazimi 1
2d . Këto rezultate empirike janë mbështetur nga dy teorema të
Mandelbort (1975). Teorema e parë është një rezultat asimptotik për 1
2 ,k Q t k
i
vlefshëm për proceset me memorie të shkurtër, ndërsa teorema e dytë tregon veti
asimptotike të ngjashme për ,Hk Q t k për proceset që konvergjojnë në lëvizje
thyesore brouniane.
Pohim 1.6. Le të jetë tX , i tillë që 2
tX është ergodik dhe 1
2
1
t
s
s
t X
konvergjon dobët
tek lëvzja brouniane kur t .
Atëherë, 1
2 , kur kdk Q t k
, ku është një ndryshore rasti e
padegjeneruar.
Pohim 1.7. Le të jetë tX , i tillë që 2
tX është ergodik dhe 1
tH
s
s
t X
konvergjon dobët
tek lëvzja brouniane kur t .
Atëherë, , kur kdHk Q t k , ku është një ndryshore rasti e
padegjeneruar.
Statistika R/S ka vetinë e pëlqyeshme të të qenit e qëndrueshme (robust) karshi
shpërndarjeve larg normales. Megjithatë, përderisa metoda R/S mbështetet në
ndryshimin e rendeve të konvergjencës për memorien e gjatë apo të shkurtër, ajo
kërkon të kemi një numër konsiderueshëm të madh vrojtimesh për të dhënë rezultate
të “besueshme”. Gjithashtu Lo (1991) tregoi se statistika R/S nuk është e
qëndrueshme kundrejt varësisë afatshkurtër.
log ,Q t k
31
Në figurën 1.8 tregohen grafikët e zbatimit të metodës R/S për dy seri të simuluara,
përkatësisht nga një model AR(1) me koeficient 1 0.45 (memorie e shkurtër) dhe
nga një model ARFIMA(0,d,0) me parametër 0.3d (memorie e gjatë).
Figura 0.8 Grafiku i metodës R/S për dy seri kohore të simuluara.
Të dy pjerrësitë e vlerësuara janë më të mëdha se 0.5 duke treguar prezencë të
memories së gjatë në të dyja seritë, megjithëse seria e parë është me memorie të
shkurtër.
Në fakt, është treguar se statistika R/S është mjaft e zhvendosur në prezencë të një
pjese AR(1) me koeficient 0.5 (Lo, 1991). Seria e parë e mësipërme është simuluar
nga një proces AR(1) me koeficient 0.45, pra afër vlerës 0.5.
Fatkeqësisht, nuk ka ndonjë teori asimptotike për statistikën Q, çka e bën të vështirë,
përdorimin e saj për konkluzione statistikore, p.sh. gjetjen e intervaleve të besimit.
Gjithashtu është e hapur çështja e zgjedhjes së pikës të ndërprerjes për k dhe,
rezultatet mund të ndryshojnë së tepërmi për vlera të larta të saj. Së fundmi,
Bhattacharya etj.(1983) ka treguar se vlerësuesi R/S nuk është i qëndrueshëm kundrejt
stacionaritetit, në veçanti ai mund të japë rezultate të gabuara në prezencë të një trendi
me shuarje të ngadaltë.
32
Në përgjithësi, sugjerohet se përdorimi i kësaj metode (ashtu si dhe i metodave të
mëposhtme) nuk duhet bërë i izoluar nga metodat e tjera.
Lo (1991) propozoi një modifikim të statistikës R/S duke përftuar statistikën
1 (1, )( )
( )q
q
R nV n
S nn (1.56)
ku (1, ) ( )R n R n është amplituda e serisë, që përftohet nga barazimi (1.58) për t=1
dhe k=n, ndërsa ( )qS n është një vlerësues konvergjent i devijimit empirik që jepet
sipas barazimit
1
22
1 1 1
1 2( ) ( )
qn n
q i i k k i
i i k i
S n X X q X X X Xn n
(1.57)
për një numër të plotë të fiksuar q. Me X është shënuar mesatarja e zgjedhjes ndërsa
koeficientët ( )i q jepen sipas barazimeve
( ) 1 , 1, 2, ..., 1
i
iq i q
q
(1.58)
Me supozimin se pika e cungimit, q duhet të rritet me rritjen e vëllimit të zgjedhjes n,
në rendin 1/4( )n o n , Lo (1991) tregoi se statistika ( )qV n konvergjon spas
probabilitetit tek një ndryshore rasti e përcaktuar dhe gjeti kuantilet e saj. Megjithatë,
performanca e statistikës ( )qV n në praktikë është tepër e ndjeshme nga vlerat e pikës
së cungimit q. Lo (1991) propozoi formulën e mëposhtme, të mbështetur tek zgjedhja,
e cila jep vlerën e përshtatshme të pikës së cungimit q, kur vrojtimet janë nga proceset
AR(1).
2/31/3
2
ˆ3 2
ˆ2 1
nq
(1.59)
Këtu, ̂ është vlerësuesi empirik i koeficientit autokorrelacionit të rendit të parë.
Teverovsky etj. (1999) treguan se në përgjithësi, me rritjen e q-së
, zvogëlohet
probabiliteti i refuzimit të hipotezës bazë se seria nuk përmban memorie të gjatë.
Butka etj. (2014) kanë treguar se përdorimi i statistikës ( )qV n , sugjeruar nga Lo
(1991), është i vlefshëm për testimin e memories së gjatë me metodën bootstrap me
cikle, që prezantohet në kapitullin 3.
(ii) Metoda e variancës së grumbulluar.
Kjo metodë është prezantuar nga Taqqu etj. (1995) dhe është përpunuar më tej nga
Giraitis etj. (1999) dhe Teverovsky dhe Taqqu (1997). Ideja e kësaj metode është të
vlerësojmë rendin e zvogëlimit të dispersionit të mesatares së zgjedhjes dhe duke
patur parasysh se ky zvogëlim është i rendeve të ndryshme konvergjence për seritë me
memorie të shkurtër dhe të gjatë, të përcaktohet në se kemi prezencë të memories së
gjatë apo jo. Metoda konsiston si më poshtë.
a) Për një numër të plotë m, serinë e vrojtuar 1 2, ,..., XnX X e ndajmë në n/m blloqe
të ndara nga njëra tjetra me gjatësi m secila (supozojmë se n plotpjesëtohet nga m).
33
b) Për çdo 1, 2, ..., /k n m njehsojmë vlerat mesatare
( 1) 1
1( )
km
m i
i k m
X k Xm
, si dhe dispersionin e zgjedhjes të tyre
2/ /
2
1 1
1 1ˆ ( ) [ ( )] ( )/ /
n m n m
m m m
k k
D X X k X kn m n m
(1.60)
Në se procesi është një zhurmë thyesore gausiane ose FI(d) është i vërtetë relacioni
2
0( )mD X m kur m , (1.61)
ku 2 2H për rastin e zhurmës thyesore gausiane, ose 2 1d për rastin e
procesit FI(d). Kështu që për të vlerësuar parametrin e memories ne mund të përdorim
regresin linear të logaritmit të ˆ ( )mD X me log(m) si dhe me term të lirë.
c) Atëherë, përsërisim hapat a) dhe b) për vlera të ndryshme të m-së. Vlerat e m-së
zgjidhen të tilla që të jenë të baraslarguara në shkallë logaritmike, pra të tilla që
1i
i
mC
m
, ku konstantja C përcaktohet në varësi të gjatësisë së serisë dhe të numrit të
pikave të regresit të dëshiruar (zakonisht merret C = 2)
d) Ndërtojmë dhe vlerësojmë drejtëzën e regresit të pikave me koordinata (log(m),
ˆlog{ ( )}mD X ).
Koeficienti i vlerësuar i pjerrësisë së drejtëzës së regresit shërben si vlerësim për
parametrin . Në se procesi ka memorie të shkurtër (ose është i pa
korreluar) atëherë drejtëza e përftuar duhet të ketë pjerrësinë të barabartë me -1.
Përndryshe vlera e del më e madhe.
Që procedura të jetë e vlefshme supozohet se m dhe n janë mjaftueshëm të mëdha si
dhe që m n në mënyrë që gjatësia e çdo blloku dhe numri i blloqeve të jenë
mjaftueshëm të mëdha.
Meqenëse zhvendosja e vlerësuesit tip variancë është e rendit jo më të vogël se
1
log n
, ky vlerësues mund të përdoret vetëm për seritë mjaft të gjata.
Në figurën 1.9 jepet grafiku i drejtëzës të përftuar nga metoda e mësipërme për të
njëjtat seri të simuluara tek rasti i figurës 1.9.
Në rastin e procesit AR(1) drejtëza e regresit është afërsisht paralele me drejtëzën me
pjerrësi -1. Pra nuk kemi “shenja” të pranisë së memories së gjatë. Vlerësimi i
parametrit d është negativ dhe afër zeros.
Në rastin e procesit ARFIMA(0,d,0) e ka koeficientin e pjerrësisë më të madh se -1,
duke treguar prezencë të memories së gjatë.
Pra, në të dy rastet metoda e variancës së grumbulluar ka dhënë konkluzion të saktë
(në përputhje me realitetin).
2 1d
34
Figura 0.8 Grafiku i metodës së variancës së grumbulluar për dy seritë kohore të
simuluara.
Teverovsky dhe Taqqu (1997) demonstruan, teorikisht dhe nëpërmjet eksperimenteve
Monte Carlo, se metoda e variancës së grumbulluar është e dobishme gjithashtu për të
zbuluar në se seria është stacionare apo shfaq ndryshime të nivelit të mesatares. Në se
grafiku i pikave të variancës së grumbulluar paraqet formë eksponenciale, atëherë kjo
është tregues i ndryshimeve të mesatares.
(iii) Metoda e Higuchi.
Higuchi (1988) modifikoi një metodë të propozuar nga Burlaga dhe Klein (1986), të
cilët u përpoqën të njehsonin dimensionin thyesor të densitetit spektral. Një kurbë
quhet thyesore në se ( ) Df , ku D është dimensioni thyesor dhe është i lidhur
me eksponentin H, të Hurstit, nëpërmjet barazimit 1D H . Në veçanti, Higuci
(1988) ndryshoi mënyrën e njehsimit të gjatësisë së kurbës, sepse metoda e
mëparshme e Burlaga dhe Klein (1986) jepte rezultate tepër të zhvendosura për vlera
të parametrit H afër njëshit. Ineteresant është fakti se formula e dhënë prej tij të
kujton formulën për variancën absolute të një funksioni prodhues real.
Kur na jepet një seri kohore e fundme , 1,2,...,tX t n , algoritmi i njehsimit të
dimensionit thyesor konsiston si më poshtë.
35
1. Për një numër të plotë k të fiksuar, formojmë k nënzgjedhje nëpërmjet barazimeve
( )
2, , , ..., k
m m m k m k n mm k
k
X X X X X
, për 1, 2, ..., m k (1.62a)
2. Gjatësia e çdo kurbe (serie) të krijuar përcaktohet nëpërmjet barazimit
11
1 1( )
n m
k
m m ik m i ki
nL k X X
n mkk
k
, (1.62b)
ku 1n
n mk
k
është një faktor normalizimi, ndërsa m dhe k janë dy numra të plotë
që tregojnë kohën fillestare dhe intervalin e kohës (përkatësisht).
3. Atëherë, gjatësia e kurbës tX përcaktohet si mesatare e gjatësive ( )mL k për
1, 2, ..., m k ,
1
1( ) ( )
k
m
m
L k L kk
(1.62c)
Në qoftë se tX është një kurbë thyesore, siç ndodh kur kemi memorie të gjatë, atëherë
ka vend relacioni
1H
HL k c k (1.62d)
ku koeficienti Hc nuk varet nga k.
4. Në se ndërtojmë një grafik të L k kundrejt k në një shkallë dy herë logaritmike
(pra duke logaritmuar anë për anë) vërehet një vijë e drejtë, pra është e mundshme të
marrim një vlerësim për H me metodën e katrorëve më të vegjël duke kryer regresin
linear të pikave log{ ( )}, log( )L k k për max1, 2, ..., k k . Me metodën e katrorëve
më të vegjël gjejmë vlerësimin e koeficientit të pjerrësisë, ̂ dhe, nga barazimet
ˆ D̂ , 1D H , dhe 0.5H d , marrim vlerësimin
ˆ ˆ 0.5d (1.62e)
Përcaktimi i pikës tavan, maxk , varet nga zgjedhja përkatëse, por ajo duhet të jetë e
tillë që të sigurojë që pikat e përdorura tek regresi logaritmik të ndodhen afër një
drejtëze pra, regresi të jetë i vlefshëm.
Në figurën 1.10 paraqitet regresi i metodë Higuchi për dy seritë e përdorura në figurat
1.8 dhe 1.9. Evidentimi i memories së gjatë është korrekt për të dy llojet e proceseve.
Vlerësimet e kësaj metode duken më afër vlerave reale se sa ato të metodave të
mësipërme (për rastin konkret të simuluar).
36
Figura 0.10 Grafiku i metodës Higuchi për dy seritë kohore të simuluara.
Vlerësuesi i ndërtuar me metodën e Higuchit ka dy të meta kryesore. Nga njëra anë
nuk kemi ndonjë rezultat asimptotik për shpërndarjen apo vetitë e tij; dhe nga ana
tjetër ky vlerësues mund të përdoret vetëm me seritë mjaft të gjata, për shkak të
zhvendosjes që ai shfaq për zgjedhje me vëllim të vogël.
1.5.2 Vlerësues paramertikë ose gjysmë parametrikë.
Në këtë paragraf, vlerën e vërtetë (të panjohur) të parametrit do ta shënojmë me
indeksin zero, p.sh. 0d , 2
0 , 0 etj., ndërsa vlerësimin e tij me ̂ ( kapuç sipër), p.sh. d̂ ,2̂ ,̂ , etj. Gjithashtu me ( )f shënojmë densitetin spektral, ndërsa me ( )jI
shënohet vlerësuesi i tij nëpërmjet periodogramës së zgjedhjes, sipas barazimit
1
0
( 1)
1 1ˆ ˆ( ) cos( )
2
n
j k j
k n
I k
(1.63)
37
i njehsuar për frekuencat Furie (ose harmonike) 2
per 1,...,2
j
j nj
n
(këtu
simboli qëndron për pjesën e plotë). Është me interes të theksojmë se metodat
parametrike vlerësojnë të gjitha parametrat e modelit, 2
1 1, ,..., , , ,...,p qd
njëkohësisht, ndërsa metodat gjysmë parametrike zakonisht përdoren gjatë vlerësimit
të sjelljes së termave te largët duke vlerësuar fillimisht parametrin e memories d dhe
më tej parametrat e tjerë. Të dyja rastet janë me interes dhe secila mund të
konsiderohet më e mirë se tjetra në varësi nga situata
Më tej shohim.disa nga vlerësuesit më të përdorur në literaturë.
(i) Vlerësuesi i përpiktë i përgjasisë maksimale.
Në se t në barazimin (1.50) është një proces i Gausit, atëherë është e mundshme që
të shkruhet shpërndarja e përbashkët e vektorit të rastit 1( ,..., ,..., )n t nX X XX .
Le të bëjmë shënimet e mëposhtme.
ˆn Z X 1 , ku ̂ është një vlerësues konvergjent i mesatares së procesit (p.sh.
mesatarja e zgjedhjes, X ) dhe 1 është një vektor shtyllë me njësha me dimension n .
2
1 1( , , ,..., , ,..., )p qd , vektorin e parametrave të panjohur me dimension
2m p q .
( )nT , matricën katrore të rendit n me element të përgjithshëm
( )
; , ( ) ( ; ) i j k
n j kT f e d
(kemi theksuar varësinë nga parametri , iështë numri
kompleks imagjinar). Kjo matricë është matricë me diagonale konstante.
Atëherë funksioni i përgjasisë i zgjedhjes nX (pra, densitetit të shpërndarjes së
vektorit nX ) mund të shkruhet (shih Beran, 1994, paragrafi 5.3).
1/2 1
/2
1 1( ; ) ( ) exp ' ( )
(2 ) 2n n nn
h T T
X Z Z (1.64)
Nga funksioni logaritëm i përgjasisë, i cili shkruhet në formën
11 1( ; ) log ( ; ) log 2 log ( ) ' ( )
2 2 2n n n n
nL h T T X X Z Z ne mund të marrim
derivatet e pjesshme në lidhje me parametrat që duam të vlerësojmë dhe duke
zgjidhur sistemin përkatës marrim vlerësuesin e përgjasisë maksimale ˆPM (si dhe
vlerësimin përkatës pas zëvendësimit). Normaliteti i ˆPM është studiuar nga Dahlhaus
(1988, 1989).
Kur funksioni i densitetit spektral i procesit plotëson disa kushte të rregullsisëjanë të
vërteta pohimet e mëposhtme (për hollësi shih Dahlhaus 1989)
Pohim 1.8. (Dahlhaus 1989, teorema 3.1)
Supozojmë se ̂ është një vlerësues konvergjent i 0 . Atëherë kemi
38
0ˆ p
PM (1.65)
Pohim 1.9. (Dahlhaus 1989, teorema 3.2)
Supozojmë se ̂ është një vlerësues i qëndrueshëm i rendit 01 ( )
2n
për 0 . Këtu,
00 ( ) 1 është një numër, i tillë që funksioni i densitetit spektral i procesit
supozohet se plotëson kushtin 0( )
0( , ) ( ), kur 0f x O x x
. Atëherë
1
0ˆ( ) (0, )d
PM nn N T (1.66)
Lieberman etj. (2012) zgjeroi rezultatet e Dahlhaus (1989) për një zonë më të gjerë të
stationaritetit si dhe për rastin e pakthyeshmërisë të modelit.
Edhe pse në këtë rast, vlerësuesi ˆPM është asimptotikisht normal, gjetja e tij ka
vështirësinë e kryerjes së një numri të madh njehsimesh, që nevojiten për
maksimizimin e një sistemi prej m ekuacionesh si dhe për gjetjen e matricës së
anasjelltë të matricës ( )nT , e cila është rendit n.
Për të ulur rendin e veprimeve, Haslett dhe Raftery (1989) propozuan një përafrim të
funksionit të përgjasisë maksimale. Metoda e tyre gjen përdorim tek paketa
statistikore fracdiff në programin R.
(ii) Vlerësimi i Whittle.
Fox dhe Taqqu (1986) kanë prezantuar një metodë të përgjasisë maksimale duke u
mbështetur në këndvështrimin spektral të serisë, ku vlerësuesi i përgjasisë gjendet
duke maksimizuar funksionin 1
2
1exp
2
nT
n
Z Z. Ata shtjelluan një sugjerim të
Whittle (1951), i cili propozoi përdorimin e një përafrimi të matricës së anasjelltë të
matricës Toeplitz ( )nT , nëpërmjet matricës ( )nA me element të përgjithshëm si më
poshtë
1
; , 2
1( ) exp ( ) ( , )
(2 )n j kA i j k x f x dx
(1.67)
Vlerësuesi i gjetur nga Fox dhe Taqqu (1986) zgjeron rezultatet e Hannan (1973), i
cili aplikoi metodën e Whittle për vlerësimin e parametrave të modeleve ARMA.
Rezultati i gjetur nga Fox dhe Taqqu (1986), i përgjithësuar më vonë nga Dahlhaus
(1989) për rastin e vlerësuesit të përpiktë të përgjasisë maksimale, është baza e një
prej metodave më të përdorura për vlerësimin e parametrave të memories së gjatë
(edhe të shkurtër, në se janë prezent të dy tipet e kujtesës) në seritë kohore të Gausit.
Në se përdoret përafrimi i Whittle për funksionin logaritëm të përgjasisë, atëherë
vlerësuesi ˆn i vektorit të parametrave
2
1 1( , , ,..., , ,..., )p qd vlerësohet duke
minimizuar në varësi të vlerësimin e dispersionit të procesit zhurmë e bardhë në
shqyrtim sipas barazimit:
1
22
1
( )1( )
2 ( , )
n
j
j j
I
f
(1.68)
39
ku ( , )jf tregon densitetin spektral të procesit ARFIMA (që po vlerësohet) në
frekuencat Furie ωj, dhe ( )jI periodogramën e vrojtuar të njehsuar sipas barazimit
(1.63). Fox dhe Taqqu (1986) treguan pohimet e mëposhtme.
Pohim 1.10. Në se ( , )jf plotëson disa kushte rregullsie, atëherë me probabilitet 1,
kemi
0ˆlim n
n
dhe
2 2
0ˆlim n
n
(Fox dhe Taqqu , 1986, teorema 1)
Pohim 1.11. Në se plotësohen disa kushte në lidhje me derivatet e densitetit spektral
(për hollësi shih Fox dhe Taqqu, 1986), atëherë vektori i rastit 0ˆnn
konvergjon sipas shpërndarjes tek një vektor rasti Normal me pritje matematike zero
dhe me matricë të autokovariancave 1
04 ( ) W me element të përgjithshëm të
matricës W :
21( ) ( , ) ( , )jk
j k
w f x f x dx
(Fox dhe Taqqu, 1986, teoremë 2).
Le të jetë tX një proces ARFIMA(0,d,0) me 0.5 0.5d . Atëherë, vlerësuesi i
Whittle për parametrin d mund të gjendet duke minimizuar funksionin ( )
2
2, 1
1( ) ( )( )
(2 ) ( ; )
i j k xn
n j k
j k
ed X X X X dx
n f x d
ku ( ; )f x d është densiteti spektral
i një procesi FI(d), që jepet nga barazimi (1.38). Për më tepër, sipas pohimit 1.11,
vlerësuesi i mësipërm i d-së është asimptotikisht normal me dispersion
22
4 60.6079
(log(2 2cos )) d
(1.69)
Vlerësuesi i përpiktë i përgjasisë maksimale ka të metën e kryerjes së një numri të
madh njehsimesh, si dhe mund të shkaktojë probleme në njehsime, kur llogariten
autokovariancat, që nevojiten për të vlerësuar funksionin e përgjasisë (Sowell,1992).
Këto vështirësi nuk janë të pranishme kur përdorim vlerësuesin e Whittle, i cili ka dhe
avantazhin tjetër se nuk kërkon vlerësimin e pritjes matematike të serisë (e cila në
përgjithësi nuk njihet). Për më tepër, kur plotësohen disa kushte (të rregullsisë) si tek
Dahlhaus (1989), të vërteta për rastin e proceseve ARFIMA(p,d,q), mund të
vërtetohet që vlerësuesi i Whittle ka shpërndarje asimptotike të njëjtë me vlerësuesin e
përpiktë të përgjasisë maksimale, dhe konvergjon në vlerat e vërteta të parametrave në
rendin e zakonshëm 1
2n
. Përfundimisht, për proceset e Gausit, vlerësuesi i Whittle
është asimptotikisht efikas në kuptimin e mosbarazimit Rao-Kramer (shih Naqo, 2005
për këtë kuptim të efikasitetit).
E meta e këtij vlerësuesi është se është e nevojshme të supozohet se forma
parametrike e densitetit spektral të njihet paraprakisht, domethënë të specifikohen
rendet e polinomeve të modelit ARMA, p dhe q, dhe të vendoset në se kemi sjellje të
memories së gjatë. Në se funksioni i densitetit spektral i specifikuar nuk është i saktë
(siç ndodh shpesh herë) vlerësimet e parametrave mund të jenë tepër të zhvendosur.
Nga ana tjetër, mund të jetë tepër e vështirë për te evidentuar memorien e gjatë së
bashku dhe me rendin e saktë të p dhe q të pjesës së memories së shkurtër. Zakonisht
40
memoria e shkurtër është e dominuar dhe e konfuzuar nga sjellja e kufizave të largëta
të serisë.
(iii) Vlerësimi lokal i Whittle.
Vlerësimi lokal i Whittle është një vlerësues gjysmë parametrik i parametrit të
memorjes d përpunuar nga Robinson (1995b), i cili ka ndjekur një sugjerim të
Kunsch (1987). Njihet edhe si vlerësuesi gjysmë parametrik gausian. Robinson
(1995b) demonstroi se vlerësuesi lokal i Whittle është asimptotikisht më efikas se
vlerësuesi GPH (do e shohim më poshtë) për rastin e serisë stacionar. Megjthëatë, ky
vlerësues nuk përcaktohet në formë të saktë dhe për pasojë nevojiten metoda të
optomizimit numerik për njehsimin e vlerës së tij (pra të gjetjes së vlerësimit).
Vlerësimi lokal i Whittle mund të gjendet duke minimizuar funksionin objektiv (e
qëllimit) të mëposhtëm:
1 1
1 1( ) log ( ) log
m md d
j j j
j j
R d I dm m
(1.70)
ku ( )jI është peridograma e serisë në frekuencat Furie, j për 1,2,...,j m , dhe m
është një numër i plotë më i vogël se 2
n. Në përgjithësi m zgjidhet i tillë që të
plotësojë kushtin
1lim 0n
m
m n
(1.71)
Për të marrë një vlerësues konvergjent dhe me shpërndarje afërsisht normale, është e
nevojshme të bëhen disa supozime lidhur me funksionin e densitetit spektral si dhe
disa supozime për momentet e inovacioneve t (shih Robinson, 1995b, kushtet e
konvergjencës A1-A4 dhe kushtet e normalitetit A1’-A4’). Gjithashtu supozohet se
lim dhe lim 0n n
mm
n , pra kur n shkon në infinit edhe m shkon në infinit por në
rend më të vogël se n. Atëherë, Robinson (1995b) tregoi se janë të vërteta pohimet e
mëposhtme.
Pohim 1.12. Në se plotësohen kushtet e konvergjencës, atëherë kemi
0ˆ kur pd d n (Robinson, 1995b, Teoerema 1)
Pohim 1.13. Në se plotësohen kushtet e normalitetit, atëherë kemi
1
20
1ˆ 0, kur n4
dm d d N
(Robinson, 1995b, Teoerema 2)
Shënojmë se shkalla e konvergjencës së vlerësuesit varet nga 1
2m , ku m është numri i
frekuencave që përdor vlerësuesi. Pra, vlerësuesi lokal i Whittle është më pak efikas
se vlerësuesit parametrik (siç është dhe vlerësuesi i Whittle) për rastin kur specifikimi
i modelit ku ata mbështeten është i saktë. Por, ky vlerësues është më efikas se
vlerësuesi GPH , të cilin po shohim më poshtë.
41
(iv) Vlerësimi Geweke dhe Porter-Hudak (GPH).
Vlerësuesi GPH është prezantuar nga Geweke dhe Porter-Hudak (1983) dhe është një
nga metodat më të njohura për vlerësimin në mënyrë gjysmë parametrike të parametrit
thyesor d të sjelljes së varësisë me amplitudë të gjatë.
Kjo metodë u prezantua fillimisht nga Geweke dhe Porter-Hudak (1983) për rastin e
procesit të Gaussit, kur 1
,02
d
dhe me tej u zgjerua nga Robinson (1995a).
Supozojmë se procesi , 1,2,...,tX t n është një model ARFIMA(p,d,q) siç është
përcaktuar nga ekuacioni (1.50). Atëherë, mund të tregohet se densiteti spektral i këtij
modeli, i dhënë sipas barazimit (1.51), është proporcional me 24sin2
d
afër
origjinës. Kështu që mund të shkruajmë
2( ) 4sin2
d
ff c
kur 0 (1.72)
Një vlerësues i natyrshëm i densitetit spektral është peiodograma e zgjedhjes, që jepet
nga barazimi (1.63) i rishkrojtur si më poshtë
1
0
1
1ˆ ˆ( ) 2 cos( )
2
n
j k j
k
I k
,
për frekuencat harmonike 2
j
j
n
, 1,2,...,
2
nj
(kujtojmë se me simbolin a
shënojmë pjesën e plotë të numrit a). Meqenëse periodograma ( )jI është një
vlerësues asimptotikisht i pazhvendosur i densitetit spektral, pra
0
lim ( )j jE I f
, atëherë është e mundur të vlerësohet parametri d duke
përdorur metodën e katrorëve më të vegjël për ekuacionin e regresit:
2 2log log 0 2 log 4sin , 1,2,...,2 2
j
j j
nI f d u j m
(1.73)
ku , 1,2,...,2
j
nu j m
janë kufizat e gabimit që supozohen me shpërndarje të
njëjtë dhe të pavarura (për më shumë hollësi shih Geweke dhe Porter-Hudak, 1983).
Robinson (1995b) tregoi se në vend të vlerave 2log 4sin2
j
mund të marrim
vlerat 2log j sepse rezultatet janë ekuivalente në rendin e parë.
Relacioni (1.60) është një lidhje asmptotike e vlefshme vetëm në një fqinjësi të
origjinës; pra po ta përdorim këtë lidhje për të gjitha koordinatat e periodogramës
, vlerësimi i gjetur për parametrin d do jetë mjaft i zhvendosur.
Geweke dhe Porter-Hudak (1983) propozuan që për vlerësimin të merren në
konsideratë vetëm m n frekuencat e para, përderisa d është parametri i memories
42
i cili ndikon më së shumti në frekuencat e ulëta (afër zeros). Ndërsa frekuencat e larta
ndikohen nga pjesa e kujtesës së shkurtër e modelit ARMA.
Kur plotësohen disa kushte të rregullsisë, Robinson (1995a) dhe Hurvich etj. (1998)
kanë treguar që vlerësuesi GPH është me shpërndarje asimptotike normale, duke
dhënë rezultatin e mëposhtëm:
4
0ˆ ~ 0,
24m d d N
(1.74)
Këtu, m është numri i frekuencave të përdorura, i cili duhet të plotësojë kushtet 4
5m o n
dhe 2log ( )n o m . Zakonisht përdoret m e tillë që
m dhe 0m
n , kur n (1.75)
E meta më e rëndësishme e këtij vlerësuesi është fakti që ky vlerësues ka një devijim
standard të lartë. Për më tepër, Agaikloglou etj. (1993) ka treguar se kur koeficientet e
modelit ARMA janë afër kufijve të jostacionaritetit, vlerësuesi GPH është i
zhvendosur.
(v) Vlerësimi i periodogramës së lëmuar (SP, Smoothed Periodogram).
Hassler (1993) dhe Reisin (1994), në mënyrë të pavarur nga njëri tjetri, propozuan një
vlerësues të parametrit d bazuar në procedurën e regresit të logaritmit të
periodogramës së lëmuar. Vlerësuesi i periodogramës së lëmuar i densitetit spektral
jepet sipas barazimit
0 0
1
1ˆ ˆ( ) 2 cos( )
2
M
SP j k k j
k
I k
(1.76)
Bashkësia 0 1{ , ,..., }M është bashkësia e peshave dhe quhet dritarja e vonesës,
ndërsa kufiri i sipërm M n , i shumës (1.76) quhet pika e cungimit e dritares. Mund
të përdoren variante të ndryshme të peshave të dritares së vonesës, por që të gjitha
vendosin pesha më të vogla për distancat më të mëdha. Vlerësuesi SP përftohet duke
zëvendësuar peridogramën me periodogramën e lëmuar tek ekuacioni i regresit (1.73).
Reisen (1994) propozoi përdorimin e dritares Parzen që jepet nga barazimet
2 3
3
1 6 6 , për 0,1,2,...,2
2 1 , për , 1,...,2 2
k
k k Mk
M M
k M Mk M
M
(1.77)
(është supozuar që M të merret numër çift; për 2
Mk të dyja formulat japin të
njëjtën vlerë).
Figura 1.11 tregon grafikun e dritares Parzen për 100M .
43
Figura 0.9 Peshat e dritares Parzen tek periodograma e lëmuar.
Për gjetjen e vlerësimit SP ne duhet të përcaktojmë dy parametra, pikën e cungimit m
të frekuencave tek regresi (1.73) dhe pikën e cungimit M të dritares së vonesës tek
vlerësimi i periodogramës së lëmuar (1.76). Në praktikë zakonisht m zgjidhet e njëjtë
si tek vlerësuesi GPH, ndërsa M zgjidhet e tillë që 1 1
20 2
M
n (për disa këshilla
praktike shih Hannan, 1973, paragrafi V.7).
Reisen (1994) tregoi se i kur m dhe M plotësojnë kushtet (1.75), vlerësuesi SP ka
shpërndarje asimptotike normale me pritje matematike vlerën e vërtetë d0 dhe
dispersion më të vogël se vlerësuesi GPH.
Përparësia e metodave gjysmë parametrike, si vlerësimi lokal i Whittle dhe GPH,
është fakti se nuk nevojitet specifikimi i plotë i modelit, sepse informacioni i vetëm që
na nevojitet është sjellja e densitetit spektral afër origjinës. Për më tepër, parametri i
memories së gjatë mund të vlerësohet i ndarë (më vete) nga pjesa e memories së
shkurtër.
Një avantazh interesant i vlerësuesve GPH dhe SP kundrejt vlerësuesit Whittle është
se të dy vlerësuesit, mund të zbatohen lehtë pa u shqetësuar (interesuar) për pjesën
ARMA të procesit.
44
Kapitulli 2
2 METODA BOOTSTRAP TEK MODELET E SERIVE
KOHORE
Metoda bootstrap është prezantuar nga Efron (1979) si metodë rizgjedhje për të
vlerësuar gabimin standard të një vlerësuesi parametrash. Shumë shpejt, ato u
përhapën me shpejtësi të madhe për përmirësimin e vlerësimit të zhvendosjes dhe të
dispersionit së vlerësuesve të ndryshëm. Metodat bootstrap mund të zbatohen në
procedura të ndryshme statistikore (Për monografi rreth metodave bootstrap shih p.sh.
Efron dhe Tibshirani, 1993, Davison dhe Hinkley, 1997, Chernick, 2008). Disa nga
përdorimet e tyre mund të përmendim.
• Vlerësimi bootstrap i gabimit standard të një vlerësuesi.
• Vlerësimi bootstrap i zhvendosjes të një vlerësuesi.
• Teknikat bootstrap për realizimin e verifikimit të hipotezave.
Mekanizmi i thjeshtë i zbatimit të tyre për vlerësimin e statistikave sado të
ndërlikuara, si dhe rritja e sigurisë së vlerësimeve të përftuara për shumicën e rasteve,
ishin arsyet që ndikuan në përdorimin e gjerë të tyre. Krahas kësaj zhvillimi i
shkencave kompjuterike bëri të mundur lejimin e përdorimit te tyre pa marrë parasysh
nevojën e numrit relativisht të madh të njehsimeve që kërkojnë metodat bootstrap.
Por, shpejt u vu re se metodat e dizenjuara me rizgjedhje (me kthim) të të dhënave të
përftuara nga ndryshore rasti me shpërndarje të njëjtë dhe të pavarura, nuk funksionin
kur ato zbatoheshin në të dhëna të korreluara dhe në veçanti në seritë kohore. Dhjetë
vjet më pas, Kunsch (1989) prezantoi metodën bootstrap me blloqe, e cila është një
përshtatje e metodës bootstrap të Efronit për rastin e proceseve stacionare, pra dhe për
seritë kohore stacionare. Tashmë dihet se përdorimi efikas i metodave bootstrap në
seritë kohore ndikon në përmirësimin e performancës së vlerësuesve, të probabilitetit
të mbulimit gjatë vlerësimeve intervalore ose të gabimit të refuzimit gjatë kontrollin e
hipotezave.
Megjithatë, për seritë kohore me memorie të gjatë shumë nga këto metoda japin
vlerësime që janë jo konvergjent ose që konvergjojnë në një shkallë të ulët kur vëllimi
i zgjedhjes rritet pambarimisht (Lahiri,1993). Kjo nënkupton mosmundësinë e
ndërtimit të intervaleve të besimit apo të kontrollit të hipotezave ose një performancë
të dobët të metodave bootstrap për zgjedhje me vëllim të fundmë. Përpjekje janë bërë
për të përshtatur metodat bootstrap gjysmë parametrike për rastin e proceseve me
memorie të gjatë si dhe për të zbatuar metodën botstrap me blloqe joparametrike në
fushën spektrale të një procesi.
Konceptet e përgjithshëm të metodologjisë bootstrap jepen në paragrafin 2.1. Më tej,
në paragrafet 2.2-2.4 ne do shohim metoda bootstrap që përdoren për seritë kohore.
Disa përdorime të metodologjisë bootstrap përshkruhen tek paragrafët 2.5 dhe 2.6.
2.1 Metodologjia bootstrap
Metodat bootstrap, të propozuara nga Efron (1979), u përdorën fillimisht për të
vlerësuar me një mënyrë më të thjeshtë shpërndarjen e një statistike për të cilën
45
shprehjet eksplicite (e sakta) ose nuk ekzistojnë ose janë tepër të vështira për të
vepruar me to. Metodologjia bootstrap mbështet në dy “parime”:
- Konsiderimi i zgjedhjes si të ishte popullsia.
- Parimi i lidhjes në prizë (i fishës; plug-in).
Le të jetë F shpërndarja e një popullsie. Supozojmë se jemi të interesuar për një
parametër , i cili vlerësohet me anë të vlerësuesit 1ˆ ( ,..., )nT X X , ku
është një zgjedhje me vëllim n dhe ( )T është një statistikë. Shënojmë me 0 vlerën e
vërtetë të parametrit . Supozojmë se është vrojtuar një zgjedhje 1 2( , ,..., )nx x xx
dhe kemi gjetur vlerësimin 1 2ˆ ( , , ..., )nT x x x x . Metoda bootstrap i zakonshëm
rizgjedh me kthim nga bashkësia 1, ..., nx x me probabilitet të njëtrajtshëm, n
elementë duke përftuar zgjedhjen bootstrap 1, ,, ..., b n bx x x , për 1, 2, ..., b Q , ku
Q është numri i zgjedhjeve bootstrap. Duke zbatuar parimin e “lidhjes në prizë”,
mund të njehsojmë vlerësimet bootstrap 1, ,ˆ ( , ..., )b b n bT x x për 1, 2, ..., b Q ,
duke përdorur të njëjtën statistikë. Atëherë bashkësia ˆ : 1, ..., b b Q , të cilën e
konsiderojmë si bashkësinë e vlerave të një ndryshore rasti (bootstrap) ̂ , mund të
përdoret si vlerësues i shpërndarjes së vlerësuesit në shqyrtim ̂ . Më tej ne mund të
nxjerrim përfundime statistikore për vlerësuesin ̂ . Duke u mbështetur tek metoda
Monte Carlo, vlerësimi (pikësor) bootstrap i parametrit θ është
1
1ˆ ˆQ
b
bQ
x (2.1)
Gjithashtu, vlerësimi bootstrap i zhvendosjes së vlerësuesit ̂ është
ˆˆ ˆ ˆ x x (2.2)
Ndërsa për gabimin standard përdorim vlerësimin
* 2
1
1 ˆ ˆˆ ( )1
Q
b
bQ
x x (2.3)
(përsëri kemi përdorur parimin e vendosjes në prizë).
Gjatë procedurës bootstrap ne bëjmë dy përafrime (pra kemi dy burime të gabimit).
1. Përafrimi i shpërndarjes së panjohur të zgjedhjes me anë të shpërndarjes empirike.
2. Përafrimi i vlerësimeve bootstrap me anë të përsëritjeve Monte Carlo.
Në përafrimin e parë, ne përdorim funksionin e shpërndarjes empirike të zgjedhjes, që
jepet sipas barazimit ] , ]
1
1ˆ ( ) ( )n
y i
i
F y I xn
, për të vlerësuar funksionin e
shpërndarjes të panjohur F. Këtu me AI është shënuar funksioni indikator (tregues) i
bashkësisë A
1, ( )
0, A
x AI x
x A
(2.4)
1( ,..., )nX X
46
Kujtojmë që shpërndarja empirike është vlerësuesi më i “mirë” për rastin kur nuk
kemi njohuri për funksionin e shpërndarjes të ndryshores. Gjithashtu, kur vëllimi i
zgjedhjes rritet pambarimisht, funksioni empirik i shpërndarjes konvergjon
uniformisht, pothuaj me siguri, tek shpërndarja e vërtetë F (për më tepër shih Naqo,
2005).
Përafrimi i dytë ndodh kur ne përdorim parimin e vendosjes në prizë, pra kur
përafrojmë shpërndarjen e statistikës 0̂ me shpërndarjen e statistikës ˆ ˆ x .
Praktikisht, bashkësia e vlerësimeve bootstrap, ˆ : 1, ..., b b Q , interpretohet si një
zgjedhje nga shpërndarja e panjohur e vlerësuesit ̂ . Ky përafrim përmirësohet me
rritjen e numrit të përsëritjeve bootstrap.
Mund të dallojmë dy tipe teknikash të procedurës bootstrap.
• Bootstrapi parametrik: Kjo procedurë përdoret në se ne dimë që shpërndarja F bën
pjesë në një familje parametrike shpërndarjesh. Atëherë ne vlerësojmë parametrat e
shpërndarjes duke u mbështetur tek zgjedhja e vrojtuar. Më tej kryejmë rizgjedhjet
bootstrap nga shpërndarja F duke përdorur parametrat e vlerësuar.
• Bootstrapi jo parametrik: Përdoret kur ne nuk e njohim formën e shpërndarjes F (siç
ndodh shpesh në zbatime praktike). Në këtë rast ne përdorim vlerësimin e
shpërndarjes empirike të zgjedhjes së vrojtuar.
Singh (1981) dhe Babu dhe Singh (1983) kanë treguar se kur zgjedhja është i.i.d.
metodat bootstrap japin vlerësime më të mira se vlerësimet klasike asimptotike, për
raste kur vëllimi i zgjedhjes është relativisht i vogël ose kur shpërndarja e ndryshores
së rastit është jo simetrike.
Për rastin kur të dhënat nuk janë i.i.d. procedura e zakonshme bootstrap nuk është e
vlefshme, pasi ajo nuk ruan strukturën e varësisë së të dhënave fillestare. Singh
(1981) vërejti se bootstrapi origjinal i Efronit nuk është i vlefshëm kur vrojtimet nuk
janë i.i.d. Pra për rastin e të dhënave të tipit seri kohore duhen gjetur të tjera teknika
për metodën bootstrap, të tilla që të struktura e varësisë midis të dhënave të
riprodhohet në mënyrë sa më të saktë, pra të tilla që seritë bootstrap të përftuara të
imitojnë sa më besnikërisht serinë e vrojtuar.
Metodat bootstrap për seritë kohore mund të kategorizohen në dy grupe:
a) Metoda që përdoren në këndvështrimin kohor të serisë, dhe
b) Metoda që përdoren në këndvështrimin spektral të saj.
Shumica e metodave bootstrap për seritë kohore zbatohen në fushën kohore të serisë,
pra në të dhënat e vrojtuara. Në paragrafin pasardhës do shohim disa prej tyre:
2.2 Metodat bootstrap me blloqe
Rizgjedhja me blloqe ose bootstrap me blloqe (BB, Block Bootstrap) është një
përgjithësim i skemës së rizgjedhjes për të dhëna njëjtë dhe të pavarura (i.i.d.). Seria
kohore ndahet në blloqe vrojtimesh të njëpasnjëshme, ku mënyra e formimit të
blloqeve do të diskutohet më tej. Seria e rizgjedhur ose e ashtuquajtura pseudoseria,
ose seria bootstrap, merret duke kryer rizgjedhje me kthim nga bashkësia e blloqeve të
formuar. Duke konsideruar vrojtimet e serisë që kanë një distancë midis tyre si të
pavarura, blloqet e përcaktuara më sipër mund të konsiderohen si vrojtime të pavarura
(ashtu si tek rasti i vrojtimeve i.i.d.). Por, duke i trajtuar blloqet si një vrojtim të vetëm
47
ruhet struktura e varësisë brenda secilit bllok. Kjo metodë mund të përdoret për seritë
kohore stacionare dhe është veçanërisht e përshtatshme kur seria shfaq një sjellje të
varësisë së shkurtër ose kur struktura e varësisë është jolineare dhe përafrimi linear
është shumë i "varfër" (jo i mirë).
Teknikat e përdorura gjatë metodave bootstrap me blloqe zakonisht janë teknika jo
parametrike dhe konsistojnë si më poshtë.
Seria e vrojtuar 1 2, , ..., nX X X (e cila konsiderohet si një zgjedhje e procesit
stacionar që duam të studiojmë) ndahet në k blloqe të përbërë nga vlera të
njëpasnjëshme, që shënohen 1 2, , ..., kB B B ku k është një numër i plotë pozitiv.
Kryejmë 1k rizgjedhje me kthim të blloqeve nga bashkësia 1 2, , ..., kB B B dhe
përftojmë blloqet 11 2, , ..., kB B B . Atëherë, seria bootstrap (quhet dhe pseudoseria)
përftohet duke vendosur njëri pas tjetrit blloqet e përftuara. Numri i plotë pozitiv 1k
është i tillë që numri i vrojtimeve të serisë bootstrap të jetë i njëjtë (ose afërsisht) me
n, sa numri i serisë së vrojtuar.
Performanca e metodave bootstrap me blloqe kushtëzohet nga dy faktorë: mënyra e
ndarjes së serisë në blloqe dhe gjatësia e blloqeve.
Bootstrapi me blloqe karakterizohet nga dy tipare kryesore: zgjedhja e gjatësisë së
bllokut (i njëjtë për çdo bllok ose jo) dhe nga fakti në se blloqet janë prerës (të
mbivendosur) apo të ndarë. Procedurat e propozuara kanë emërtime të ndryshme sipas
teknikave të ndryshme që përdoren për përcaktimin e blloqeve. Megjithatë ato kanë si
emërues të përbashkët faktin se ato rizgjedhin blloqe të vrojtimeve të njëpasnjëshme
(konsekutive). Disa nga teknikat për realizimin e procedurës BB janë përshkruar në
paragrafet në vazhdim, 2.2.1-2.2.3.
2.2.1 Bootstrap me blloqe të mbivendosur
Shpesh kjo metodë quhet dhe metoda bootstrap me blloqe të lëvizshme (MBB,
Moving Block Bootstrap).
Supozojmë se kemi zgjedhjen e vrojtuar 1 2, , ..., nX X X , nga një seri stacionare.
Kunsch (1989) shtjelloi një metodë bootstrap me blloqe të mbivendosur. Seria e
dhënë ndahet në 1n l blloqe me gjatësi të njëjtë të përbërë nga l vrojtime të
njëpasnjëshme. Pra kemi blloqet 1 1, ..., , ..., j n lB B B ku 1 ( 1), , ..., j j j j lB X X X
për 1, 2, ..., 1j n l . Numri l quhet gjatësi e bllokut. Më tej kryejmë rizgjedhje
me kthim nga bashkësia 1 2 1, , ..., n lB B B dhe vendosim njëri pas tjetrit blloqet e
zgjedhura deri sa të marrim serinë bootstrap me gjatësi n (blloku i fundit i rizgjedhur
mund të cungohet).
Kjo metodë karakterizohet nga fakti që 1l vlerat e para dhe 1l vlerat e fundit të
serisë kanë probabilitet më të vogël për të qenë në serinë bootstrap (zgjidhen më
rrallë) se sa vlerat e tjera të serisë (p.sh. vrojtimet 1X dhe nX ndodhen vetëm në një
bllok). Ky fenomen quhet efekti skajor i kësaj metode. Një alternativë për të mos
ndodhur kështu do ishte procedura e propozuar nga Carlstein (1986) për të marrë
blloqe të ndara (të pa mbivendosur) siç përshkruhet më poshtë (paragrafi 2.2.2). Një
teknikë tjetër për të eliminuar këtë “defekt” është propozuar nga Politis dhe Romano
(1992). Ata propozuan që seria të përsëritë vetveten duke krijuar një seri të formës
48
(mod ) 1 2 1 2, , ..., , , , ...t t n nY X X X X X X , për 1, 2, ...t . Më tej përdoret metoda
MBB. Kjo teknikë njihet si bootstrapi rrethor (me shkurtimin CB, Circular
Bootstrap).
2.2.2 Bootstrap me blloqe të ndarë
Ideja kryesore e kësaj teknike është dhënë nga Carlstein (1986), i cili propozoi një
teknikë për vlerësimin e dispersionit të një vlerësuesi duke përdorur blloqe të ndara.
Në këtë metodë, seria ndahet në k blloqe 1, ..., , ..., j kB B B , me gjatësi të njëjtë l , të
tillë që kl n , ku ( 1) 1 ( 1) 2 ( 1), , ..., j l j l j l j lB X X X , për 1, 2, ..., j k . Më tej,
procedura vazhdon si në rastin e përgjithshëm. Për këtë metodë përdoret shkurtimi
NBB (Non-overlapping Block Bootstrap).
Figura 2.1 Formimi i blloqeve tek metodat MBB dhe NBB.
Figura 2.1 tregon një ilustrim të mënyrës së formimit të blloqeve tek metodat MBB
dhe NBB.
2.2.3 Bootstrap stacionar
Dy teknikat e mësipërme mund të prodhojnë seri bootstrap që nuk janë stacionare dhe
kërkojnë ndonjë rregullim gjatë bashkimit të blloqeve. Për më tepër vlerësimi
bootstrap për mesataren është i zhvendosur, d.m.th. *( \ )tE X X X .
Politis dhe Romano (1994) përshkruan procedurën e bootstrapit stacionar (SB,
Stationary Bootstrap), e cila ka marrë emërtimin stacionar në saj të faktit që kjo
procedurë garanton që seria e rizgjedhur bootstrap të jetë stacionare kur seria fillestare
është e tillë. Teknika e bootstrapit stacionar mund të përshkruhet si më poshtë.
49
Për të ndërtuar bllokun jB , zgjidhet rastësisht një vlerë
jX dhe merren jl vlerat e
njëpasnjëshme 1 1, , ..., jj j j lX X X , ku
jl zgjidhet rastësisht nga një ndryshore rasti
me shpërndarje gjeometrike me parametër të fiksuar p. Për të zgjedhur çdo vlerë të
serisë së vrojtuar me të njëjtin probabilitet konsiderohet që të dhënat të jenë në një
rreth, pra njëra pas tjetrës (si te teknika CB). Më tej procedura vazhdon si në rastet e
mëparshme.
Metoda SB përdor blloqe me fillim të rastit dhe me gjatësi të rastit. Pra gjatësia
mesatare (e pritshme) e blloqeve të përdorur është 1
lp
. Tregohet se kjo procedurë
garanton që seria bootstrap të jetë gjithmonë stacionare. Gjithashtu në këtë rast
vlerësuesi i mesatares së zgjedhjes është i pazhvendosur. Por, nga ana tjetër, për shkak
të gjatësive të rastit, pritet që të rritet dispersioni i vlerësuesve.
Supozojmë se interesohemi për vlerësimin e një parametri të popullsisë që prodhon
serinë e vrojtuar. Gjatësia l e bllokut luan rol të rëndësishëm në shpërndarjen e
vlerësimit bootstrap të parmetrit , pra dhe në shpërndarjen e vlerësuesit të përftuar
(e quajmë vlerësuesi bootstrap). Një gjatësi e madhe e blloqeve zvogëlon dispersionn
e vlerësuesit por rrit zhvendosjen, sepse kemi më pak blloqe në dispozicion për
rizgjedhje. Pra, zgjedhja e gjatësisë së bllokut është një marrëveshje (kompromis;
trade-off) ndërmjet dispersionit dhe zhvendosjes. Për të imituar sa më besnikërisht
varësinë e serisë tentojmë të marrim blloqe sa më të gjatë; por për të pasur sa më
shumë efektin e rizgjedhjes bootstrap tentohet për gjatësi të vogla të blloqeve.
Struktura e varësisë luan gjithashtu një rol të rëndësishëm dhe ne presim që me rritjen
e varësisë të përdorim gjatësi të bllokut sa më të madh, për të ruajtur sa më shumë
varësinë brenda tyre.
Kunsch (1989), ashtu sikurse dhe Carlstein (1986), thekson se përcaktimi i gjatësisë l
është një çështje tepër delikate dhe tregon rëndësinë e faktit që kjo gjatësi duhet të
shkojë në infinit kur n shkon në infinit, por në një shkallë më të ngadaltë, d.m.th.
lim dhe lim 0n n
ll
n (2.5)
Zakonisht preferohet një gjatësi e bllokut e cila minimizon gabimin katror mesatar,
MSE (Mean Squared Error), që përcaktohet nga barazimi
22 2
0 0ˆ ˆ ˆ ˆ ˆ ˆ( ) ( ) ( ) ( ) ( ) [ ( )]
MSE E D E D (2.6)
ku me ( ) shënojmë zhvendosjen e vlerësuesit në shqyrtim. MSE merr në
konsideratë minimizimin e njëkohshëm të dispersionit dhe zhvendosjes së vlerësuesit.
Por jo gjithmonë është e mundur gjetja e vlerës optimale të gjatësisë së bllokut, që
minimizon MSE e vlerësuesit në shqyrtim. Përcaktimi i gjatësisë së bllokut është një
problem shumë delikat, që varet nga rasti në rast.
Nga simulime të kryera rezulton se përcaktimi i gjatësisë së pritshme p tek metoda
SB është më pak problematik se sa përcaktimi i gjatësisë së fiksuar l në metodat MBB
dhe NBB, në kuptimin që një vlerë e “gabuar” e saj ka më pak efekt në rezultatet
përfundimtare. Një arsye për këtë është se gjatësia e pritshme e bllokut tek metoda SB
mund të konsiderohet si një mesatare e gjatësive të ndryshme (por të fiksuara) të
metodave të tjera. Pra dhe vlerësimi i gjetur me metodën SB mund të shikohet si një
mesatare e disa vlerësimeve të mara nga ndonjë metodë me gjatësi të fiksuar të
50
bllokut, por e zbatuar për një varg vlerash të gjatësisë së bllokut l (shih Politis dhe
Romano, 1994).
Për një krahasim teorik të metodave bootstrap me blloqe të mësipërme shih Lahiri
(1999)
2.3 Bootstrap parametrik
Në se paraprakisht dimë që seria është gjeneruar nga një proces linear, p.sh. nga një
proces ARMA(p,q), atëherë është e mundur që të vlerësojmë mbetjet e këtij procesi
në bazë të serisë së vrojtuar. Në se supozojmë se modeli është specifikuar në mënyrë
të saktë dhe kur vlerësimet e parametrave të modelit janë konvergjentë dhe të pa
zhvendosur, atëherë mbetjet e përftuara janë me shpërndarje (ose shpërndarje
asimptotiket) të njëjtë dhe të pavarur. Ky rast është mjedisi perfekt për të zbatuar
bootstrapin standard. Atëherë seritë bootstrap mund të përftohen në mënyrë rekursive
duke përdorur mbetjet e rizgjedhura bootstrap. Megjithëse procedura duket e thjeshtë
janë treguar mënyra të ndryshme për realizimin e saj dhe duhet treguar kujdes i
veçantë kur seria nuk është stacionare. Një sugjerim (shih Lahiri, 1992) është që
mbetjet e vlerësuar të qendërzohen para se të rizgjidhen (pra në vend të mbetjeve ̂ të
marrim mbetjet ˆj j ). Një procedurë e përgjithshme e bootstrapit parametrik
jepet si më poshtë.
Hapi 1. Nga të dhënat që kemi vrojtuar, zgjedhim një model sa më të përshtatshëm
(p.sh. një model AR(p) ) duke përdorur kriteret e përcaktimit të modelit më të mirë
(p.sh. AIC, BIC, etj.)
Hapi 2. Bazuar në modelin e përcaktuar, vlerësojmë parametrat e modelit (p.sh. me
metodën e përgjasisë maksimale) si dhe mbetjet e tij.
Hapi 3. Kryejmë rizgjedhje bootstrap nga bashkësia e mbetjeve të vlerësuara.
Hapi 4. Përdorim vlerësimet e hapit 2 për të ndërtuar (përftuar) pseudoserinë
bootstrap e kërkuar.
Edhe pse procedura e mësipërme duket mjaft e thjeshtë, në fakt ka mjaft mënyra për
të realizuar atë. Në mënyrë të veçantë duhet pasur kujdes në rastin kur të dhënat janë
jostacionare. Ne do japim disa detaje të bootstrapit parametrik për rastin e proceseve
autoregresive, AR(p), dhe autoregresive me mesatare rrëshqitëse, ARMA(p,q). Por,
megjithatë, është e mundur të përdoret bootstrapi parametrik edhe për proceset
autoregresive të paqëndrueshëm (unstable) dhe shpërthyese (explosive) (për më
shumë detaje shih Lahiri, 1992).
Ka shumë punime për bootstrapin e bazuar tek modeli (pra bootstrapin parametrik).
Një punim interesant është ai i Bose (1988). Ai tregoi se shpërndarja bootsrtap e
parametrave të autoregresit është më efikase se sa përafrimi normal. Datta dhe Sriram
(1997) përafruan shpërndarjen e vlerësuesit të katrorëvë më të vegjël të parametrit 1
të një procesi AR(1), përafrim i cili është i vlefshëm për çdo vlerë të 1 edhe pse
procedurat bootstrap zakonisht dështojnë për proceset jo stacionare, d.m.th. kur
1 1 . Për rastin e modeleve AR(p), bootstrapi parametrik konsiston si më poshtë.
Kujtojmë se modeli AR(p) ka formën e përgjithshme sipas barazimit
( ) t tB X (2.7)
51
ku ( )B është përcaktuar nga polinomomi i rendit p, 2
1 2( ) 1 ... p
pz z z z ,
dhe t është një varg ndryshoresh rasti të pavarura me shpërndarje të njëjtë me
mesatare zero dhe dispersion 2 . Pa humbur përgjithësimin mund të supozojmë që
0 dhe 2 1 . Me këto supozime inovacionet e serisë mund të vlerësohen
nëpërmjet barazimeve rekursive:
1 1ˆˆ ...t t t p t pX X X , për 1, 2, ..., t p p n (2.8)
ku ˆ , 1, 2,...,i i p janë vlerësues të qëndrueshëm të parametrave , 1, 2,...,i i p
(p.sh. vlerësuesit e katrorëve më të vegjël). Lahiri (1992) sugjeri që të qëndërzohen
këto mbetje: ˆt t për 1, 2, ...,t p p n , ku
1
1ˆ
n
t
t pn p
. Duke
supozuar se mbetjet e qendërzuara janë i.i.d., është e mundur që të gjenerojmë mbetjet
(inovacionet) bootstrap t duke rizgjedhur njëtrajtësisht, me kthim, nga bashkësia
1...,p n . Atëherë, seria bootstrap përftohet nga barazimet rekursive:
1 1ˆ ˆ...t t p t p tX X X
, për 1,...,t p n (2.9)
Shpesh është e zakonshme të kemi një reduktim të barazimit të mësipërm për p vlerat
e para (p.sh. 1 1X , vetë vlera e parë bootstrap e zgjedhur, 2 1 1 2ˆX X ,...,
1 1 1 1ˆ ˆ...p p pX X X
). Në se mbetjet janë (ose supozohet se janë) me shpërndarje
normale, atëherë është e mundur të gjenerojmë inovacionet bootstrap nga një
shpërndarje normale me pritje zero dhe dispersion sa vlerësimi i dispersionit së
inovacioneve të vlerësuara 2 ˆˆtD .
Performanca e bootstrapit për proceset ARMA, që shprehen nga barazimi
t tB X B , është shumë i ngjashëm si bootstrapi i një procesi thjesht
autoregresiv. Formula që jep mbetjet në këtë rast jepet nga barazimi
1 1
1 0
ˆˆpt
t j k t j k
j k
X
(2.8a)
ku 0ˆ 1 , ˆ , për 1,...,k k p dhe ˆ , për 1,...,j j q janë vlerësime konvergjentë të
parametrave përkatës të autoregresit dhe të mesatares së lëvizshme, ndërsa
keoficientët j janë të tillë që 1
0
ˆj j
j
z z
(pra është e anasjella e B , ose
seria polinomiale e zbërthimit të 1
B).
Kjo metodë është e përshtatshme për një klasë të ngushtë procesesh, pra për proceset
lineare, dhe jep rezultate shumë të mira kur modeli është përcaktuar në mënyrë të
drejtë, përndryshe seria e përftuar nga rizgjedhjet bootstrap nuk ka të njëjta veti si
seria e vrojtuar (Davison dhe Hinkley, 1997).
52
2.4 Bootstrap sitë
Një kompromis midis bootstrapit parametrik dhe atij jo parametrik është përdorimi i
të ashtuquajturit bootstrapi sitë (sieve bootstrap). Edhe metoda bootstrap sitë simulon
nga modele të përcaktuar (që shpesh janë modele AR(p) ), por ne realisht nuk i
“besojmë” atyre. Ne thjesht kërkojmë prej modeleve të përdorur që të jenë relativisht
të thjeshtë për tu vlerësuar dhe për tu simuluar dhe njëkohësisht të jenë mjaftueshëm
fleksibël në mënyrë që të mbulojnë një gamë të gjerë proceses duke përdorur një
“sitë” vlerash të parametrave të tyre.
Çdo proces linear i kthyeshëm ka një paraqitje të formës AR(∞).
Kreiss (1992) shfrytëzoi këtë veti për të ndërtuar një metodë bootstrap që rizgjedh
(kopjon) proceset lineare të trajtës
0
t X j t j
j
X
(2.10)
ku 0 1 , t Z , vargu i koeficientave 0{ }j j
zvogëlohet në mënyrë eksponenciale
dhe { }t t Z është një varg ndryshoresh rasti i.i.d. me pritje matematike zero.
Ideja e kësaj metode është përafrimi i procesit të vrojtuar tX me një proces AR me
parametër të fundmë dhe, mbështetur në këtë model, zbatimi i një procedure të
ngjashme me bootstrapin parametrik si tek paragrafi i mësipërm 2.3. Në një punim të
mëvonshëm, Buhlmann (1997) shkroi se, duke e parë përafrimin autoregresiv si një
sitë për procesin me parametër të pafundëm (prej nga kemi vrojtuar tX ), procedura
bootstrap e sugjeruar nga Kreiss është e çliruar nga përcaktimi apriori i modelit dhe
mund të shihet si një procedurë joparametrike. Bootstrapi sitë është teknikisht i
thjeshtë dhe jep zgjedhje bootstrap që janë asimptotikisht stacionare dhe pa efekte në
strukturën e varësisë. Buhlmann (1997) tregoi se dispersioni i pritjes matematike
paraqet një shkallë të lartë konvergjence në rastin kur varësia ndërmjet vrojtimeve të
largëta zvogëlohet mjaftueshëm shpejt. Kjo metodë zbatohet për proceset lineare të
formës (2.10) dhe konsiston si më poshtë.
Le të jetë { , }tX t Z një proces stacionar me vlera reale me pritje matematike
( ) t XE X , i cili mund të paraqitet në trajtën AR(∞) sipas barazimit
0
( )j t j X t
j
X
(2.11)
me 0 1 dhe 2
0
j
j
(konvergjente).
Kur kemi vrojtuar zgjedhjen 1 2, , ..., nX X X algoritmi ndjek hapat e mëposhtme.
Hapi 1. Nga zgjedhja e vrojtuar 1{ , ..., }nX X përcaktojmë rendin ( )p p n të një
procesi AR(p), që modelon të dhënat (p.sh. duke përdorur kriterin e informacionit
BIC, AIC ose AICC, shih Brockwell dhe Davis, 1991, paragrafi 9.3). Rendi ( )p p n
duhet të plotësojë kushtet
( )p n dhe ( )
0p n
n , kur n (2.12)
53
Hapi 2. Vlerësojmë koeficientët 1 2ˆ ˆ ˆ, , ..., p , që i korespondojnë modelit AR(p)
të përzgjedhur. Zakonisht (por jo detyrimisht) ky vlerësim kryhet me anë të
ekuacioneve Yule–Walker (shih Brockwell dhe Davis, 1991). Theksojmë se në këtë
hap ne duhet që së pari të qendërzojmë serinë duke zbritur mesataren e zgjedhjes X .
Hapi 3. Njehsojmë mbetjet e modelit:
0
ˆˆ ( )p
t j t j
j
X X
, ku 0ˆ 1 , për { 1,,..., }t p n (2.13)
Hapi 4. Njehsojmë mbetjet e qendërzuara ˆ ˆt t t , ku
1
1ˆ ˆ
n
t t
t pn p
.
Hapi 5. Njehsojmë funksionin e shpërndarjes empirike të mbetjeve të qendërzuara
[ , ]
1
1ˆ ( ) ( )t
n
t p
F x I xn p
(2.14)
ku ( )AI është funksioni tregues i bashkësisë A.
Hapi 6. Kryejmë rizgjedhje bootstrap me kthim duke iu përshtatur funksionit të
shpërndarjes së mbetjeve (2.14) dhe përftojmë zgjedhjen bootstrap *{ , 1,2,..., }t t n
me vrojtime i.i.d. nga shpërndarja empirike F̂ .
Hapi 7. Përcaktojmë serinë bootstrap, *
tX , nëpërmjet formulave rekursive
* * *
1
ˆ ( )p
t j t j t
j
X X X
(2.15)
për 1,...,t p n , ndërsa p vlerat e para i marrim të barabarta me zero (ose me
mesataren X në se nuk do kishim qendërzuar serinë paraprakisht).
Hapi 8. Njehsojmë statistikën bootstrap * *ˆ ( )b tT X për rizgjedhjen bootstrap.
Hapi 9. Përsëritim hapat 5−8, Q herë dhe, më tej kryejmë vlerësimet bootstrap.të
dëshiruara.
Në rastin kur qëllimi i studimit statistikor është parashikimi i serisë kohore, rizgjedhja
bootstrap e mësipërme nuk është efektive, sepse ajo nuk e përsërit (kopjon)
shpërndarjen me kusht të parashikimit T hX kur njohim të dhënat. Por, në se fiksojmë
p vrojtimet e fundit, ne mund të përftojmë rizgjedhje të vlerave të ardhshme bootstrap *
T hX me kusht kur jepen vlerat
* *
1 1,...,T p T p T TX X X X (Cao etj., 1997). Atëherë,
në rastin e parashikimit hapi 8 do kryhet si më poshtë.
Hapi 8.a. Duke pasur serinë bootstrap *
tX , rivlerësojmë koeficientët* * *
1 2( , ,..., )T
p
si tek hapi 2.
Hapi 8.b. Njehsojmë vrojtimet e ardhshme bootstrap sipas formulave rekursive
* * * *
1
ˆ ( )p
T h j T h j t
j
X X X X
, ku 0h dhe *
t tX X , për t T .
54
Hapi 8.c. Së fundmi, shpërndarja bootstrap *
*
T hXF
e *
T hX do të përdoret për të
përafruar shpërndarjen e panjohur *
*
T hXF
të T hX me kusht kur jepen vrojtimet
1{ ,..., }nX X . Intervali i besimit për parashikimin T hX me nivel besimi 1 është
* *( / 2), (1 / 2)Q Q , ku *( )Q tregon kuantilet e shpërndarjes bootstrap *
*
T hXF
(shih intervalin PB në paragrafin pasardhës).
Për disa veti asimptotike të bootstrapit sitë shih Bickel dhe Buhlmann (1999).
2.5 Vlerësimi intervalor bootstrap
Vlerësimi intervalor i parametrave është një nga analizat statistikore më të përdorura
në statistikë. Ai kombinon vlerësimin pikësor dhe kontrollin e hipotezave në një
analizë statistikore të vetme (të përbashkët) duke na dhënë një vlerësim të
“besueshëm” të pasigurisë së vlerësimeve (pikësore) të parametrave. Shpesh
vlerësimet intervalore mbështeten në shpërndarjet asimptotike të ndonjë vlerësuesi
(mbështetës) ose tek përafrimi normal i tyre (nga teorema qendrore limite). Por, kur
vlerësuesi i përdorur konvergjon “ngadalë” tek shpërndarja asimptotike e tij ose kur
përafrimi normal nuk është i vlefshëm, vlerësimet e përftuara nuk janë të vlefshëm.
Ky është pikërisht rasti i “ideal” për të përdorur metodat bootstrap.
Gjetja e intervaleve të besimit për parametrin e memories të gjatë është një problem i
rëndësishëm ende i hapur në analizën e serive me memorie të gjatë. Në literaturë
përdorimi i metodave bootstrap për vlerësimin parametrit të memories së gjatë po
bëhet gjithnjë dhe më i pranishëm. Mund të përmendim Hesterberg (1997),
Kapetanios dhe Psaradakis (2006), Silva etj. (2006), Arteche dhe Orbe (2009), Kim
dhe Nordman (2011), Kapetanios dhe Papailias (2011), Arteche dhe Orbe (2014).
Një metodë e përgjithshme për ndërtimin e një interval besimi të parametrit θ për të
cilin interesohemi është gjetja e një funksioni të një vlerësuesi dhe të parametrit,
funksioni i shpërndarjes të të cilit është i njohur dhe i pavarur nga vlera e vërtetë e
parametrit. Një funksion i tillë quhet shpesh funksion mbështetës (pivot). Atëherë,
duke përdorur kuantilet e kësaj shpërndarje të njohur ne gjejmë intervalin e besimit
për parametrin e interesuar. Megjithatë, në mungesë të njohjes së shpërndarjes
( ; )XF x , nga e cila janë vrojtuar të dhënat e zgjedhjes, shpesh nuk është e lehtë
përcaktimi i funksionit mbështetës. Megjithatë shumë vlerësuesa janë me shpërndarje
asimptoikisht normale rreth pritjes matematike të tyre. Kështu që intuitivisht,
statistika ˆW zgjidhet si funksion mbështetës. Problemi është se në praktikë
ndodh që shpërndarja e statistikës W është e panjohur. Parimi i bootstrapit na lejon që
ne të vlerësojmë shpërndarjen e statistikës W me anë të shpërndarjes bootstrap të
statistikës * ˆ ˆW x (siç arsyetuam tek paragrafi 2.1) shpërndarjen e së cilës e
vlerësojmë me metodën Monte Carlo.
Në vazhdim ne po paraqitim shkurtimisht intervalet e besimit bootstrap që përdoren
më shpesh. Le të supozojmë se duke kryer procedurën bootstrap me një nga teknikat
bootstrap të përshkruar në paragrafet 2.2-2.5, ne kemi gjetur vlerësimin e zgjedhjes ̂x
si dhe vlerësimet bootstrap ˆ : 1, ..., b b Q , të cilat i renditim duke marrë
bashkësinë e vlerësimeve të renditura, që i shënojmë (1) (2) ( )ˆ ˆ ˆ... Q . Me
55
simbolin ˆ , për (0,1) shënojmë 100α kuantilin (percentile) e shpërndarjes
bootstrap ˆ : 1, ..., b b Q , të cilin e njehsojmë sipas barazimit ( )ˆ ˆ
Q me
supozimin se αQ është numër i plotë (në se jo, mund të përdorim një përafrim).
Atëherë intervalet e besimit bootstrap me nivel 1 jepen si më poshtë.
a) Intervali bootstrap i zakonshëm.
Inervali bootstrap i zakonshëm, që quhet shpesh dhe intervali bazë bootstrap (Basic
Bootstrap), është një nga intervalet e parë të përdorur nga metodat bootstrap. Duke
interpretuar shpërndarjen e statistikës bootstrap * ˆ ˆW x si vlerësues për
shpërndarjen e ˆX , ne mund të gjejmë një interval simetrik besimi me nivel α për
parametrin θ nëpërmjet barazimit të mëposhtëm.
1 /2 /2ˆ ˆ ˆ ˆ(1 ) 2 , 2
BB x x (2.16)
Davidson dhe Hinkley (1997) treguan se ky interval besimi jep vlerësime të mira për
mesoren (Davidson dhe Hinkley, 1997, tabela 2.4)
b) Intervali bootstrap i përqindjes.
Intervali bootstrap i përqindjes (PB, Percentile Bootstrap) është shumë i përdorshëm
në literaturë sepse ai është i thjeshtë në ndërtim dhe mund të përdoret për çdo
statistikë, si dhe jep vlerësime të vlefshme kur shpërndarja bootstrap është simetrike.
Për të ndërtuar intervalin e besimit të përqindjes ne thjesht marrim kuantitet e vlerave
bootstrap të statistikës për të cilën interesohemi.
/2 1 /2ˆ ˆ(1 ) ,
PB (2.17)
Ky interval është shumë i thjeshtë në ndërtim dhe ka vetinë (e preferuar) për të qenë
invariant gjatë transformimeve monotonë të parametrit. Kjo nënkupton që nëse ( )g
është një funksion monoton atëherë intervali i besimit për parametrin ( )g është
transformimi g i intervalit të besimit i parametrit θ, pikërisht intervali
/2 1 /2ˆ ˆ( ), ( )
g g . Megjithatë, Efron dhe Tibshirani (1993) kanë treguar se gabimi i
mbulimit të intervalit PB mund të jetë esencial (thelbësor) në se shpërndarja e ̂ nuk
është afërsisht simetrike.
c) Intervali bootsrap-t.
Ky interval njihet dhe si intervali i percentilit-t, ose intervali bootstrap i studentizuar.
Për të përdorur këtë interval duhet që krahas vlerësimit ˆb të gjejmë dhe një vlerësim
të gabimit standard të tij ˆˆ
b
, për çdo seri bootstrap. Kjo është e mundur në se ne
njohim një vlerësues 2
ˆˆ
të dispersionit të vlerësuesit ̂ ose duke përdorur përsëri
metodën bootstrap për të gjetur një vlerësim bootstrap të dispersionit të ˆb (teknika
në këtë rast quhet dhe bootstrap i dyfishtë (double bootstrap), shih Davidson dhe
Hinkley, 1997, kapitulli 2 dhe 3, ose Efron dhe Tibshirani, 1993, paragrafi 12.5).
56
Në se shënojmë ˆˆ ˆˆ ˆ( ) /
bb bt
x për çdo përsëritje bootstrap ne përftojmë statistikat
e renditura (1) (2) ( )ˆ ˆ ˆ... Qt t t . Atëherë, intervali bootsrap-t jepet nga barazimi
ˆ ˆ1 /2 /2ˆ ˆˆ ˆˆ ˆ(1 ) ,
Bt t tx x (2.18)
ku ˆˆ
është një vlerësim i gabimit standard për vlerësuesin ̂ (ndoshta i gjetur dhe
me teknikën bootstrap), ndërsa t̂ tregon α-percentilin e shpërndarjes
(1) (2) ( )ˆ ˆ ˆ... Qt t t .
Ky interval mund të japë rezultate të “këqija” në qoftë se vlerësimet e gabimit
standard janë të pasakta. Gjithashtu ky interval nuk është invariant kundrejt
transformimeve monotonë.
d) Intervali bootstrap i korrigjuar për zhvendosjen (BC, Bias Corrected)
Ky interval është propozuar nga Efron (Efron, 1982, paragraf 10.7) me qëllim
përmirësimin e performancës së intervalit PB për rastet e shpërndarjeve jo simetrike.
Në literaturë përdoret shënimi intervali BC. Ndërtimi i intervalit BC realizohet si më
poshtë.
Përcaktojmë numrin e vlerësimeve bootstrap ˆ{ , 1, 2, ..., }b b Q , që janë më të
vegjël ose baras me vlerësimin e zgjedhjes, ̂X . Në se shënojmë këtë numër me p,
njehsojmë koeficientin e korrigjimit të zhvendosjes sipas barazimit 1( / )b p Q , ku
është funksioni i shpërndarjes së ndryshores normale standarde. Atëherë, intervali
BC është i formës
ˆ ˆˆ ˆ(1 ) ,
m dBC (2.19)
ku /2ˆ (2 )m b z dhe 1 /2
ˆ (2 )d b z (2.20)
Intervali PB është rast i veçantë i intervalit BC, që merret kur 0b .
e) Intervali bootstrap i korrigjuar për zhvendosjen dhe i përshpejtuar (BCa, Bias
Corrected and accelerated).
Problemet e shfaqura me intervalet BC ndikuan që Efron (1987) të zhvillonte metodën
e intervaleve BCa. Ideja e këtij intervali është që të merret parasysh jo vetëm mungesa
e simetrisë së shpërndarjes (siç ndodh me intervalet BC) por gjithashtu edhe fakti që
forma ose asimetria mund të ndryshojë për vlera të ndryshme të parametrit θ.
Ndërtimi i intervaleve BCa kërkon vlerësimin e dy parametrave:
-të parametrit të korrigjimit të zhvendosjes b, i cili vlerësohet njësoj si tek intervalet
BC, dhe
-të parametrit të përshpejtimit, që shpesh shënohet me a.
Njehsimi i parametrit të përshpejtimit është më i ndërlikuar dhe varet në se simulimet
bootstrap janë joparametrike apo parametrike dhe, për rastin e fundit, në se ekzistojnë
apo jo parametra pengues. Më poshtë po japim një vlerësim me metodën jackknife të
parametrit të përshpejtimit, a, që përdoret shpesh në simulimet joparametrike (për më
tepër shih Efron dhe Tibshirani, 1993 ose Davison dhe Hinkley, 1997).
57
Për çdo 1,2,...,i n largojmë nga zgjedhja 1 2( , ,..., )nx x xx vrojtimin ix (e i-të
) dhe
me vrojtimet e ngelura gjejmë vlerësimin 1 1 1ˆ ( ,..., , ,..., )i
i i nT x x x x x Shënojme
1
1 ˆn
i
Jack
in
x mesataren e vlerësimeve të mësipërme. Atëherë parametri i
përshpejtimit vlerësohet nëpërmjepet barazimit
3
1
3/22
1
ˆ
ˆ6
ni
jack
i
ni
jack
i
a
x
x
(2.21)
Atëherë, me shënimet e mësipërme intervali BCa jepet sipas barazimit
ˆ ˆ(1 ) , m d
BCa (2.22)
ku /2
/21 ( )m
b zb
a b z
dhe 1 /2
1 /21 ( )d
b zb
a b z
(2.23)
Intervali BC është rast i veçantë i intervalit BCa që merret për 0a .
Përzgjedhja e metodës më të përshtatshme për gjetjen e intervalit të besimit bootstrap
varet nga parametri që duam të vlerësojmë si dhe nga metoda bootstrap e përdorur. Në
praktikë, më të preferuar janë intervalet PB dhe BCa; i pari për thjeshtësinë në
përdorim dhe i dyti për rendin e ulët të probabilitetit të gabimit të mbulimit (i cili
është i rendit 1( )O n ).
Për udhëzime praktike rreth përzgjedhjes së llojit të intervalit shih Carpenter dhe
Bithell (2000), figura 4 dhe figura 5.
Në kapitullin 3 ne do përdorim pikërisht intervalet PB dhe BCa për të bërë një
krahasim të performancave të metodave bootstrap me blloqe në vlerësimin intervalor
të parametrit të memories së gjatë.
2.6 Metoda bootstrap dhe kontrolli i hipotezave
Metodat boostrap janë bërë gjithnjë e më të përdorshme për kryerjen e verifikimit të
hipotezave statistikore. Hall dhe Horowitz (1996) treguan se përdorimi i metodave
bootstrap për kontrollin e hipotezave shpesh shfaqin gabime më të vogla se sa
metodat që mbështeten tek analiza asimptotike. Ky fakt është më i dukshëm për
zgjedhje me vëllim relativisht të vogël. Ekzistojnë disa mënyra të ndryshme të
kryerjes së procedurave bootstrap të kontrollit të hipotezave, por më shpesh përdoret
metoda e probabilitetit kritik (p-vlerës) bootstrap.
Supozojmë se për të kryer një verifikim të hipotezave ne përdorim statistikën ̂ dhe
një zonë kritike të njëanshme të djathtë (pra hipoteza bazë refuzohet për vlera të
mëdha të statistikës së përdorur). Në se kemi zgjedhjen 1 2, , ..., nx x x , atëherë, duke
përdorur një nga teknikat bootstrap, gjejmë pseudoserinë bootstrap * * *
1 2, , ..., nx x x dhe,
duke përdorur të njëjtën statistikë, gjejmë vlerësimin bootstrap përkatës. Përsërisim
procedurën e rizgjedhjeve bootstrap Q herë dhe përftojmë vlerat bootstrap,
58
* * *
1 2ˆ ˆ ˆ, , ..., Q , të statistikës së përdorur. Atëherë, probabiliteti kritik bootstrap
vlerësohet nga barazimi
* *
ˆ] , [1
1( )
Q
j
j
p IQ
(2.24)
ku ( )AI është funksioni tregues i bashkësisë A.
Për të përftuar kritere të vlefshme kërkohet që rizgjedhjet bootstrap të kryhen nën
supozimin kur hipoteza bazë është e vërtetë. Gjithashtu sugjerohet që statistika e
përdorur të jetë një funksion mbështetës (pivot).
Për konkretizim le të shohim një shembull të thjeshtë.
Shembull 2.1
Supozojmë se duam të kontrollojmë hipotezat për barazimin e dy pritjeve matematike
të dy ndryshoreve të rastit X dhe Y sipas formulimit
0 1: kundrejt :X Y X YH H (2.25)
Atëherë, procedura bootstrap për vlerësimin e probabilitetit kritik, konsiston si më
poshtë:
Hapi 1. Kryejmë një zgjedhje rasti 1 2( , , ..., )nx x xx nga ndryshorja X dhe një
zgjedhje 1 2( , , ..., )my y yy nga ndryshorja Y.
Hapi 2. Njehsojmë statistikën t̂ x y , ku x dhe y janë mesataret e zgjedhjes
përkatëse.
Hapi 3. Bashkojmë dy zgjedhjet e mësipërme në një zgjedhje të vetme me vëllim
n m ; le ta shënojmë 1 2( , , ..., )n mz z z z ku renditja nuk ka rëndësi.
Hapi 4. Kryejmë n rizgjedhje me kthim nga zgjedhja e bashkuar z duke përftuar një
zgjedhje me vëllim n, të cilën e konsiderojmë si zgjedhje bootstrap nga zgjedhja x.
Pra përftojmë zgjedhjen bootstrap * * *
1 2( , , ..., )nx x x*x (ku mund të ketë vlera nga
zgjedhja x ose y) Njehsojmë mesataren e kësaj zgjedhje * *
1
1 n
j
j
x xn
. Njësoj
veprojmë për të përftuar zgjedhjen bootstrap y* dhe mesataren përkatëse bootstrap
* *
1
1 m
j
j
y ym
. Së fundmi njehsojmë statistikën bootstrap
* * *t x y (2.26)
Hapi 5. Përsëritim hapin 4, Q herë dhe përftojmë Q vlera * * *
1 2, , ..., Qt t t të statistikës
së kontrollit.
Hapi 6. Atëherë, p-vlera e kërkuar merret (vlerësohet) nga barazimi
*
ˆ] , [1
1* ( )
Q
jtj
p I tQ
(2.27)
Pra p-vlera bootstrap është raporti i numrit të herëve kur statistika bootstrap është më
e madhe se statistika e zgjedhjes mbi përsëritjet totale bootstrap.
59
Hapi 7. Së fundmi, për një nivel të përcaktuar , hipoteza zero refuzohet në se
*p , ose pranohet në se *p .
Për më tepër informacion rreth përdorimit të metodave bootstrap në verifikimin e
hipotezave mund të referohemi tek Davison dhe Hinkley (1997), Efron dhe Tibshirani
(1993), Hall dhe Wilson (1991), MacKinnon, (2007), Davidson dhe MacKinnon
(2000), ndër të tjerë.
Kapitulli 3
3 METODA BOOTSTRAP ME BLLOQE ME CIKLE
Lahiri (1993) ka treguar se, në përgjithësi, procedura bootstrap me blloqe të lëvizshme
(MBB), e përdorur në rastin kur seria kohore përmban memorie të gjatë, nuk jep një
përafrim të vlefshëm të shpërndarjes së mesatares së normalizuar të serisë. Një nga
arsyet që kjo ndodh është fakti se bashkimi i blloqeve të pavarura gjatë formimit të
rizgjedhjes bootstrap e prish (shkatërron) varësinë e fortë përgjatë vrojtimeve.
Megjithëse blloqet e të dhënave janë të varura në serinë kohore origjinale, ato janë të
pavarura në serinë bootstrap. Kjo shkakton zhvendosje të vlerësimeve bootstrap, e cila
mund të jetë e madhe në se varësia e të dhënave është e fortë.
Metoda të ndryshme bootstrap me blloqe janë përdorur për vlerësimin e parametrave
të modeleve ARFIMA(p,d,q) (shiko për shembull Hesterberg, 1997, Carlstein etj.,
1998, Franco dhe Reisen 2004, Silva etj. 2006, Arteche dhe Orbe, 2009, 2014).
Carlstein etj. (1998) kreu rizgjedhje të blloqeve bootstrap duke synuar që çdo bllok i
rizgjedhur të ndiqej nga ndonjë bllok bootstrap me kufiza të para (fillimit) sa më të
“ngjashme” për të qenë tek blloku ndjekës i tij në serinë e vrojtuar. Nëpërmjet kësaj
procedure bootstrap, të quajtur bootstrap me blloqe të përshtatshëm (M-BB, Matched-
Block Bootstrap), synohet që struktura e varësisë së serisë së vrojtuar të ngjasojë (të
shkojë, të përshtatet) sa të mundet me strukturën e varësisë së serisë bootstrap të
përftuar. Hesterberg (1997) e përdori këtë metodë bootstrap për proceset me memorie
të gjatë dhe shqyrtoi rregulla të bashkimit të blloqeve, që mbështeten në kombinime
lineare të vrojtimeve në secilin bllok.
Në këtë kapitull ne prezantojmë një teknikë bootstrap me blloqe për të kryer
rizgjedhje të serive kohore stacionare. Blloku është i përbërë nga cikle. Një cikël
quhet një çift vargjesh vrojtimesh që formohet nga vrojtime të njëpasnjëshme më të
mëdha se mesatarja të ndjekur nga vrojtime të njëpasnjëshme më të vegjël se
mesatarja (ose anasjellas).
Paragrafi 3.1 përshkruan metodën bootstrap me blloqe të përbërë nga cikle dhe tregon
disa veti të saj. Disa konkluzione teorike dhe empirike rreth gjatësisë së ciklit jepen në
paragrafin 3.2. Paragrafi 3.3 përshkruan një eksperiment Monte Carlo për të verifikuar
empirikisht vlefshmërinë e teknikës bootstrap me blloqe me cikle për replikimin e
proceseve me memorie të gjatë.
60
3.1 Përcaktimi i blloqeve të përbërë nga cikle
Në këtë material, ne do konsiderojmë metodën bootstrap me blloqe të formuar nga një
ose më shumë cikle të njëpasnjëshme. Ideja e formimit të blloqeve me cikle është
marrë nga Park dhe Willemain (1999) dhe është përdorur për herë të parë (në dijeninë
tonë) për të imituar seritë me memorie të gjatë nga Ekonomi dhe Butka (2011).
Vlefshmëria e metodës bootstrap me blloqe të përbërë nga cikle në rastin e serive
stacionare me memorie të shkurtër është treguar nga Ekonomi dhe Butka (2014).
Le të jetë { , 1, 2, ..., }tX t n një seri kohore e vrojtuar, e gjeneruar nga një proces
stacionar. Përcaktojmë ciklin si një çift vargjesh të alternuar me vrojtime të
njëpasnjëshme “të larta” dhe “të ulëta” (sipër dhe poshtë), të cilat formohen kur
vrojtimet kapërcejnë (kalojnë) mesataren e zgjedhjes. Pa humbur përgjithësimin,
mund të supozojmë se mesatarja e zgjedhjes është zero dhe se kufiza e parë e serisë
është pozitive. Atëherë, cikli formohet nga një varg kufizash pozitivë i ndjekur nga
vargu pasardhës i kufizave negative.
Le t’i shënojmë me 1 2, , ..., kC C C ciklet e formuara dhe me 1 2, , ..., kn n n numrin e
kufizave për çdo cikël, përkatësisht. Pra kemi supozuar se janë formuar k cikle. Është
e qartë se 1
k
i
i
n n
. Atëherë, ne mund të shkruajmë ciklet në mënyrë më të shtjelluar
sipas barazimeve
11 1 2{ , , ..., }nC X X X , për ciklin e parë,
1 2 1 1 2 1 1 2 1... 1 ... 2 ...{ , , ..., }i i i ii n n n n n n n n n nC X X X , për 2,3, ..., 1i k , dhe
1 2 1 1 2 1... 1 ... 2{ , , ..., }k kk n n n n n n nC X X X për ciklin e fundit.
Kemi 1 2 ... 0
in n nX dhe 1 2 ... 1 0
in n nX për çdo 1, 2, ..., 1i k . Pra kur ne
vrojtojmë një kufizë negative të ndjekur nga një kufizë pozitive, atëherë kemi gjetur
mbarimin e një cikli dhe fillimin e ciklit pasardhës.
Pas përcaktimit të ciklit, ne përcaktojmë bllokun si tërësinë e një numri të fiksuar dhe
të paracaktuar ciklesh të njëpasnjëshme. Më tej, në mënyrë të njëjtë si tek metodat e
tjera bootstrap me blloqe (paragrafi 2.2), ne kryejmë rizgjedhje me kthim nga
bashkësia e blloqeve të krijuar dhe duke vendosur ato njëri pas tjetrit, përftojmë serinë
bootstrap. Blloqet mund të merren të ndarë, si tek metoda NBB, ose të lëvizshëm, si
tek metoda MBB. Gjithashtu, ne mund të konsiderojmë serinë të vendosur në një rreth
para përcaktimit të blloqeve dhe të kryejmë një teknikë të ngjashme si tek bootstrapi
rrethor, CB (shih paragrafi 2.2.1). Në të gjitha rastet cikli trajtohet si një vrojtim i
pandashëm.
Më tej, kur i referohemi kësaj metode, do të përdorim inicialet BBC (Bootstrap me
Blloqe me Cikle).
Me që ciklet, dhe rrjedhimisht dhe blloqet, janë krijuar në mënyrë automatike
nëpërmjet “kalimeve“ të serisë mbi dhe nën mesataren, ne presim që natyra
(struktura) e bashkimit ndërmjet blloqeve në pseudoserinë bootstrap të jetë më realiste
në kuptimin që imiton strukturën e serisë origjinale.
Në figurën 3.1 është ilustruar formimi i cikleve. Figura 3.1(a) tregon grafikun e një
serie kohore që e konsiderojmë si seri të vrojtuar (seria është simuluar nga një proces
ARFIMA(0, 0.3, 0) me mbetje normale N(0, 1.5) ). Në figurën 3.1(b) tregohen ciklet e
61
formuara, që janë veçuar njëra nga tjetra nëpërmjet drejtëzave vertikale me pika. Në
rastin e treguar në figurë, seria fillon dhe mbaron me kufizë në vlerë më të vogël se
mesatarja e zgjedhjes.
Figura 3.1 Ilustrim i formimit të cikleve.
Është e nevojshme të bëjmë shënimet e mëposhtme.
1. Në se kufiza e parë e serisë është negative, atëherë cikli do të përcaktohet si një çift
vargjesh me kufiza negative të ndjekur nga një varg kufizash pozitive.
2. Në se mesatarja e zgjedhjes nuk është zero, siç realisht ndodh, atëherë si kufi për
përcaktimin e ciklit do të përdoret mesatarja e zgjedhjes. Në këtë rast tek shënimet e
mësipërme fjala “zero” zëvendësohet me “mesatare” dhe fjalët “pozitive” dhe
“negative” zëvendësohen me “mbi mesataren” dhe “nën mesataren”, respektivisht.
3. Cikli i fundit i serisë mund të jetë i cunguar, në kuptimin që ai mund të përbëhet
vetëm nga kufiza me të njëjtën shenjë (ose nivel). Kjo ndodh në rastin kur kufiza e
parë e serisë dhe kufiza e fundit e serisë kanë shenjë (nivel) të njëjtë.
4. Numri i cikleve si dhe gjatësia e çdo cikli janë ndryshore të rastit, përderisa ata
përcaktohen automatikisht nga të dhënat.
62
5. Nga mënyra e përcaktimit të ciklit është evidente që, numri minimal i kufizave të
një cikli është 2 (me përjashtim të rastit kur cikli i fundit ka vetëm një kufizë), ndërsa
numri maksimal n. Prej këtej rrjedh se numri minimal i cikleve të serisë është 1 dhe
numri maksimal është 2
n
, ku me x shënojmë minimumin e numrave të plotë jo
më të vegjël se x (quhet edhe funksioni “tavan”). Pra kemi 1
12
nk
.
6. Numri i cikleve të një blloku përcakton gjatësinë e një blloku. Pra numri i cikleve të
një blloku është një parametër analog me gjatësinë e bllokut në metodat bootstrap me
blloqe të lëvizshme ose të ndara, apo me gjatësinë e pritshme të bllokut në metodën
bootstrap stacionar. Përcaktimi i tij është i rëndësishëm në performancës e metodës.
Megjithatë, me që gjatësia e ciklit është e rastit, në analogji me metodën e bootstrapit
stacionar, ne presim që performanca e bootstrap me blloqe me cikle të jetë relativisht
më pak e ndjeshme ndaj përcaktimit të numrit të cikleve për bllok se sa metodat
bootsrap me blloqe të lëvizshme ose të ndara janë të ndjeshme ndaj përcaktimit të
gjatësisë së bllokut.
Figura 3.2 Ilustrim i metodës bootstrap me blloqe me cikle.
63
Figura 3.2 ilustron metodën BBC. Ne e zbatuam këtë metodë për serinë e treguar në
figurën 3.1. Për qartësi të figurës ne përdorëm një cikël për bllok.
Në këtë rast blloku është i njëjtë me ciklin (gjithashtu metodat MBB dhe NBB janë të
njëjta). Në figurën 3.2(a) është paraqitur një rizgjedhje bootstrap, ndërsa blloqet e
rizgjedhur janë paraqitur në figurën 3.2(b). Duke vrojtuar figurat 3.1(b) dhe 3.2(b) ne
shohim se pikat e bashkimit të blloqeve në zgjedhjen bootstrap kanë strukturë të
ngjashme me pikat e bashkimit të blloqeve në serinë origjinale. Në të dy seritë pikat e
bashkimit kanë afërsisht të njëjta nivele kundrejt mesatares së zgjedhjes.
Siç përmendëm më sipër, ne presim që natyra e bashkimit ndërmjet blloqeve në
pseudoserinë bootstrap të jetë më realiste (në kuptimin që imiton strukturën e serisë
origjinale). Në figurën 3.3 kemi paraqitur një seri kohore të simuluar nga modeli
ARFIMA(1,d,0) me parametra 1 0.6 dhe d = 0.3, dhe nga një rizgjedhje bootstrap
me blloqe duke përdorur metodën BBC dhe metodat e përshkruara në paragrafin 2.2.
Mund të themi se rizgjedhja BBC e “imiton” më mirë, ose të paktën jo më keq,
strukturën e varësisë së serisë origjinale.
Figura 3.3 Grafikët e një serie të simuluar dhe e replikimeve të saj duke përdorur
metoda të ndryshme boostrap me blloqe.
64
3.2 Gjatësia e ciklit
Në këtë paragraf ne do trajtojmë disa rezultate teorike dhe empirike për gjatësinë e
ciklit të përcaktuar më sipër.
3.2.1 Disa konsiderata teorike
Shqyrtojmë fillimisht rastin kur seria është një zhurmë e bardhë.
Le të jetë { , 0, 1, 2, ...}t t një proces i zhurmës së bardhë me shpërndarje
normale me dispersion të çfardoshëm.
Njësoj si në paragrafin e mësipërm, përcaktojmë ciklin si bashkësinë e kufizave të
alternuara me shenjë pozitive me negative. Shënojmë me tL ndryshoren e rastit që
tregon gjatësinë e ciklit me fillim në momentin t Z . Atëherë, vlerat e mundshme të
ndryshores së rastit tL janë numrat e plotë pozitivë më të mëdhenj ose baras me 2.
Ligji i shpërndarjes së kësaj ndryshoreje rasti jepet sipas tabelës së mëposhtme (shih
Shtojca 1).
Tabela 3.1 Densiteti probabilitar i gjatësisë së ciklit të formuar nga një zhurme e
bardhë gausiane.
k 2 3 4 5 ...... k ......
( )tP L k 3
12
2
4
14
2
5
16
2
6
18
2 ......
1
2k
k ......
Pra shpërndarja e gjatësisë së një cikli nuk varet nga koha e fillimit të tij. Më tej do
flasim vetëm për kohë pozitive dhe shënojmë thjesht , = 1, 2, ...tL t , për të lehtësuar
indeksimin.
Duke shfrytëzuar barazimet
1
11
2kk
, 1
22k
k
k
, 2
1
62k
k
k
dhe 3
1
262k
k
k
(3.1)
(shih Shtojca 2) mund të bindemi që plotësohet kushti i densiteti probabilitar
2 2 2
1 1 1 12 1 1
2 2 2 2 2k k kk k k
k k
(3.2)
Për të gjetur pritjen matematike kryejmë njehsimet e mëposhtme.
2
2 2 2
1 1 1( ) 6 2
2 2 2 2 2
t k k kk k k
k k kE L k , dhe gjejmë
( ) 4 tE L (3.3)
Për dispersionin veprojmë në mënyrë të ngjashme.
3 22 2
2 2 2
1 1 1( ) 26 6 20
2 2 2 2 2
t k k kk k k
k k kE L k , dhe gjejmë
65
2 2( ) 20 4 4 tD L (3.4)
Me që 1
( 2) ( 3)4
t tP L P L dhe me që vargu i probabiliteteve është varg zbritës,
atëherë vlerat 2 dhe 3 janë moda. Ndërkohë çdo vlerë e intervalit 3,4 shërben si
mesore.
Gjithashtu mund të gjenden koeficienti i asimetrisë i Pirsonit
33
2
tLE (3.5)
dhe koeficienti i sheshtësisë i Pirsonit
4
4
133
4
tE L (3.6)
(shih Shtojca 2)
Figura 3.4 Densiteti dhe funksioni i shpërndarjes për gjatësinë e ciklit të një procesi
zhurmë e bardhë.
66
Pra, për rastin e zhurmës së bardhë gausiane, gjatësia e një cikli ka pritje matematike
dhe dispersion të njëjtë të barabartë me vlerën 4, si dhe me shpërndarje të pavarur nga
momenti i fillimit t, i saj. Asimetria dhe sheshtësia janë pozitive.
Në figurën 3.4 paraqitet grafiku i densitetit dhe funksionit të shpërndarjes për
ndryshoren Lt. Vëmë re se vlerat e gjatësisë së ciklit mbi 10 kanë probabilitet shumë
të vogël.
Shënim 3.1. Rezultatet e treguara për zhurmën e bardhë gausiane janë të vlefshëm
edhe për ndonjë shpërndarje tjetër me densitet simetrik, me kushtin që ndryshoret
{ , 0, 1, 2, ...}t t të jenë të pavarura (në vend të pakorreluara; tek shpërndarja
normale moskorrelimi sjell pavarësi).
Shënim 3.2. Në se tek përcaktimi i ciklit pritja matematike do të zëvendësohej me
mesoren, atëherë pohimet e mësipërm ngelen të vërtetë për çdo zhurmë të bardhë të
pavarur.
Shënim 3.3. Në se { , 0, 1, 2, ... }t t është një proces i zhurmës së bardhë të
pavarur me shpërndarje të çfarëdoshme, atëherë
21 1 1
1
( ) ( 2 )k
k k j k j
i
j
P L k pq p q p q
,
ku ( )ip P dhe q =1− p.
Shënim 3.4. Në se seria { , 1, 2, ... }tX t në shqyrtim është një proces satcionar
gausian ne mund të përdorim teoremën e Ramsey (Ramsey (1974) e cila tregon
shpërndarjen e tX kur kemi vrojtuar vlerat e mëparshme 0 1 1, , ..., tX X X të procesit.
Ramsey, 1974 tregoi se shpërndarja e tX me kusht 0 1 1, , ..., tX X X është një
shpërndarje normale me pritje matematike
0 1 1
1
( \ , ,..., )t
t t t tk t k
k
m E X X X X X
(3.7)
dhe dispersion
2
0 1 1 0
1
( \ , ,..., ) (1 )t
t t t kk
k
D X X X X
(3.8)
ku kk është autokorrelacioni i pjesshëm i rendit k dhe tk është koeficienti i k-të
në
modelin AR të rendit t. Koeficientët tek barazimet (3.7) dhe (3.8) mund të njehsohen
nëpërmjet algoritmit Durbin-Levin (shih p.sh. Brockwell dhe Davis, 1991, faqe 70).
Pra për rastin e proceseve stacionare gausiane gjatësia e ciklit varet nga funksioni i
autokorrelacionit.
3.2.2 Cikli i serisë së vrojtuar
Shqyrtojmë përsëri rastin e zhurmës së bardhë gausiane.
Le të jetë 1 2, , ..., nx x xx një vrojtim i rastit nga zhurma e bardhë gausiane
{ , 1, 2, ...}t t . Për thjeshtësi, supozojmë se 0x , përndryshe përdorim serinë
ndihmëse t ty x x . Më tej supozojmë se 1 0x (ose 1 0y ), përndryshe përdorim
67
serinë ndihmëse t tz x (ose t tz y ). Atëherë, cikli përcaktohet nga një varg
vrojtimesh të njëpasnjëshme me shenjë pozitive të ndjekura nga një varg vrojtimesh
negative. Në rastet kur janë përdorur seritë ndihmëse ty ose tz , cikli përbëhet nga
kufizat respektive të serisë së vrojtuar, tx . Me marrëveshje, në se pas ciklit të fundit të
serisë ka kufiza të tjera (të cilat do kenë shenjë të njëjtë, pozitive), atëherë ato do
konsiderohen si “cikël”.
Le të jenë 1 2, , ..., sL L L gjatësitë e cikleve të vrojtuara. Është e qartë se numri total i
cikleve, s, është një ndryshore rasti me vlera të plota në bashkësinë
{ 1, 2, ..., }2
nS , në se n është numër çift, ose
1{ 1, 2, ..., }
2
nS
kur n është
numër tek.
Gjatësia mesatare e cikleve të formuara në zgjedhjen 1 2, ,..., nx x x do jetë e barabartë
me shumën
1
1 s
i
i
nL L
s s
(3.9)
ku s është numri i cikleve të serisë (është ndryshore rasti) dhe iL është gjatësia e
ciklit të i-të
për 1, 2, ..., i s . Le të gjejmë shpërndarjen e ndryshores s dhe më pas
shpërndarjen e ndryshores së rastit L .
Nga sa thamë më sipër, vlerat e mundshme të ndryshores s janë 1, 2, ..., 2
nm
, ku
me simbolin x shënojmë minimumin e numrave të plotë jo më të vegjël se x.
Është e qartë se 1s vetëm kur 1L n . Nga mënyra e përcaktimit të ciklit, dhe nga
marrëveshjet e mësipërme, rrjedh se kusht i nevojshëm dhe i mjaftueshëm që zgjedhja
të përmbajë vetëm një cikël, është që zgjedhja të përbëhet nga l kufizat e para pozitive
të ndjekura nga n = m−l kufiza negative. Këtu, l merr vlerat l = 1, 2, ..., n. (kujtojmë
seria fillon me kufizë pozitive dhe se rasti me të gjitha kufizat pozitive quhet cikël).
Atëherë, kemi
1 11
2n
nP s P L n
(3.10a)
Për të gjetur probabilitetin 2P s , duhen shqyrtuar gjithë rastet e mundshme të
gjatësive të dy cikleve shuma e të cilave jep vlerën n, pra çiftet 1 2L dhe 2 2L n ,
1 3L dhe 2 3L n , ... , 1 2L n dhe 2 2L , si dhe rasti 1 1L n dhe 2 1L
(pra mund të ndodhë që cikli i fundit të ketë një kufizë).
Kemi 1
1 2
2
2 ;n
k
P s P L k L n k
. Prej nga gjejmë
68
2
1 2 1 1 2 1
2
2 \ 1 1\ 1n
k
P s P L k P L n k L k P L n P L L n
dhe
pas veprimesh si dhe duke marrë parasysh se 2L është cikli i fundit, gjejmë
2
1 1 02
1 2 1{ 2}
2 2 2 2
n
k n k nk
k n k nP s
, ose
2
12
12 2 ( 1)( )
2
n
nk
P s n k n k
(3.10b)
Në përgjithësi, mund të tregohet se për çdo 22
nm
është i vërtetë barazimi
1 2 1
1 2
1 2 3 11
, 1,2,...,, 1; ,..., 2
... 1
1( 1)( 1)....( 1)
2i
m m
m
m mn
k Z i mk k k kk k k n
P s m k k k k k
(3.11)
Shuma kryhet sipas të gjitha përkëmbimeve (pa përsëritje) të numrave të plotë
pozitivë 1, ..., mk k , që plotësojnë kushtin 1 2 ... 1mk k k n . Në fakt, mund të
tregohet që 1, 2 2 mk k n m dhe 2 3ik n m , për 2,3,..., 1i m .
Gjetja e një forme eksplicite e shumës (3.11) është një problem kombinatorike dhe
nuk është në objektin e kësaj teme. Megjithatë mund të tregohet se pritja matematike
e numrit të cikleve të zgjedhjes është
2( )
4
nE s
(3.12)
Për më tepër, në se n është çift, shpërndarja e numrit të cikleve është një shpërndarje
simetrike (shih tabelën 3.2).
Nga barazimet (3.9) dhe (3.12) gjejmë
1 1 2
( )4
nE E s
L n n
(3.13)
Nga ana tjetër, me ndihmën e tabelës së shpërndarjes së ndryshores së rastit s, ne
mund të gjejmë pritjen matematike të ndryshores 1
s nëpërmjet barazimit
/2
1
1 1( )
n
m
E P s ms m
(3.14)
më tej gjejmë ( )E L nga barazimi
1( )E L n E
s
(3.15)
Intuitivisht, ne presim që gjatësia mesatare e cikleve të zgjedhjes ka pritje matematike
( ) 42
nE L
n. Pra, L pritet të jetë një vlerësues asimptotikisht i pazhvendosur për
pritjen matematike të gjatësisë së ciklit të procesit.
69
Ne kemi njehsuar shpërndarjen e ndryshores së rastit s për disa vlera të vëllimit të
zgjedhjes n. Rezultatet janë treguar në tabelën 3.2. Gjithashtu janë njehsuar pritja
matematike /2
1
( ) { }n
m
E s mP s m
dhe pritja matematike ( )E L , e njehsuar sipas
barazimeve (3.15) dhe (3.14). Për të parën veprimet janë të sakta ndërsa për të dytën
veprimet janë të përafruara deri në tre shifra pas presjes.
Vihet re se ( ) 41
nE L
n edhe për n relativisht jo të mëdha. Pra ( ) 4E L për n të
mëdha. Ky fakt mbështet arsyetimin induktiv se L është një vlerësues asimptotikisht
i pazhvendosur për pritjen matematike të gjatësisë së ciklit.
Tabela 3.2 Rastet e mundshme për vlerat e numrit të cikleve të një zgjedhje me
vëllim n nga një zhurmë e bardhë gausiane. Raste gjithsej janë 2n-1
.
n
m 10 11 12 13 14 15 16 17 20
1 10 11 12 13 14 15 16 17 20
2 120 165 220 286 364 455 560 680 1140
3 252 462 792 1287 2002 3003 4368 6188 15504
4 120 330 792 1716 3432 6435 11440 19448 77520
5 10 55 220 715 2002 5005 11440 24310 167960
6 - 1 12 78 364 1365 4368 12376 167960
7 - - - 1 14 105 560 2380 77520
8 - - - - - 1 16 136 15504
9 - - - - - - - 1 1140
10 - - - - - - - - 20
( )E s 3 3.25 3.5 3.75 4 4.25 4.5 4.75 5.5
( )E L 3.633 3.665 3.691 3.714 3.733 3.750 3.764 3.778 3.810
Tabela 3.3 Gjatësia mesatare e ciklit të një serie kohore me vëllim n e gjeneruar nga
një proces ARFIMA(0,d,0).
n
d 100 200 500 700 1000 2000 3000
-0.45 3.2985 3.3145 3.3258 3.3307 3.3264 3.3287 3.3288
-0.4 3.3409 3.3552 3.3680 3.3711 3.3713 3.3742 3.3749
-0.3 3.4646 3.4625 3.4810 3.4754 3.4875 3.4821 3.4834
-0.2 3.5885 3.5947 3.6102 3.6164 3.6171 3.6087 3.6149
-0.1 3.7168 3.7651 3.7714 3.7732 3.7756 3.7819 3.7811
0.0 3.9451 3.9761 3.9878 3.9978 3.9926 3.9923 3.9985
0.1 4.1920 4.2517 4.2737 4.2875 4.2839 4.3015 4.2980
0.2 4.5677 4.6245 4.7016 4.7079 4.7266 4.7404 4.7496
0.3 5.0297 5.2269 5.3228 5.3846 5.3943 5.4387 5.4520
0.4 5.8314 6.0154 6.3344 6.4161 6.5109 6.6334 6.6901
0.45 6.3509 6.6055 7.0454 7.2004 7.3483 7.5866 7.6597
Kur seria e vrojtuar është gjeneruar nga një seri stacionare e çfardoshme gjatësia e
ciklit varet nga natyra e funksionit të autokorrelacionit të serisë. Ne simuluam seri nga
70
procese ARFIMA(0,d,0) për vlerat d = −0.45, 0.45 dhe vlerat nga −0.4 në 0.4 me hap
0.1 të parametrit të memories, si dhe për vëllim n = 100, 200, 500, 700, 1000, 2000
dhe 3000. Për çdo model të konsideruar ne simuluam 1000 seri me vëllimin e
përcaktuar. Për çdo seri të simuluar ne njehsuam gjatësinë mesatare të cikleve të
formuar. Pas përfundimeve Monte Carlo ne gjetëm mesataren e rezultateve Monte
Carlo. Rezultatet paraqiten në tabelën 3.3.
Vihet re se gjatësia e ciklit varet nga shenja e autokorrelacionit të procesit dhe kjo
gjatësi rritet kur vlerat e parametrit d rriten nga −0.45 në 0.45. Gjithashtu për një vlerë
të fiksuar të parametrit d, gjatësia e ciklit rritet me rritjen e vëllimit të zgjedhjes.
Megjithatë, gjatësia e ciklit varet shumë pak nga vëllimi i zgjedhjes.
Në figurën 3.5 paraqitet grafiku i varësisë së gjatësisë së ciklit nga vlera e parametrit
d, për vëllimin 700n . Rritja e gjatësisë së ciklit duket të jetë e formës
eksponenciale. Gjithashtu, vëmë re se kur 0d , pra kur kemi zhurmë të bardhë,
vlera e gjatësisë së ciklit është shumë afër vlerës teorike, 4.
Figura 3.5 Varësia e gjatësisë mesatare të ciklit nga parametri i memories, d për një
seri kohore e modelit ARFIMA(p,d,q).
71
Gjithashtu ne kryem simulime nga tre procese rasti me funksion të autokorrelacioneve
të ndryshëm dhe njehsuam mesataren e gjatësive të cikleve të formuara në serinë
kohore të simuluar. Ne simuluam seri kohore të modelit zhurmë e bardhë gausiane, që
karakterizohet nga mungesa e memories, të modelit AR(1) me memorie të shkurtër,
me koeficient autoregresiv 1 0.3 , dhe seri të modelit ARFIMA(0,d,0) me memorie
të gjatë, me parametër d = 0.2. Për secilin model ne simuluam një seri me gjatësi
1000n kufiza dhe njehsuam gjatësinë mesatare të ciklit sipas barazimit (3.9).
Eksperimenti Monte Carlo u përsërit 1000 herë dhe histogramat e vlerave të gjatësisë
mesatare paraqiten në figurën 3.6. Për të pasur një krahasim më të qartë, parametrat e
boshteve janë vendosur të njëjtë për secilin rast.
Figura 3.6 Mesatarja e gjatësive të ciklit të një zgjedhje rasti të modeleve zhurmë e
bardhë, AR(1) dhe ARFIMA(0,d,0).
Nga figura 3.6, mund të themi se për rastin e zhurmës së bardhë, gjatësia mesatare e
ciklit të zgjedhjes është afërsisht 4. Kjo mbështet arsyetimin se gjatësia mesatare e
ciklit të zgjedhjes është vlerësues asimptotikisht i pazhvendosur për pritjen
matematike të gjatësisë së ciklit, me densitet shpërndarjeje sipas tabelës 3.1.
Gjithashtu, vëmë re se gjatësia e ciklit varet më tepër nga funksioni i autokorrelacionit
të rendit të parë të procesit dhe jo nga shuma e autokorrelacioneve. Kështu,
72
pavarësisht se procesi ARFIMA(0,d,0) është me memorie të gjatë, ai ka gjatësi
mesatare të ciklit më të vogël se gjatësia mesatare e ciklit për procesin AR(1), që ka
memorie të shkurtër. Kjo rrjedh nga fakti se funksioni i autokorrelacioni të rendit të
parë ka vlerat (teorike) 1 0.25 për procesin ARFIMA(0,d,0) me parametër 0.2d
(shih barazimin (1.42) ) dhe 1 0.3 për procesin AR(1) me parametër 1 0.3 .
Vemë re se në të tre rastet shpërndarja e ndryshores L është afër shpërndarjes
normale.
3.3 Simulime Monte Carlo
Në këtë paragraf përshkruhet një studim (eksperiment) Monte Carlo me të dhëna të
simuluara për të krahasuar metodën bootstrap me cikle, BBC, me metodat e njohura
MBB dhe SB. Ne do zbatojmë metodën bootstrap të propozuar në paragrafin e
mësipërm, për vlerësimin e parametrave të serive me memorie të gjatë. Butka dhe
Beta (2014) kanë përdorur metodën bootstrap me blloqe të përbërë nga cikle për të
vlerësuar memorien e gjatë. Ata kanë gjetur se metoda BBC jep në përgjithësi
vlerësime me devijim standard më të vogël se metodat klasike. Butka dhe Capollari
(2013a) treguan se metoda BBC mund të përdoret me sukses për testimin e hipotezës
0 : 0H d kundrejt hipotezës alternative 1 : 0H d , pra për zbulimin e pranisë së
memories së gjatë në një seri të vrojtuar.
Të gjitha eksperimentet e kryera janë ekzekutuar në programin R duke përdorur disa
paketa si dhe komanda të përshtatura kur ka qenë e nevojshme.
3.3.1 Vlerësimi pikësor
Fillimisht, ne do shohim vlerësimin pikësor të parametrit d, të memories së gjatë të
një modeli ARFIMA duke përdorur vlerësuesit GPH, SP dhe vlerësuesin e përgjasisë
maksimale (VPM) (shih paragrafin 1.5.2). Dy të parat e vlerësojnë parametrin d
nëpërmjet periodogramës së serisë kohore të vrojtuar. Për të pasur një krahasim ne do
përdorim gjithashtu edhe vlerësuesin e përgjasisë maksimale, i cili është vlerësues
parametrik dhe, me që është përdorur në modelin e duhur (pra nuk kemi gabim në
identifikimin e modelit) ai është vlerësuesi më efikas. Meqenëse njehsimet për gjetjen
e VPM kërkojnë tepër kohë kompjuterike, ne do përdorim një përafrim të saj të
propozuar nga Haslett dhe Raftery (1989), e cila është e implementuar në komandën
fracdiff të paketës fracdiff të programit R.
Duke përdorur formulën (2.1), vlerësuesi bootstrap GPH mund të shkruhet në formën
,
1
1ˆ ˆQ
GPH GPH j
j
d dQ
,
ku ,ˆ
GPH jd është vlerësimi përkatës i gjetur në pseudoserinë e j-të bootstrap. Njësoj
veprohet edhe për vlerësuesit e tjerë.
Në eksperimentin Monte Carlo ne do përdorim seri kohore të gjeneruara nga modelet
FI(d) për vlerat 0.1, 0.2, 0.3, 0.4, 0.45d të parametrit të memories d dhe me
gjatësi 100, 200, 500, 1000n . Këto vlera mbulojnë një diapason të arsyeshëm për
zbatime praktike. Rezultatet Monte Carlo janë mbështetur në 1000P realizime për
çdo model të shqyrtuar. Rezultatet bootstrap janë mbështetur në 1000Q përsëritje
bootstrap. Në çdo model të simuluar, është përdorur një periudhë “djegie” prej 300
73
kufizash të para për të eliminuar efektin e vlerave fillestare. Pra, janë gjeneruar
300n vlera dhe 300 vlerat e para janë larguar nga seria.
Seritë kohore janë simuluar me ndihmën e komandës fracdif.sim në paketën “fracdiff“
të programit R. Për përcaktimin e gjatësisë së bllokut do përdorim metodën e
propozuar nga Politis dhe Romano (2003), i aplikueshëm në funksionin “b.star” të
paketës “np” në programin R. Shënojmë një korrigjim që duhet bërë tek komanda
“b.star” (shih shtojca 3). Për hollësi të metodës shih Politis dhe White (2004) si dhe
Patton etj. (2008) për një korrigjim.
Tek vlerësuesi GPH ne kemi përdorur pikën e cungimit 0.8m n të frekuencave tek
regresi (1.73) (siç përcaktohet tek komanda “fdGPH” tek paketa “fracdiff”, në R).
Tek vlerësuesi SP ne kemi përdorur pikën e cungimit 0.5m n të frekuencave tek
regresi (1.73) dhe pikën e cungimit 0.9M n tek dritarja Parzen (këto vlera janë të
përcaktuara tek komanda “fdSperio” tek paketa “fracdiff”, në R).
Për çdo vlerësues dhe çdo metodë bootstrap të përdorur, do njehsojmë vlerësimin
pikësor Monte Carlo sipas barazimeve
1
1ˆ ˆ
P
MC j
j
d dP
dhe *
1
1ˆ ˆ
P
MC j
j
d dP
(3.16)
ku ˆjd është vlerësimi pikësor i d-së sipas vlerësuesit të përdorur dhe ˆ
jd është
vlerësimi bootstrap me metodën përkatëse, të vrojtuara për serinë e simuluar në
përsëritjen Monte Carlo të j-të
. Për të krahasuar performancën e secilit vlerësues dhe të
vlerësuesit bootstrap përkatës, për çdo model të studiuar, do të njehsojmë zhvendosjen
(empirike)
0ˆ ˆ( ) MCd d d (3.17)
ku me 0d kemi shënuar vlerën e vërtetë të parametrit. Gjithashtu do njehsojmë
devijimin standard (empirik)
2
1
1ˆ ˆ ˆ( ) ( )1
P
j MC
j
SD d d dP
(3.18)
Më tej ne mund të gjejmë dhe gabimin katror mesatar (empirik) sipas barazimit
2 2 2
0
1
1 1ˆ ˆ ˆ ˆ( ) ( ) [ ( )] [ ( )]
P
j
j
PMSE d d d SD d d
P P (3.19)
si dhe rrënjën katrore të tij
ˆ ˆ( ) ( )RMSE d MSE d (3.20)
Për të vlerësuar “dobinë” (efikasitetin) e përdorimit të metodave bootstrap të përdorur
ne do të njehsojmë statistikën
ˆ ˆ( ) ( )x100
ˆ( )
RMSE d RMSE dEF
RMSE d (3.21)
Kjo statistikë tregon se sa është, në përqindje, përfitimi i përdorimit të metodës
bootstrap përkatëse e krahasuar me metodën klasike (e thjeshtë).
74
Statistikat e mësipërme do të njehsohen për të dy vlerësuesit GPH dhe SP, të përdorur,
si dhe për vlerësuesit bootstrap përkatës.
Rezultatet e përftuara paraqiten tek tabelat 3.4-3.7 si dhe në figurën 3.7.
Figura 3.7 Efikasiteti relativ (në përqindje) i vlerësimeve GPH me metodat bootstrap
MBB, SB dhe BBC kundrejt vlerësimeve të zakonshme GPH, referuar rrënjës katrore
të gabimit mesatar katror.
Në tabelat 3.4-3.6 paraqiten përkatësisht zhvendosja empirike, devijimi standard dhe
rrënja e gabimit katror mesatar për vlerësuesit e përdorur. Në formatin “bold” janë
printuar vlerat më të vogla (vlerat absolute, për rastin e zhvendosjes) të secilit model,
ndërsa në formatin “bold italic” vlerat e dyta më të vogla.
Në tabelën 3.7 tregohet efikasiteti, në përqindje, i përdorimit të metodave bootstrap
(shih barazimin (3.21) më sipër). Në formatin “bold” është printuar vlera më e madhe
e secilit model, ndërsa në formatin “bold italic” vlerat e dytë më e madhe.
Nga rezultatet e përftuara mund të themi se, ashtu siç pritej, vlerësuesi VPM jep
vlerësime me RMSE empirik më të vogël. Ne e kemi përdorur metodën parametrike
VPM në rastin ideal, kur modeli i supozuar është modeli i vërtetë. Ndërkohë,
75
vlerësuesi GPH i zbatuar nëpërmjet metodës bootstrap BBC jep rezultatet më të mira
ndër metodat e tjera bootstrap të përdorura, duke iu referuar vlerave të RMSE.
Për t’u theksuar është fakti se përdorimi i vlerësuesit GPH nëpërmjet metodës BBC
është i dobishëm për të gjitha rastet e simuluara. Efikasiteti relativ i tij kundrejt
metodës e zakonshme përkatëse, i përkufizuar sipas barazimit (3.21), është gjithmonë
pozitiv, dhe merr vlerën maksimale pothuajse në të gjitha rastet (shih tabelën 3.7).
Në figurën 3.7 jepen grafikët e efikasitetit të vlerësuesit GPH i zbatuar nëpërmjet
metodave MBB, SB dhe BBC kundrejt vlerave e parametrit të memories, d. Dallohet
lehtësisht se metoda BBC ka efikasitetin më të lartë dhe është gjithmonë me efikasitet
pozitiv. Siç edhe pritet, efikasiteti i metodave bootstrap zvogëlohet me rritjen e
gjatësisë së serisë. Ndërkohë metodat MBB dhe SB kanë efikasitet negativ (pra
përdorimi i tyre nuk sjell përmirësim të vlerësimit) për disa vlera të parametrave n dhe
d.
3.3.2 Vlerësimi intervalor
Një problem shumë i rëndësishëm i analizës së serive kohore me memorie të gjatë
është gjetja e intervaleve të besimit për parametrin e memories d. Ky është një
problem i trajtuar gjerësisht në literaturë për faktin se ai është i lidhur drejtpërdrejt me
me problemin e testimit të ekzistencës së memories së gjatë. Mund të përmendim
Silva etj. (2006), Franco dhe Reisen (2007), Arteche dhe Obre (2009, 2014), Kim dhe
Nordman (2011) ndër të tjerë. Butka dhe Capollari (2013b) përdorën metodën BBC
për të përmirësuar probabilitetin e mbulimit të intervaleve të besimit për parametrin e
memories së gjatë në modelet ARFIMA(0,d,0).
Në eksperimentin Monte Carlo të zhvilluar më sipër, ne gjithashtu gjetëm intervalet e
besimit për parametrin e memories d, me nivel rëndësie1 0.95 . Intervalet e
besimit janë ndërtuar duke përdorur vlerësuesit gjysmë parametrikë GPH dhe SP. Për
secilin model të simuluar ne gjetëm intervalin e besimit duke përdorur shpërndarjen
asimptotike të vlerësuesit përkatës, si dhe intervalet e besimit bootstrap PB dhe BCa
(shih paragrafin 2.5), duke përdorur metodat MBB, SB dhe BBC. Për secilin interval
ne njehsuam probabilitetin empirik të mbulimit si dhe gjatësinë mesatare të intervalit,
duke përdorur 1000 përsëritje Monte Carlo.
Rezultatet për vlerësuesin GPH jepen në tabelat 3.8-3.9, ndërsa për vlerësuesin SP në
tabelat 3.10-3.11. Për secilin rast, me bold janë printuar vlerat më të larta të
probabilitetit (empirik) të mbulimit ose vlerat më të ulta të gjatësisë mesatare të
intervalit.
Rezultatet më të mira, referuar probabilitetit të mbulimit, janë përftuar nga intervali
PB nëpërmjet vlerësuesit GPH i zbatuar me metodën BBC. Në tabelën 3.8 ne shohim
se intervali PB i përftuar nga BBC ka pothuajse gjithmonë probabilitetin më të lartë të
mbulimit. Vlerat e probabilitetit të mbulimit të intervalit PB me metodën BBC janë
gjithmonë, përveç një rasti, më të mëdha ose baraz me nivelin e përcaktuar të
intervalit. Gjithashtu, metoda BBC jep probabilitetin më të mirë të mbulimit të
intervaleve BCa krahasuar me metodat MBB dhe SB. Intervalet e përftuara nga
vlerësuesi SP nëpërmjet metodave bootstrap japin gjithmonë probabilitet mbulimi më
të madh se intervalet asimptotik përkatës. Edhe në këtë rast, metoda BBC performon
përgjithësisht më mirë se metodat MBB dhe SB, referuar probabilitetit të mbulimit.
76
Megjithatë, kompensimi që duhet “paguar” për të pasur probabilitetin e mbulimit më
të madh, është një gjatësi më e madhe e intervaleve të besimit të përftuara me
metodën BBC se sa ajo e intervaleve të tjerë.
Në përgjithësi, mund të konkludojmë se metoda BBC përmirëson performancën e
vlerësimit intervalor të parametrit të memories nëpërmjet vlerësuesve gjysmë
parametrik GPH dhe SP.
3.3.3 Kontrolli i hipotezës për praninë e memories së gjatë
Siç u theksua përgjatë kapitullit të parë evidentimi i prezencës së memories së gjatë në
një seri kohore të vrojtuar, është një problem sa i rëndësishëm aq dhe i vështirë për t’u
realizuar. Shpesh memoria e gjatë është e ndërthurur me memorien e shkurtër dhe
statistikat e përdorura në literaturë japin rezultate të ndryshme dhe përmbajnë
parametra që duhen përcaktuar në mënyrë empirike.
Në eksperimentet Monte Carlo ne kemi përdorur bootstrapin jo parametrik dhe
bootstrapin gjysmë parametrik për të kontrolluar hipotezat:
H0 : Seria nuk është me memorie të gjatë, kundrejt hipotezës
H1 : Seria është me memorie të gjatë.
(i) Bootstrapi jo parametrik
Në këtë eksperiment ne do ndjekim skemën e rizgjedhjeve bootstrap jo parametrik
duke përdorur teknikën e propozuar BBC. Në literaturë, sugjerohet se gjatë kontrollit
të hipotezave me metodat bootstrap, përdorimi i një statistike në formë metrike jep
kritere të vlefshme përkundrejt gjithë hipotezave alternative (Romano, 1988, Hinkley,
1988).
Verifikimi i hipotezave të mësipërme do mbështetet në faktin se një seri me memorie
të gjatë mund të paraqitet nga modeli ARFIMA(p,d,q) për vlera d ≠ 0. Për të testuar
në se në një seri shfaq apo jo memorie të gjatë, ne do kontrollojmë hipotezën bazë
0 : 0H d , kundrejt hipotezës alternative
1 : 0H d , duke përdorur statistikën
ˆW d d , ku d̂ është një vlerësues konvergjent i parametrit të memories, d.
Si vlerësues të parametrit d do të përdorim vlerësuesin e periodogramës së lëmuar, SP
(shih paragrafin 1.5.2 (v)) të propozuar nga Hassler (1993) dhe Reisin (1994). Butka
dhe Capollari (2013a), bazuar në simulime Monte Carlo, propozojnë përdorimin e
vlerësuesit SP kundrejt vlerësuesit GPH për të kryer testimin e prezencës së memories
së gjatë. Si dritare të vonesës do përdorim dritaren Parzen, që jepet nga barazimet
(1.77). Pikat e cungimit i zgjedhim të rendeve 0.5m n për numrin e kufizave tek
regresi i periodogramës (1.73) dhe 0.7M n për dritaren Parzen (Chen etj., 1993 dhe
Reisen, 1994, në studimet e tyre Monte Carlo, kanë treguar që këto vlera të pikave të
cungimit japin vlerësime të mira të parametrit d).
Ne realizuam simulime nga procese me memorie të shkurtër dhe nga procese me
memorie të gjatë për të vlerësuar gabimin e llojit të parë dhe fuqinë e kriterit të
përdorur. Proceset me memorie të shkurtër u simuluan nga modelet AR(1) me
77
inovacione me shpërndarje normale dhe me koeficientë 1 {0, 0.1, 0.3, 0.5} (rasti
1 0 i korrespondon zhurmës së bardhë). Proceset me memorie të gjatë u simuluan
nga modeli ARFIMA(1,d,0) për {0.1, 0.2, 0.3, 0.4}d , dhe parametrat e tjerë të
njëjtë si tek rasti i modeleve AR(1). Gjatësitë e serive u përzgjodhën të ishin në vlerat
n =100, 300, 500. Si nivel domethënie janë përdorur vlerat 0.05, 0.10 .
Për të njehsuar p-vlerat bootstrap ne përdorëm 999 përsëritje bootstrap, ndërsa për të
vlerësuar (empirikisht) gabimin e llojit të parë dhe fuqinë e kriterit u përdorën 1000
eksperimente Monte Carlo për çdo rast të simuluar.
Ne përdorëm vlera të ndryshme për numrin e cikleve për bllok. Nga rezultatet e
gjetura, rezultoi që numri i cikleve për bllok nuk duhet të jetë shumë i vogël, por as
shumë i madh. Disa nga rezultatet e gjetura paraqiten në tabelat 3.12 - 3.16.
Tabela 3.12 tregon gabimin e llojit të parë, në përqindje, i vlerësuar si raport i numrit
të refuzimeve të hipotezës bazë me numrin total të përsëritjeve Monte Carlo, për çdo
seri të simuluar. Vemë re se ky gabim varet nga numri i cikleve për bllok (pra nga
gjatësia e bllokut), nga gjatësia e serisë si dhe nga koeficienti i autoregresit të modelit
AR(1). Në praktikë, modeli që gjeneron të dhënat është i panjohur. Kështu që gjatësia
e bllokut bootstrap duhet përcaktuar empirikisht nga seria e vrojtuar. Nga rezultatet e
tabelës 3.12, mund të themi se numri optimal i cikleve për bllok duket të jetë 6-8, për
100n , 8-10 për 300n , dhe 10-12 kur 500n .
Në tabelat 3.13-3.16 jepet fuqia e kriterit të përdorur për çdo model ARFIMA(1,d,0)
të simuluar. Ashtu siç pritej, fuqia rritet me rritjen e parametrit të memories d, si dhe
me rritjen e koeficientit të autoregresionit dhe po ashtu me rritjen e vëllimit të serisë.
Vlerësimet e fuqisë janë më të larmishme, por në përgjithësi vlerat më të mira merren
për numrin e cikleve për bllok të njëjtë me atë të gjetur tek vlerësimi i gabimit të llojit
të parë. Në përgjithësi vihet re një tendencë për të pranuar hipotezën bazë, veçanërisht
kur 1 0 .
(ii) Bootstrapi gjysmë parametrik.
Butka etj. (2014) kanë përdorur metodën bootstrap gjysmë parametrik, ose bootstrapin
sitë, të shpjeguar në paragrafin 2.4, për të kryer kontroll hipotezash për praninë e
memories së gjatë duke përdorur statistikën e propozuar nga Lo (1991). Shih dhe
paragrafin 1.5.1, pika (i). Si tek rasti i mësipërm, janë gjeneruar seri me memorie të
shkurtër dhe seri me memorie të gjatë për të vlerësuar empirikisht gabimin e llojit të
parë dhe fuqinë e kritereve të përdorur. Si pikë e cungimit të statistikës Lo, e
përcaktuar nga barazimi (1.57), janë marrë tre vlerat e mëposhtme, të përdorura në
literaturë (shih Butka etj., 2014).
2/31/3
2
ˆ3 2
ˆ2 1L
Nq
(3.22a)
propozuar nga Lo (1991),
2/31/4
2
ˆ2
ˆ10 1W
Nq
(3.22b)
propozuar nga Wang etj. (2007), dhe
78
1/4
8100
M
Nq
(3.22c)
propozuar nga Murphy dhe Izzeldin (2009).
Niveli i rëndësisë është përcaktuar 0.05 . Numri i cikleve për bllok është
përzgjedhur në mënyrë që gjatësia mesatare e një blloku të jetë e rendit 0.5n .
Disa nga rezultatet e përftuara janë paraqitur në tabelat 3.17-3.18. Nga rezultatet e
përftuara mund të konkludojmë se përdorimi i metodës bootstrap BBC sjell
përmirësimin e performancës së statistikës R/S të modifikuar nga Lo (1991) duke
rritur fuqinë e saj në kontrollin e hipotezës mbi ekzistencën e memories së gjatë në një
seri të vrojtuar. Përdorimi i kësaj metode jep teste me gabim të llojit të parë më të
vogël se sa testi përkatës asimptotik pa zvogëluar fuqinë e kriterit të përdorur. Ky
përmirësim është më i dukshëm për seritë me gjatësi të vogël, si tek rasti 100n .
79
Tabela 3.4 Zhvendosja (β) për vlerësimet e d-së në proceset ARFIMA(0,d,0).
d n Monte Carlo MBB SB BBC
VPM GPH SP GPH SP GPH SP GPH SP
0.1
100 -.0313 -.0025 -.0710 -.0593 -.1521 -.0571 -.1481 -.0297 -.1379
200 -.0215 -.0012 -.0571 -.0578 -.1401 -.0531 -.1342 -.0270 -.1265
500 -.0104 .0003 -.0369 -.0572 -.1285 -.0502 -.1235 -.0254 -.1213
1000 -.0050 -.0006 -.0243 -.0497 -.1210 -.0446 -.1156 -.0264 -.1163
0.2
100 -.0425 .0138 -.0628 -.0861 -.2240 -.0828 -.2081 -.0352 -.1816
200 -.0258 .0005 -.0644 -.0755 -.2098 -.0722 -.1938 -.0314 -.1779
500 -.0135 -.0030 -.0380 -.0515 -.1861 -.0505 -.1666 -.0287 -.1659
1000 -.0056 -.0006 -.0302 -.0314 -.1673 -.0311 -.1446 -.0173 -.1509
0.3
100 -.0599 .0073 -.0760 -.0953 -.2676 -.0969 -.2518 -.0388 -.2095
200 -.0265 .0035 -.0549 -.0625 -.2334 -.0645 -.2153 -.0253 -.1819
500 -.0136 .0019 -.0360 -.0315 -.1808 -.0333 -.1658 -.0136 -.1426
1000 -.0056 .0047 -.0253 -.0107 -.1490 -.0122 -.1370 -.0014 -.1136
0.4
100 -.0694 .0084 -.0879 -.0911 -.2935 -.0967 -.2814 -.0340 -.2168
200 -.0347 .0097 -.0606 -.0410 -.2370 -.0456 -.2272 -.0107 -.1670
500 -.0139 .0064 -.0367 -.0148 -.1778 -.0175 -.1720 -.0031 -.1214
1000 -.0062 .0022 -.0180 -.0046 -.1398 -.0064 -.1355 .0006 -.0895
0.45
100 -.0777 .0160 -.0756 -.0812 -.2952 -.0885 -.2865 -.0266 -.2011
200 -.0440 .0097 -.0481 -.0383 -.2359 -.0435 -.2291 -.0112 -.1558
500 -.0196 .0102 -.0277 -.0101 -.1777 -.0134 -.1741 -.0007 -.1084
1000 -.0099 .0058 -.0162 .0035 -.1441 .0014 -.1418 .0053 -.0796
Vlerat me vlerë absolute më të vogël janë printuar në formatin bold. Vlerat me vlerë absolute të
dytë më të vogël janë printuar në formatin bold italic.
Tabela 3.5 Devijimi standard (SD) për vlerësimet e d-së në proceset ARFIMA(0,d,0).
d n Monte Carlo MBB SB BBC
VPM GPH SP GPH SP GPH SP GPH SP
0.1
100 .0653 .1406 .2556 .0533 .0249 .0561 .0380 .0898 .0954
200 .0542 .0962 .1993 .0376 .0182 .0398 .0247 .0627 .0546
500 .0362 .0614 .1445 .0319 .0145 .0313 .0182 .0405 .0252
1000 .0248 .0454 .1182 .0330 .0080 .0306 .0136 .0307 .0132
0.2
100 .0853 .1409 .2612 .0798 .0672 .0776 .0738 .1006 .1264
200 .0605 .0977 .2122 .0689 .0608 .0650 .0668 .0690 .0897
500 .0359 .0659 .1478 .0531 .0587 .0512 .0626 .0509 .0703
1000 .0241 .0450 .1234 .0398 .0574 .0388 .0605 .0374 .0629
0.3
100 .0857 .1429 .2652 .0987 .1087 .0946 .1095 .1027 .1576
200 .0584 .0971 .2032 .0811 .1105 .0787 .1075 .0759 .1322
500 .0356 .0635 .1537 .0553 .1045 .0546 .0989 .0516 .1130
1000 .0248 .0460 .1249 .0404 .0937 .0402 .0883 .0380 .0993
0.4
100 .0787 .1395 .2699 .1086 .1411 .1058 .1365 .1026 .1821
200 .0534 .0984 .2089 .0832 .1332 .0824 .1269 .0757 .1519
500 .0347 .0649 .1551 .0562 .1116 .0558 .1072 .0518 .1248
1000 .0254 .0460 .1320 .0398 .0967 .0396 .0943 .0365 .1099
0.45
100 .0731 .1481 .2770 .1168 .1499 .1147 .1451 .1063 .1874
200 .0498 .1028 .2087 .0850 .1363 .0842 .1301 .0772 .1594
500 .0316 .0649 .1587 .0573 .1111 .0568 .1076 .0501 .1298
1000 .0230 .0456 .1252 .0414 .0928 .0412 .0897 .0367 .1071
Vlerat më të vogla janë printuar në formatin bold. Vlerat e dyta më të vogla janë printuar në formatin bold italic.
80
Tabela 3.6 Rrënja e gabimit katror mesatar (RMSE) për vlerësimet e d-së në proceset
ARFIMA(0,d,0).
d n Monte Carlo MBB SB BBC
VPM GPH SP GPH SP GPH SP GPH SP
0.1
100 .0724 .1406 .2653 .0797 .1541 .0800 .1529 .0945 .1677
200 .0583 .0963 .2073 .0689 .1413 .0663 .1365 .0682 .1378
500 .0376 .0614 .1492 .0655 .1293 .0592 .1248 .0478 .1239
1000 .0253 .0454 .1206 .0596 .1213 .0541 .1164 .0405 .1170
0.2
100 .0953 .1416 .2687 .1174 .2339 .1135 .2208 .1065 .2212
200 .0657 .0977 .2217 .1022 .2184 .0971 .2050 .0758 .1992
500 .0383 .0660 .1526 .0740 .1951 .0719 .1780 .0584 .1802
1000 .0247 .0450 .1271 .0507 .1769 .0497 .1567 .0412 .1635
0.3
100 .1045 .1431 .2759 .1372 .2888 .1354 .2746 .1097 .2621
200 .0641 .0972 .2105 .1024 .2582 .1017 .2406 .0800 .2248
500 .0381 .0635 .1578 .0636 .2088 .0639 .1930 .0533 .1819
1000 .0254 .0462 .1274 .0418 .1760 .0420 .1630 .0380 .1508
0.4
100 .1049 .1397 .2838 .1417 .3256 .1433 .3127 .1080 .2831
200 .0637 .0989 .2175 .0927 .2718 .0941 .2602 .0764 .2257
500 .0374 .0653 .1594 .0581 .2099 .0585 .2026 .0519 .1741
1000 .0261 .0460 .1333 .0400 .1700 .0401 .1651 .0365 .1417
0.45
100 .1067 .1489 .2871 .1422 .3310 .1448 .3211 .1095 .2748
200 .0664 .1032 .2142 .0932 .2724 .0947 .2634 .0780 .2228
500 .0372 .0657 .1611 .0582 .2095 .0583 .2046 .0501 .1691
1000 .0250 .0459 .1263 .0415 .1714 .0412 .1678 .0371 .1334
Vlerat më të vogla janë printuar në formatin bold. Vlerat e dyta më të vogla janë printuar në
formatin bold italic.
Tabela 3.7 Efikasiteti (në përqindje) i përdorimit të metodave bootstrap kundrejt
metodës përkatse të zakonshme.
d n MBB SB BBC
GPH SP GPH SP GPH SP
0.1
100 43.30 41.90 43.08 42.36 32.74 36.79
200 28.33 31.85 31.02 34.18 29.04 33.54
500 -6.67 13.29 3.65 16.30 22.14 16.93
1000 -31.39 -0.49 -19.13 3.54 10.82 3.00
0.2
100 17.08 12.95 19.84 17.81 24.72 17.64
200 -4.62 1.50 0.57 7.56 22.41 10.16
500 -12.13 -27.87 -9.01 -16.62 11.42 -18.07
1000 -12.65 -39.22 -10.49 -23.38 8.44 -28.69
0.3
100 4.11 -4.70 5.36 0.47 23.27 4.97
200 -5.38 -22.69 -4.73 -14.33 17.66 -6.83
500 -0.18 -32.29 -0.67 -22.30 16.00 -15.26
1000 9.62 -38.12 9.15 -27.90 17.76 -18.40
0.4
100 -1.43 -14.73 -2.56 -10.18 22.66 0.25
200 6.19 -24.99 4.75 -19.64 22.68 -3.79
500 10.89 -31.71 10.33 -27.16 20.43 -9.24
1000 13.00 -27.60 12.90 -23.92 20.73 -6.39
0.45
100 4.50 -15.31 2.74 -11.85 26.44 4.27
200 9.71 -27.21 8.22 -23.02 24.45 -4.07
500 11.44 -30.09 11.17 -27.04 23.73 -4.97
1000 9.61 -35.77 10.32 -32.91 19.33 -5.70
Vlerat më të mëdha janë printuar në formatin bold.
81
Tabela 3.8 Mbulimi i vrojtuar (në përqindje) i intervaleve të besimit të vlerësuesit
GPH, me nivel 1 0.95 , për parametrin d, tek modelet ARFIMA(0,d,0).
d n Asimp MBB SB BBC
PB BCa PB BCa PB BCa
0.1
100 95.5 97.9 69.4 97.9 70.6 97.4 75.5
200 94.2 98.8 66.7 98.7 68.0 98.5 73.0
500 96.3 98.2 65.0 99.4 68.1 96.9 74.2
1000 96.5 89.9 63.4 96.1 65.7 97.2 72.2
0.2
100 94.2 96.1 71.0 96.6 70.8 95.8 78.2
200 93.6 95.0 71.2 95.3 72.2 95.7 79.3
500 92.5 86.4 69.8 87.9 71.4 93.4 74.1
1000 95.4 89.5 74.6 90.3 74.2 95.7 79.1
0.3
100 93.8 93.2 68.6 93.6 68.4 95.1 75.5
200 94.1 89.1 73.4 88.9 73.3 95.5 78.9
500 94.2 91.1 76.7 90.3 75.8 96.0 80.4
1000 94.7 93.2 82.4 93.2 80.6 96.4 83.6
0.4
100 94.5 88.3 68.5 88.1 68.0 95.8 77.3
200 93.8 90.0 74.6 89.2 73.4 95.7 80.5
500 94.0 94.1 77.4 93.4 76.0 96.1 80.3
1000 94.6 94.7 79.8 94.4 79.6 96.9 80.9
0.5
100 93.9 89.8 68.9 89.0 68.5 95.7 78.9
200 94.3 90.6 74.4 89.3 73.9 95.7 78.7
500 94.2 93.7 77.1 93.2 75.9 96.6 79.8
1000 95.8 95.2 81.3 95.2 80.6 97.3 79.8
BP intervali bootstrap i përqindjes. BCa intervali me zhvendosje të korrigjuar dhe i përshpejtuar.
Asimp përdor shpërndarjen asimptotike. Vlerat më të mëdha janë printuar në formatin bold.
Tabela 3.9 Gjatësia e vrojtuar (si mesatare) e intervaleve të besimit të vlerësuesit
GPH, me nivel 1 0.95 , për parametrin d, tek modelet ARFIMA(0,d,0).
d n Asimp MBB SB BBC
PB BCa PB BCa PB BCa
0.1
100 .5045 .5044 .4060 .5023 .4107 .4933 .4328
200 .3538 .3553 .2674 .3538 .2756 .3494 .3008
500 .2307 .2309 .1581 .2309 .1706 .2301 .1922
1000 .1690 .1700 .0985 .1700 .1075 .1705 .1332
0.2
100 .4850 .5036 .3703 .5005 .3717 .4935 .4311
200 .3484 .3525 .2490 .3526 .2549 .3494 .3056
500 .2288 .2299 .1629 .2297 .1656 .2308 .1945
1000 .1690 .1686 .1283 .1688 .1285 .1699 .1464
0.3
100 .4920 .4995 .3504 .4988 .3468 .4956 .4286
200 .3485 .3504 .2593 .3499 .2533 .3491 .3091
500 .2284 .2272 .1821 .2261 .1782 .2266 .2040
1000 .1690 .1684 .1461 .1678 .1438 .1681 .1552
0.4
100 .4887 .4951 .3467 .4962 .3356 .4976 .4399
200 .3474 .3463 .2679 .3478 .2605 .3476 .3127
500 .2289 .2276 .1947 .2270 .1910 .2269 .2099
1000 .1689 .1673 .1523 .1669 .1502 .1667 .1573
0.5
100 .4933 .4943 .3541 .4940 .3390 .4996 .4516
200 .3472 .3458 .2777 .3456 .2687 .3462 .3161
500 .2292 .2278 .1960 .2269 .1913 .2271 .2099
1000 .1693 .1683 .1529 .1676 .1509 .1661 .1560
PB intervali bootstrap i përqindjes. BCa intervali me zhvendosje të korrigjuar dhe i përshpejtuar.
Asimp përdor shpërndarjen asimptotike. Vlerat më të mëdha janë printuar në formatin bold.
82
Tabela 3.10 Mbulimi i vrojtuar (në përqindje) i intervaleve të besimit të vlerësuesit
SP, me nivel 1 0.95 , për parametrin d, tek modelet ARFIMA(0,d,0).
d n Asimp MBB SB BBC
PB BCa PB BCa PB BCa
0.1
100 59.1 99.5 68.4 99.5 71.0 99.3 71.7
200 60.6 99.7 68.0 99.6 68.9 99.9 68.1
500 66.0 99.4 64.4 99.3 65.6 99.3 64.4
1000 63.4 100.0 65.2 100.0 65.6 100.0 65.0
0.2
100 58.7 99.8 63.8 99.7 66.9 96.9 68.5
200 59.5 99.9 63.4 99.9 64.6 98.2 65.9
500 61.8 98.9 64.5 98.4 67.8 94.9 66.4
1000 61.2 69.9 60.0 84.0 66.6 78.9 63.5
0.3
100 58.0 99.8 65.5 98.8 68.7 87.8 72.5
200 59.8 83.2 69.7 86.1 71.7 83.7 73.0
500 63.2 64.4 69.6 72.2 73.0 75.2 76.7
1000 60.7 65.7 71.1 72.4 75.1 75.3 77.0
0.4
100 57.2 72.5 68.8 74.8 71.6 77.0 75.7
200 59.3 63.1 71.9 69.6 72.8 76.7 80.0
500 60.0 68.3 70.8 69.5 72.6 78.3 80.3
1000 59.6 72.8 64.4 72.8 64.3 81.1 78.7
0.5
100 57.6 64.7 70.9 67.5 73.2 75.4 74.7
200 59.0 67.1 70.5 69.0 70.8 77.9 76.0
500 61.4 72.0 67.0 71.4 67.4 80.5 78.9
1000 62.0 73.4 69.2 73.3 68.5 81.3 79.6
PB intervali bootstrap i përqindjes. BCa intervali me zhvendosje të korrigjuar dhe i përshpejtuar.
Asimp përdor shpërndarjen asimptotike. Vlerat më të mëdha janë printuar në formatin bold.
Tabela 3.11 Gjatësia e vrojtuar (si mesatare) e intervaleve të besimit të vlerësuesit
SP, me nivel 1 0.95 , për parametrin d, tek modelet ARFIMA(0,d,0).
d n Asimp MBB SB BBC
PB BCa PB BCa PB BCa
0.1
100 .3551 .8300 .6427 .8270 .6678 .8139 .6670
200 .2963 .6755 .4978 .6744 .5121 .6686 .5120
500 .2280 .5140 .3590 .5136 .3679 .5148 .3694
1000 .1890 .4214 .2774 .4206 .2857 .4213 .2824
0.2
100 .3581 .8309 .5830 .8270 .6121 .8122 .6250
200 .2962 .6748 .4393 .6735 .4662 .6636 .4772
500 .2318 .5143 .2994 .5125 .3298 .5116 .3263
1000 .1873 .4212 .2213 .4181 .2556 .4188 .2444
0.3
100 .3662 .8285 .5533 .8247 .5715 .8077 .6025
200 .2998 .6730 .4158 .6694 .4435 .6645 .4842
500 .2305 .5081 .3026 .5069 .3239 .5042 .3609
1000 .1886 .4143 .2404 .4169 .2585 .4158 .2901
0.4
100 .3634 .8251 .5309 .8244 .5452 .8168 .6183
200 .3060 .6674 .4010 .6705 .4160 .6640 .5041
500 .2312 .5031 .3044 .5086 .3101 .5054 .3968
1000 .1907 .4093 .2343 .4172 .2424 .4134 .3243
0.5
100 .3667 .8219 .4955 .8255 .5079 .8223 .6123
200 .3049 .6611 .3928 .6687 .3981 .6668 .5104
500 .2356 .4981 .2818 .5073 .2838 .5043 .3979
1000 .2215 .4156 .2301 .3985 .2512 .3887 .2925
PB intervali bootstrap i përqindjes. BCa intervali me zhvendosje të korrigjuar dhe i përshpejtuar.
Asimp përdor shpërndarjen asimptotike. Vlerat më të mëdha janë printuar në formatin bold.
83
Tabela 3.12 Gabimi (empirik) i llojit të parë, në përqindje, i kriterit bootstrap SP për
verifikimin e hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti AR(1).
n Cikle për
bllok
Niveli
(%)
Koeficienti i autoregresit, φ1
0 0.1 0.3 0.5
100
2 10 6.4 12.0 15.6 17.9
5 1.9 5.9 10.4 10.8
4 10 6.4 9.9 13.9 17.1
5 2.5 5.5 8.1 10.4
6 10 6.8 12.2 14.1 17.4
5 2.0 6.1 7.9 11.4
8 10 7.6 12.5 20.7 23.0
5 2.7 6.3 12.1 16.0
10 10 21.0 21.1 18.9 27.9
5 13.3 14.8 12.4 18.4
300
2 10 0.2 0.4 0.9 1.5
5 0.0 0.0 0.0 0.4
4 10 11.4 11.3 13.7 12.7
5 5.7 5.7 7.4 6.3
6 10 10.4 12.3 13.9 13.3
5 5.6 7.0 7.4 5.7
8 10 11.4 11.3 13.7 12.7
5 5.7 5.7 7.4 6.3
10 10 10.4 12.3 13.9 13.3
5 5.6 7.0 7.4 5.7
500
2 10 0.0 0.0 0.5 1.1
5 0.0 0.0 0.0 0.0
4 10 0.6 2.0 2.4 3.8
5 0.1 0.1 0.3 1.2
6 10 4.4 6.6 5.1 6.9
5 2.3 2.1 2.8 3.4
8 10 8.8 8.4 9.1 12.3
5 4.4 3.5 4.9 6.7
10 10 10.3 10.8 9.7 11.8
5 4.8 5.3 5.2 5.6
12 10 9.4 10.1 9.4 11.1
5 5.1 5.9 4.5 5.3
84
Tabela 3.13 Fuqia (empirike), në përqindje, e kriterit bootstrap SP për verifikimin e
hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti ARFIMA(1,d,0), 0.1d .
n Cikle për
bllok
Niveli
(%)
Koeficienti i autoregresit, φ1
0 0.1 0.3 0.5
100
2 10 4.5 6.5 11.6 13.7
5 0.7 3.1 5.8 8.0
4 10 3.4 8.9 11.1 14.8
5 1.1 3.9 5.3 7.5
6 10 8.0 11.5 16.5 19.7
5 3.2 5.0 8.6 10.7
8 10 16.6 22.0 27.0 29.9
5 7.0 11.0 18.2 19.4
10 10 15.6 23.9 11.4 15.8
5 8.4 15.9 5.0 8.5
300
2 10 0.0 2.6 6.3 8.0
5 0.0 0.6 1.6 2.9
4 10 0.4 3.6 7.4 10.2
5 0.0 0.7 2.5 4.4
6 10 1.6 6.9 11.0 15.6
5 0.2 2.0 4.9 6.5
8 10 6.9 13.4 17.6 19.2
5 2.0 5.5 8.9 9.8
10 10 18.6 37.6 11.9 21.0
5 10.8 27.7 5.0 12.5
500
2 10 0.0 0.0 0.2 4.4
5 0.0 0.0 0.0 0.8
4 10 0.4 1.3 3.4 11.0
5 0.1 0.1 1.4 4.3
6 10 3.8 6.0 9.2 17.7
5 0.7 1.5 3.5 9.0
8 10 8.1 8.4 11.3 19.3
5 2.0 2.7 4.8 9.0
10 10 9.0 10.2 11.2 21.7
5 3.8 5.0 5.9 11.2
12 10 9.3 12.0 12.5 19.8
5 5.3 6.8 8.9 17.8
85
Tabela 3.14 Fuqia (empirike), në përqindje, e kriterit bootstrap SP për verifikimin e
hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti ARFIMA(1,d,0), 0.2d .
n Cikle për
bllok
Niveli
(%)
Koeficienti i autoregresit, φ1
0 0.1 0.3 0.5
100
2 10 6.4 11.7 15.9 20.2
5 1.4 5.5 7.6 10.7
4 10 8.5 15.1 18.2 18.8
5 1.9 7.8 8.2 11.0
6 10 15.3 16.5 26.5 30.4
5 5.7 7.5 15.0 21.6
8 10 30.6 35.2 43.4 48.8
5 16.3 22.8 30.2 37.3
10 10 25.4 28.8 34.4 58.2
5 14.8 18.6 25.6 47.2
300
2 10 3.4 11.8 20.6 24.0
5 0.4 3.8 8.3 12.0
4 10 5.2 15.7 20.4 23.6
5 1.1 4.7 8.1 11.8
6 10 13.9 22.7 28.4 29.6
5 5.0 9.8 15.8 15.9
8 10 31.1 36.3 39.9 40.6
5 15.8 21.8 25.6 26.7
10 10 25.6 28.2 32.9 41.3
5 13.9 14.9 19.8 26.6
500
2 10 0.8 2.7 9.4 26.3
5 0.1 0.3 2.3 12.7
4 10 12.7 16.6 24.9 37.7
5 3.8 6.2 10.8 23.5
6 10 22.3 25.1 32.2 44.5
5 11.3 11.5 17.5 27.9
8 10 26.4 28.9 36.6 46.1
5 14.3 14.9 23.0 28.2
10 10 31.2 36.7 35.5 42.8
5 16.5 22.8 22.4 27.8
12 10 36.1 38.3 41.2 52.5
5 22.4 23.7 29.4 35.2
86
Tabela 3.15 Fuqia (empirike), në përqindje, e kriterit bootstrap SP për verifikimin e
hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti ARFIMA(1,d,0), 0.3d .
n Cikle për
bllok
Niveli
(%)
Koeficienti i autoregresit, φ1
0 0.1 0.3 0.5
100
2 10 15.2 26.0 30.8 34.0
5 5.7 11.1 18.4 20.0
4 10 21.6 27.7 33.5 40.1
5 9.3 14.9 20.6 26.0
6 10 30.5 34.5 40.0 47.6
5 15.7 20.1 27.3 36.2
8 10 46.5 51.4 59.2 68.6
5 30.7 36.3 48.0 57.6
10 10 38.9 43.9 55.3 74.0
5 25.7 29.9 42.7 64.7
300
2 10 22.2 42.4 46.6 51.2
5 9.4 22.3 29.5 33.0
4 10 27.9 44.3 49.2 22.2
5 12.8 26.0 31.7 9.4
6 10 42.4 50.6 55.9 27.9
5 25.6 32.7 38.1 12.8
8 10 57.8 63.6 68.6 42.4
5 41.1 45.6 50.5 25.6
10 10 51.3 54.5 58.1 68.5
5 34.9 38.2 42.6 54.5
500
2 10 19.9 28.9 46.7 65.5
5 6.9 14.4 25.9 50.0
4 10 49.9 51.3 62.7 70.0
5 28.6 32.9 45.7 54.8
6 10 58.1 60.5 64.8 71.7
5 42.1 42.9 48.9 56.2
8 10 61.3 65.2 67.4 72.3
5 45.7 48.4 52.1 56.5
10 10 61.3 65.8 68.4 73.0
5 46.9 49.5 52.7 59.3
12 10 65.8 65.5 72.8 75.3
5 49.2 45.6 55.1 58.4
87
Tabela 3.16 Fuqia (empirike), në përqindje, e kriterit bootstrap SP për verifikimin e
hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti ARFIMA(1,d,0), 0.4d .
n Cikle për
bllok
Niveli
(%)
Koeficienti i autoregresit, φ1
0 0.1 0.3 0.5
100
2 10 36.8 43.0 59.0 80.3
5 20.9 26.7 45.5 70.9
4 10 37.5 53.8 72.8 56.2
5 22.2 37.0 62.2 44.8
6 10 49.4 68.6 50.7 62.0
5 32.7 56.2 36.9 48.4
8 10 64.1 46.0 57.7 73.4
5 46.0 30.8 42.5 64.8
10 10 43.1 46.2 65.9 86.8
5 24.8 31.6 54.6 79.6
300
2 10 59.7 65.1 74.1 81.1
5 38.4 45.4 58.2 68.3
4 10 66.6 72.0 76.9 80.8
5 49.9 58.2 62.7 67.8
6 10 75.1 75.8 78.0 82.8
5 60.1 59.1 63.1 68.9
8 10 75.2 80.2 73.8 80.5
5 60.3 66.7 58.4 66.0
10 10 73.5 83.9 76.3 81.3
5 58.6 72.9 62.5 72.0
500
2 10 69.5 71.1 82.3 89.8
5 46.6 55.4 67.9 80.5
4 10 83.6 83.5 86.8 89.0
5 70.0 72.9 75.2 80.5
6 10 86.3 86.7 88.1 89.8
5 72.7 75.3 76.7 81.1
8 10 85.2 88.0 87.1 91.5
5 75.9 77.4 78.6 84.6
10 10 87.3 86.3 87.7 91.3
5 76.2 76.2 79.3 82.7
12 10 86.8 85.4 90.2 92.6
5 77.2 75.4 79.5 81.9
88
Tabela 3.17 Gabimi (empirik) i llojit të parë, në përqindje, i kriterit R/S i modifikuar
për verifikimin e hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti AR(1).
φ1 n Cungimi qL, (3.22a) Cungimi qW, (3.22b) Cungimi qM, (3.22b)
Asimp Boot Asimp Boot Asimp Boot
0.1
100 5.8 7.4 0.9 4.8 5.3 8.3
200 5.4 7.5 1.4 6.3 6.1 9.1
300 5.4 6.9 2.6 5.7 5.7 7.9
500 5.3 6.4 2.6 5.0 5.3 7.2
1000 6.1 6.2 4.0 5.8 6.2 6.9
0.4
100 3.4 6.9 2.0 5.8 5.7 8.4
200 4.9 6.6 2.5 6.7 6.8 8.6
300 3.4 5.4 2.6 4.9 5.8 5.5
500 3.9 4.9 2.6 4.3 5.6 5.9
1000 5.3 5.5 4.6 5.3 6.6 5.6
0.5
100 2.7 5.8 1.9 4.5 4.1 8.4
200 2.9 6.0 2.3 5.5 6.8 7.5
300 2.6 4.5 2.7 4.9 5.9 5.5
500 3.5 5.6 3.3 5.8 7.1 6.5
1000 3.7 4.5 3.8 4.3 5.1 5.3
0.9
100 1.0 2.9 0.5 7.2 0.5 5.6
200 1.4 4.1 4.5 10.4 1.7 8.9
300 2.0 4.0 9.8 8.2 3.4 5.8
500 2.1 4.8 15.8 7.9 6.2 7.0
1000 2.3 4.3 12.6 6.0 6.5 5.7
Asimp përdor shpërndarjen asimptotike. Boot përdor shpërndarjen bootstrap.
Tabela 3.18 Fuqia (empirike), në përqindje, e kriterit R/S i modifikuar për verifikimin
e hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti ARFIMA(0,d,0).
d n Cungimi qL, (3.22a) Cungimi qW, (3.22b) Cungimi qM, (3.22b)
Asimp Boot Asimp Boot Asimp Boot
0.05
100 4.0 9.9 0.3 5.9 6.2 10.5
200 5.8 11.4 1.1 5.6 7.0 12.4
300 6.0 10.6 1.6 6.1 7.8 12.6
500 7.5 11.7 3.4 6.3 9.1 14.2
1000 10.4 12.6 5.3 8.5 11.7 13.5
0.25
100 3.8 17.2 0.8 6.3 19.5 26.5
200 17.1 26.6 3.2 16.0 40.3 35.0
300 24.6 29.4 8.4 20.5 48.4 39.0
500 38.0 37.9 22.7 30.3 64.4 48.2
1000 54.9 51.8 39.0 41.8 79.9 60.2
0.30
100 3.5 17.6 0.8 6.7 23.9 28.2
200 13.3 23.4 3.5 16.9 43.3 33.6
300 27.6 33.4 14.3 25.4 61.0 45.0
500 42.1 41.4 30.6 35.4 71.3 51.1
1000 58.5 53.4 47.7 48.4 84.3 63.7
0.45
100 1.0 11.9 0.7 10.9 32.3 28.2
200 6.4 23.6 9.3 25.3 56.3 38.0
300 18.6 30.8 28.8 34.9 68.3 45.5
500 39.4 41.3 52.6 48.6 81.8 57.2
1000 65.1 61.5 75.9 65.2 92.9 72.6
Asimp përdor shpërndarjen asimptotike. Boot përdor shpërndarjen bootstrap.
89
PËRFUNDIME
Në këtë tezë u prezantua koncepti i memories së gjatë ose varësisë afatgjatë, i një
serie kohore stacionare. Ky koncept është i lidhur ngushtë me strukturën e rendit të
dytë të një serie kohore stacionare dhe ndikon drejtpërdrejt në konkluzionet
statistikore. Ekzistenca e memories së gjatë sjell ndryshimin e rendit të konvergjencës
së autokorrelacioneve të serisë si dhe të dispersionit të mesatares së zgjedhjes.
Gjithashtu ne prezantuam metodat e rizgjedhjes bootstrap për seritë kohore duke
propozuar një metodë bootstrap me blloqe të përbërë nga cikle.
Në kapitullin e parë të tezës u qartësua se ekzistojnë modele të ndryshme për
përshkrimin e memories së gjatë dhe jepet një përshkrim i tyre. Ndër to mund të
veçojmë modelet ARFIMA(p,d,q), të cilat janë një përgjithësim i modeleve me
memorie të shkurtër ARIMA(p,d,q). Në literaturë ekzistojnë metoda të shumta për
evidentimin dhe vlerësimin e memories së gjatë. Në kapitullin e parë përshkruhen disa
prej tyre. Do të veçonim vlerësuesit gjysmë parametrikë të periodogramës GPH
(Geweke dhe Porter-Hudak, 1981) dhe SP (Reisen, 1994). Përdorimi i tyre kërkon
vetëm përcaktimin e densitetit spektral të një serie kohore rreth origjinës pa qenë
nevoja e përcaktimit të parametrave të pjesë ARMA të modelit.
Metodat bootstrap, të prezantuara nga Efron (1979), janë metoda me rizgjedhje shumë
të përhapura në kohët e sotme. Kjo kryesisht për faktin se ato janë të thjeshta në
përdorim dhe mund të përdoren për statistika sado të ndërlikuara, duke dhënë shpesh
herë rezultate të përmirësuara në lidhje me metodat klasike (veçanërisht kur vëllimi i
zgjedhjes është relativisht i vogël). Në kapitullin e dytë jepet një përmbledhje të
metodave bootstrap për rizgjedhje nga vrojtime të tipit seri kohore, që përdoren më
shpesh në literaturë. Mund të veçojmë metodat bootstrap me blloqe, që përdoren për
të përsëritur në mënyrë joparametrike një seri kohore stacionare. Karakteristika e
përbashkët e metodave bootstrap me blloqe është fakti se ato kryejnë rizgjedhje me
blloqe vrojtimesh të njëpasnjëshme. Metoadat e ndryshme ndryshojnë nga mënyra e
përcaktimit të blloqeve.
Në kapitullin e tretë ne propozuam një metodë bootstrap për seritë kohore, bootstrapin
me blloqe të formuar nga cikle. Cikli është përcaktuar si një çift vargjesh me vrojtime
të njëpasnjëshme që ndodhen nën dhe mbi vlerën mesatare (ose anasjelltas). Ekonomi
dhe Butka (2011) kanë treguar se kjo metodë mund të jetë e dobishme në vlerësimin
pikësor të parametrit d të proceseve ARFIMA(0,d,0). Butka dhe Capollari (2013a,b),
Butka dhe Beta (2014), Butka etj. (2014), kanë treguan efikasitetin e kësaj metode për
vlerësimin pikësor dhe intervalor të parametrit të memories, si dhe për realizimin e
kontrollit të hipotezave rreth memories së gjatë. Nga eksperimentet Monte Carlo të
zhvilluara në vazhdim të kapitullit të tretë, arrijmë në konkluzionin se metoda
bootstrap me blloqe me cikle përmirëson vlerësimet pikësore dhe intervalore të
parametrit të memories. Krahasuar me metoda të tjera bootstrap me blloqe, si MBB
(Kunsch, 1989) dhe SB (Politis dhe Romano, 1994), metoda e propozuar në këtë tezë
performon më mirë në kuptimin e një gabimi katror mesatar më të vogël të
vlerësimeve pikësore dhe një probabilitet mbulimi më të madh të intervaleve të
besimit. Gjithashtu përdorimi i kësaj metode jep teste për kontrollin e ekzistencës së
memories së gjatë me gabim të llojit të dytë më të vogël se sa testi përkatës asimptotik
duke ruajtur gabimin e llojit të parë afër vlerave të përcaktuara.
Rezultatet e përftuara varen, ndër të tjera, nga numri i cikleve për bllok. Ky numër
përcakton gjatësinë mesatare të një blloku. Përcaktimi i numrit optimal të cikleve për
90
bllok varet nga disa faktorë, si natyra e autokorrelacioneve të serisë, ekzistenca ose jo
e pjesës ARMA të modelit, gjatësia e serisë, etj.
Gjetja e ndonjë algoritmi për përcaktimin empirik të numrit të cikleve për bllok është
objekt i studimeve të ardhshme. Gjithashtu mendojmë se, idea e kryerjes së
rizgjedhjeve të cikleve brenda çdo blloku të rizgjedhur do të ishte me interes për të
ardhmen.
Një tjetër aspekt i synimeve të ardhshme do të jetë marrja në konsideratë e aplikimit
të metodave bootstrap në ndonjë seri kohore, mundësisht me të dhëna nga vendi ynë,
që mund të shfaqë karakteristika të një procesi me memorie të gjatë.
SHTOJCA
1. Shpërndarja e gjatësisë së ciklit
Në këtë shtojcë tregohet vërtetësia e tabelës së densitetit probabilitar të gjatësisë së
ciklit të formuar nga procesi zhurmë e bardhë gausiane, { }t (shih tabelën 3.1).
Duke pasur parasysh përcaktimin e ciklit i dhënë në paragrafin 3.1, mund të themi që,
një cikël me fillim në kohën t, ka gjatësi tL k , atëherë dhe vetëm atëherë kur 0t ,
1 0t k , 0t k (ose anasjellas 0t , 1 0t k , 0t k ) dhe ndryshoret
ndërmjet t dhe 1t k , (gjithsej 2k të tilla) të jenë një kombinim i një numri
vlerash pozitive (mund të jenë dhe zero vlera) të ndjekur nga një varg vlerash negative
(ose anasjellas). Probabiliteti i çdo kombinimi është i njëjtë dhe nga pavarësia e
procesit kemi që ky probabilitet është 1
1
2k. Me që gjithsej janë 1k kombinime për
çdo alternim të shenjës se termit të parë të ciklit, atëherë marrim formulën e
përgjithshme të shpërndarjes probabilitare, sipas barazimit të mëposhtëm
1
1 1( ) 2( 1)
2 2t k k
kP L k k
Për shembull, për të pasur barazimin 1 5L , pra 5k , duhet dhe mjafton që të
ndodhë një prej këtyre rasteve që përjashtojnë njëri tjetrin (në këtë rast 1t ).
r.1: 1 0 , 2 0 , 3 0 , 4 0 , 5 0 dhe 6 0 ; (3 pozitive + 0 negative)
r.2: 1 0 , 2 0 , 3 0 , 4 0 , 5 0 dhe 6 0 ; (2 pozitive + 1 negative)
r.3: 1 0 , 2 0 , 3 0 , 4 0 , 5 0 dhe 6 0 ; (1 pozitive + 2 negative)
r.4: 1 0 , 2 0 , 3 0 , 4 0 , 5 0 dhe 6 0 ; (0 pozitive + 3 negative)
si dhe rastet r.5, r.6, r.7 dhe r.8, që merren si më sipër duke ndërruar shenjen e
mosbarazimeve.
Pra gjithsej janë 8=2(5-2+1) kombinime (raste). Probabiliteti i secilit rast është
6 5 1
1 1
2 2 . Pra kemi
1 5 1 5
1 5 1( 5) 2(5 1)
2 2P L
).
91
2. Karakteristikat e shpërndarjes së gjatësisë së ciklit
Në këtë shtojcë ne tregojmë disa karakteristika numerike si, asimetria dhe sheshtësia e
ndryshores së rastit së gjatësisë së ciklit nga një zhurmë e bardhë gausiane.
Së pari tregojmë barazimet (3.1) që përdorëm tek paragrafi 3.2.1.
Shqyrtojmë serinë funksionale1
1( )
k
k
f xx
, e cila konvergjon uniformisht për x>1,
pra dhe në një fqinjësi të 2, për të cilin ne interesohemi. Nga formula e progresionit
gjeometrik është i vërtetë barazimi
1
1 1
1
k
k x x
(Sh.1)
Barazimi i parë i barazimeve (3.1) rrjedh menjëherë nga zëvendësimi i x me 2 tek
barazimi (Sh.1) duke përftuar
1
1 1
2 2kk
(Sh.2)
Nga derivimi anë për anë i brazimit (Sh.1) marrim
1
21
1 1
1
k
k
kx x
(Sh.3)
(ne interesohemi për x = 2, pra shqyrtojmë funksionin f në një fqinjësi të 2). Atëherë,
zëvendësojmë përsëri x=2 dhe pas veprimesh gjejmë barazimin
1
1 11
2 2kk
k
, prej nga 1
12
2kk
k
(Sh.4)
Më tej derivojmë barazimin (Sh.3) dhe gjejmë
2
31
1 2( 1)
1
k
k
k kx x
(Sh.5)
Përsëri, zëvendësojmë x=2, kryejmë veprime dhe gjejmë
2
1 1
12
4 2 2k kk k
k k
prej nga
2
1
62k
k
k
(Sh.6)
Duke vepruar si më sipër, hap pas hapi gjejmë barazimet
3
1
262k
k
k
(Sh.7)
4
1
1502k
k
k
(Sh.8)
5
1
10822k
k
k
(Sh.9)
92
Duke përdorur barazimet e mësipërme ne mund të gjejmë lehtësisht parametrat e
shpërndarjes së gjatësisë Lt të ciklit.
a) Pritja matematike dhe dispersioni janë të dyja të barabarta me 4, siç është treguar
tek paragrafi 3.2.1.
b) Për të gjetur asimetrinë, nisemi nga përkufizimi i Pirsonit
3X
E
, ku ( )E X dhe ( )D X . Atëherë, zëvendësojmë, dhe pas
veprimesh gjejmë
33 3
3
( ) ( ) 3 ( ) ( ) [ ( )]
( ) ( )
t t t t t t
tt
L E L E L E L D L E LE
D L D L
(Sh.10)
Për të gjetur momentin fillestar të rendit të tretë kryejmë veprimet
4 3 4 33 3
2 2 2 1 1
1( )
2 2 2 2 2t k k k k k
k k k k k
k k k k kE L k
dhe, duke shfrytëzuar barazimet
(Sh.7) dhe (SH.8), gjejmë
3( ) 124tE L (Sh.11)
Përfundimisht, zëvendësojmë tek barazimi (Sh.10) dhe, pas veprimesh, gjejmë
3
3
124 3 4 4 4 3
2 2
(Sh.12)
c) Në mënyrë të ngjashme veprohet për të gjetur koeficienti e sheshtësisë
4 4
4 4
( 43 3
2( )
t t t
t
E L E L E L
D L
, dhe pasi gjejmë, nga barazimet (Sh.8)
dhe (Sh.9), momentin e rendit të katërt
4( ) 932tE L (Sh.13)
vazhdojmë me veprimet dhe marrim rezultatin e treguar tek barazimi (3.6)
4 3 2
4
( ) 16 ( ) 96 ( ) 256 ( ) 256 100 133 3
2 16 4
t t t tE L E L E L E L
(Sh.14)
3. Një shënim për komandën “b.star”
Shënim: Tek komanda 'b.star', në se përdoret argumenti "round=TRUE" dhe
argumenti x është matricë me disa shtylla, atëherë vlerat e gjetura të gjatësisë së
bllokut për metodën CB kanë (gabimisht) të njëjtën vlerë për çdo shtyllë, dhe
pikërisht maksimumin e gjatësive të të gjithë shtyllave.
93
Vërejmë se duhet bërë një korrigjim tek rreshti i katërt nga fundi:
Është:
“BstarCB <− ifelse(BstarCB > Bmax, Bmax, ifelse(BstarCB < 1, 1, max(1,
round(BstarCB))))”
Duhet:
“BstarCB <− ifelse(BstarCB > Bmax, Bmax, ifelse(BstarCB < 1, 1,
round(BstarCB))))”
94
LITERATURA
Abramowitz, M., Stegun, I. (1964): Handbook of Mathematical Functions with
Formulas, Graphs, and Mathematical Tables. Dover, New York.
Agiakloglou, C., Newbold, P., Wohar, M. (1993): Bias in an estimator of the
fractional difference parameter. Journal of Time Series Analysis, Vol. 14, No. 3, 235-
246.
Anderson, T.W., Walker, A.M. (1964): On the asymptotic distribution of the
autocorrelations of a sample from a linear stochastic processes. Annals of
Mathematical Statistics, Vol. 35, No. 3, 1296-1303.
Andrews, D., Lieberman, O., Marmer, V. (2006): Higher-order improvements of the
parametric bootstrap for long memory Gaussian processes. Journal of Econometrics,
Vol. 133, 673-702.
Arteche, J., Orbe, J. (2009): Using the bootstrap for finite sample confidence intervals
of the log periodogram regression. Computational Statistics and Data Analysis, Vol.
53, No. 6, 1940-1953.
Arteche, J., Orbe, J. (2014): A bootstrap approximation for the distribution of the
local Whittle estimator. IVt Workshop in Time Series Econometrics, Universidad de
Zaragoza, Spain.
Babu, G. J., Singh, K. (1983): Inference on means using the bootstrap. The Annals of
Statistics, Vol. 11, No. 3, 999-1003.
Baillie, R.T. (1996): Long memory processes and fractional integration in
econometrics. Journal of Econometrics, Vol. 73, 5-59.
Beran, J. (1994): Statistics for Long Memory Processes. Chapman & Hall, New York.
Bhattacharya, R., Gupta, V., Waymire, W. (1983): The Hurst effect under trends.
Journal of Applied Probability, Vol. 20, 649-662.
Bickel, P.J., Buhlmann, P. (1999): A new mixing notion and functional central limit
theorems for a sieve bootstrap in time series. Bernoulli, Vol. 5, No. 3, 413-446.
Bose, A. (1988): Edgeworth correction by bootstrap in autoregressions. The Annals of
Statistics, Vol. 16, No. 4, 1709-1722.
Box, G.E.P., Jenkins, G.M. (1976): Time Series Analysis Forecasting and Control, 2nd
edition. Holden-Day, San Francisco.
Brockwell, P.J., Davis, R.A. (1991): Time Series: Theory and Methods, 2nd
edition.
Springer-Verlag, New York (paperback in 2009).
Buhlmann, P. (1997): Sieve bootstrap for time series. Bernoulli, Vol. 3, No. 2, 123-
148.
Burlaga, L., Klein, L. (1986): Fractal structure of the interplanetary magnetic field.
Journal of Geophysical Research, Vol. 91, No. A1, 347-350.
Butka, A., Beta, Dh. (2014): Bootstrap estimation of long-range dependence in
ARFIMA processes. Journal of Advances in Mathematics, Vol. 7, No. 2, 1266-1276.
Butka, A., Capollari, Gj. (2013a): A bootstrap approach for detection of long range
dependence. Proceedings Papers V1 of the first international scientific conference on
95
"research and education – challenges towards the future "(ICRAE 2013), University
of Shkodra Luigj Gurakuqi”, Shkodra, Albania.
Butka, A., Capollari, Gj. (2013b): Bootstrap confidence intervals for the fractional
difference parameter in ARFIMA model. Proceedings of the Fifth International
Scientific Conference – FMNS2013, South-West University “Neofit Rilski”,
Blagoevgrad, Vol. 1, 60-66.
Butka, A., Puka, Ll., Palla, I. (2014): Bootstrap testing for long range dependence.
International Journal of Mathematics Trends and Technology, Vol. 8, No. 3, 164-172.
Cao, R., Febrero-Bande, M., Gonzalez-Manteiga, W., Prada-Sanchez, J. M., Garda-
Jurado, I. (1997): Saving computer time in constructing consistent bootstrap
prediction intervals for autoregressive processes. Communications in Statistics -
Simulation and Computation, Vol. 26, No. 3, 961-978.
Carlstein, E. (1986): The use of subseries methods for estimating the variance of a
general statistic from a stationary time series. The Annals of Statistics, Vol. 14, No. 3,
1171-1179.
Carlstein, E., Do, K-A., Hall, P., Hesterberg, T., Kunsch, H. R. (1998): Matched-
block bootstrap for dependent data. Bernoulli, Vol. 4, No. 3, 305-328.
Carpenter, J., Bithell, J. (2000): Bootstrap confidence intervals: when, which, what? A
practical guide for medical statisticians.
Cavazos-Cadena, R. (1994): The asymptotic distribution of the sample
autocorrelations for a class of linear filters. Journal of Multivariate Analysis, Vol. 48,
249-274.
Chatfield, C. (1980): Inverse Autocorrclations, Journal of the Royal Statistical Society
A, Vol. 142, 363-377.
Chen, G., Abraham, B. and Peiris, S. (1993): Lag window estimation of the degree of
differencing in fractionally integrated time series model. Journal of Time Series
Analysis, Vol. 15, No. 5, 473-487.
Chernick, M.R. (2008): Bootstrap Methods: A Guide for Practitioners and
Researchers, 2nd
Edition. John Wiley & Sons, New Jersey.
Cleveland, W.P. (1972): The Inverse Autocorrelations of a Time Series and their
Applications. Technometrics, Vol. 14, 277-298.
Cox, D. R. (1984): Long-range dependence: a review. Statistics: an appraisal, H.A.
David and H.T. David eds., Iowa State University Press, 1984, 55-74.
Dahlhaus, R. (1989): Efficient parameter estimation for self-similar processes. Annals
of Statistics, Vol. 17, No. 4, 1749-1766.
Datta, S., Sriram, T. N. (1997): Bootstrap inference for a first-order autoregression
with positive innovations. Journal of the American Statistical Association, Vol. 90,
No. 432, 1289–1300.
Davidson, J. (1997): Stochastic Limit Theory. Oxford University Press.
Davidson, R., MacKinnon, J. G. (2000). Bootstrap Tests: How Many Bootstraps?
Econometric Reviews, Vol. 19, No. 1, 55-68.
Davison, A. C., Hinkley, D. V. (1997). Bootstrap methods and their application.
Cambridge University Press, USA.
96
Devaney, R. (1999). The Mandelbrot set, the farey tree, and the fibonaçi sequence.
The American Mathematical Monthly, Vol. 106, No.4, 289-302.
DiCiccio, T. J., Efron, B. (1996): Bootstrap confidence intervals. Statistical Science,
Vol. 11, No. 3, 189-212.
Efron, B. (1979): Bootstrap methods: another look at the jackknife. The Annals of
Statistics, Vol. 7, No. 1, 1-26.
Efron, B. (1982): The Jackknife, Bootstrap, and Other Resampling Plans. Siam
monograph, No. 38, CBMS-NSF, Regional conference series in applied mathematics,
Philadelphia.
Efron, B. (1987): Better bootstrap confidence intervals, Journal of the American
Statistical Association, Vol. 82, No. 397, 171-185.
Efron, B., Tibshirani, R.J. (1993): An Introduction to the Bootstrap. Chapman & Hall.
Ekonomi, L., Butka, A. (2011): Jackknife and bootstrap with cycling blocks for the
estimation of fractional parameter in ARFIMA model. Turkish Journal of
Mathematics, Vol. 35, No. 1, 151-158.
Ekonomi, L., Butka, A. (2014): The validity of the bootstrap with cycling blocks in
stationary time series. Pensee Journal, Vol. 76, No. 3, 285-303.
Fox, R., Taqqu, M.S. (1986): Large-sample properties of parameter estimates for
strongly dependent stationary Gaussian time series. The Annals of Statistics, Vol. 14,
No. 2, 517-532.
Franco, G.C., Reisen, V.A. (2004): Bootstrap techniques in semiparametric estimation
methods for ARFIMA models: a comparison study. Computational Statistics & Data
Analysis, Vol. 19, 243–259.
Franco, G.C., Reisen, V. A. (2007): Bootstrap approaches and confidence intervals for
stationary and non-stationary long-range dependence. Physica A, Vol. 375, No. 2,
546-562.
Geweke, J., Porter-Hudak, S. (1983): The estimation and application of long memory
time series model. Journal of Time Series Analysis, Vol. 4, No. 4, 221-238.
Giriatis, L., Robinson, P., Surgailis, D. (1999): Variance-type estimation of long
memory. Stochastic Processes and their Applications, Vol. 80, 1-24.
Granger, C.J., Joyex, R. (1980): An introduction to long-memory time series and
fractional differencing. Journal of Time Series Analysis, Vol. 1, No. 1, 15-29.
Guegan, D. (2005): How can we define the concept of long memory? An Econometric
Survey. Econometric Reviews, Vol. 24, No. 2, 113-149.
Hall, P. (1988): Theoretical comparison of bootstrap confidence intervals. The Annals
of Statistics, Vol. 16, No. 3, 927-953.
Hall, P. (1992): Effect of bias estimation on coverage açuracy of bootstrap confidence
intervals for a probability density. The Annals of Statistics, Vol. 20, No. 2, 675-694.
Hall, P., Horowitz, J. L. (1996): Bootstrap critical values for tests based on
generalized-method-of-moments estimators. Econometrica, Vol. 64, No. 4, 891-916.
Hall, P., Horowitz, J. L., Jing, B. (1995): On blocking rules for the bootstrap with
dependent data. Biometrika, Vol 82, No. 3, 561-574.
97
Hall, P., Wilson, S. R. (1991): Two guidelines for bootstrap hypothesis testing.
Biometrics, Vol. 47, No. 2, 757-762.
Hannan, E. (1973): The asymptotic theory of linear time series models. Journal of
Applied Probability, Vol. 10, 130-145.
Haslett, J., Raftery, A.E. (1989): Space-time modeling with long-memory
dependence: assessing Ireland’s wind power resource. Applied Statistics, Vol. 38, No.
1, 1-50.
Hesterberg, T. (1997): Matched-Block Bootstrap for long Memory Processes.
Technical Report No. 66, Research Department, MathSoft, Inc. 1700 Westlake Ave.
N., Suite 500, Seattle, WA 98109.
Higuchi, T. (1988): Approach to an irregular time series on the basis of the fractal
theory. Physica D: Nonlinear Phenomena, Vol. 31, No. 2, 277-283.
Hinkley, D. V. (1988): Bootstrap methods. Journal of the Royal Statistical Society.
Series B (Methodological), Vol. 50, No. 3, 321-337.
Hosking, J.R.M. (1981): Fractional differencing. Biometrica, Vol 68, No. 1, 165-176.
Hosking, J.R.M. (1996): Asymptotic distributions of the sample mean,
autocovariances, and autocorrelations of long-memory time series. Journal of
Econometrics, Vol. 73, 261-284
Hurst, H. (1951): Long-term storage capacity of reservoirs. Transactions of the
American Society of Civil Engineers, vol. 116, 770-799.
Hurvich, C., Deo, R., Brodsky,J. (1998): The mean squared error of Geweke and
Porter-Hudak’s estimator of the memory parameter of a long-memory time series.
Journal of Time Series Analysis, Vol. 19, No. 1, 19-46.
Kapetanios, G., Papailias, F. (2011): Block bootstrap and long memory. Working
Papers No. 679, Queen Mary, University of London.
Kapetanios, G., Psaradakis, Z. (2006): Sieve bootstrap for strongly dependent
stationary processes. Working Papers No. 552, Queen Mary, University of London.
Kim, Y. M., Nordman, D. J. (2011): Properties of block bootstrap under long-range
dependence. Sankhya A., Vol. 73, No. 1, 79-109.
Kolmogorov, A.N. (1941): Local structure on turbulence in incompressible fluid for
very large Reynolds numbers. C.R. Acad. Sci. U.R.S.S., Vol. 30, 299-303. (translated
in English by Levin, V. (1991): Turbulence and Stochastic Process: Kolmogorov's
Ideas 50 Years On (Jul. 8, 1991), Proceedings: Mathematical and Physical Sciences,
Vol. 434, No. 1890, 9-13, Published by: The Royal Society).
Kreiss, J. (1992): Bootstrap procedures for AR(∞)-processes. In: Jockel, K.H., Rothe,
G., Sendler, W. (Eds.), Bootstrapping and Related Techniques. Springer, Heidelberg,
107-113.
Kreiss, J. and Paparoditis, E. (2003): Autoregressive-aided periodogram bootstrap for
time series. The Annals of Statistics, Vol. 31, No. 6, 1923-1955.
Kunsch, H. R. (1987): Statistical aspects of self-similar processes. Proceedings of the
First World Congress of the Bernoulli Society, VNU Science Press, Utrecht, 1, 67-74.
Kunsch, H. R. (1989): The jackknife and the bootstrap for general stationary
observations. The Annals of Statistics, Vol. 17, No. 3, 1217-1241.
98
Lahiri, S. N. (1992): Edgeworth correction by ‘moving block’ bootstrap for stationary
and nonstationary data. Exploring the Limits of Bootstrap, John Wiley, New York,
183-214.
Lahiri, S. N. (1993): On the moving block bootstrap under long range dependence.
Statistics & Probability Letters, Vol. 18, No. 5, 405-413.
Lahiri, S. N. (1999): Theoretical comparisons of block bootstrap methods. The Annals
of Statistics, Vol. 27, No. 1, 386-404.
Lamperti, J. (1962): Semi-stable stochastic processes. Transactions of the American
Mathematical Society, Vol. 104, No. 1, 62-78.
Leland, W., Taqqu, M., Willinger, W., Wilson, D. (1994): On the self-similar nature
of Ethernet traffic. IEEE/ACM Transactions on Network, Vol. 2, No. 1, 1-15.
Lieberman, O., Rosemarin, R., Rousseau, J. (2012): Asymptotic theory for maximum
likelihood estimation of the memory parameter in stationary Gaussian processess.
Econometric Theory, Vol. 28, No. 2, 457-470.
Lo, A. W. (1991): Long-Term Memory on Stock Market Prices. Econometrica, Vol.
59, No. 5, 1279-1313.
MacKinnon, J. G. (2007): Bootstrap Hypothesis Testing. Working Paper, No. 1127,
Department of Economics, Queen’s University, Canada.
Mandelbrot, B.B. (1975): Limit theorems of the self-normalized range for weakly and
strongly dependent processes. Zeitschrift für Wahrscheinlichkeitstheorie und
Verwandte Gebiete, Vol. 31, No. 4, 271-285.
Mandelbrot, B.B. (1983): The fractal geometry of nature. Freeman, San Francisco.
Mandelbrot, B.B., Van Ness, J.W. (1968): Fractional Brownian motions, fractional
noises and applications. SIAM Review, Vol. 10, No. 4, 422-437.
Mandelbrot, B.B., Wallis, J.R. (1968): Noah, Joseph, and operational hydrology.
Water Resources Research, Vol. 4, No. 5, 909-918.
Mandelbrot, B.B., Wallis, J.R. (1969 a): Computer experiments with fractional
Gaussian noises, Part 1-3. Water Resources Research: 5, 228-267.
Mandelbrot, B.B., Wallis, J.R. (1969 b): Some long-run properties of geophysical
records (Global dependence in geophysical records). Water Resources Research: 5,
321-340.
Mandelbrot, B.B., Wallis, J.R. (1969 c): Robustness of the rescaled range R/S and the
measurement of the non-cycling long-run statistical dependence. Water Resources
Research, Vol. 5, 967-988.
McLeod, A. I., Hipel, K. W. (1978): Preservation of the rescaled adjusted range part
1. a reassessment of the Hurst phenomenon. Water Resources Research, Vol. 14, No.
3, 491-508.
Murphy, A., Izzeldin, M. (2009): Bootstrapping long memory tests: some Monte
Carlo results. Computational Statistics and Data Analysis, Vol. 53, No. 6, 2325-2334.
Naqo, M. (2005): Statistika Matematike. Tiranë, Shtëpia Botuese e Librit Universitar.
Newbold, P., Agiakloglou, C. (1993): Bias in the sample autocorrelations of fractional
noise. Biometrika, Vol. 80, No.3, 698-702.
99
Palma, W. (2007): Long-Memory Time Series: Theory and Methods. Wiley Series in
Probability and Statistics, Wiley, New Jersey.
Paparoditis, E., Politis, D.N. (1999): The Local Bootstrap for Periodogram Statistics.
Journal of Time Series Analysis, Vol. 20, No. 2, 193-222.
Paparoditis, E., Politis, D.N. (2002): Local block bootstrap. C. R. Acad. Sci. Paris,
Vol. 355, No. 11, 959-962.
Park, D., Willemain, T.R. (1999): The threshold bootstrap and threshold jackknife.
Computational Statistics & Data Analysis, Vol. 31, 187-202.
Patton, A., Politis, D.N., Whittle, H. (2009): CORRECTION TO `Automatic Block-
Length Selection for the Dependent Bootstrap' by D.N. Politis and H. White.
Econometric Reviews, Vol. 28, No. 4, 372-375.
Politis, D.N., Romano, J.P. (1991): A circular block-resampling procedure for
stationary data. Technical Report No. 370, National Science Foundation Grant
DMS89-57217.
Politis, D.N., Romano, J.P. (1994): The stationary bootstrap. Journal of the American
Statistical Association, Vol. 89, No. 428, 1303-1313.
Politis, D.N., White, H. (2004): Automatic block-length selection for the dependent
bootstrap. Econometric Reviews, Vol. 23, No.1, 53-70.
Puka, LL. (2010): Hyrje në proceset e rastit. Mediaprint, Tiranë.
Ramsey, F. L. (1974): Characterization of the partial autocorrelation function. Annals
of Statistics, Vol. 2, No.6, 1291-1301.
Reisen, V. A. (1994): Estimation of the fractional differencing parameter in the
ARIMA(p,d,q) model using the smoothed periodogram. Journal of Time Series
Analysis, Vol. 15, No. 3, 335-350.
Robinson, P. (1995a): Log-periodogram regression of time series with long range
dependence. The Annals of Statistics, Vol. 23, No. 3, 1048-1072.
Robinson, P. (1995b): Gaussian semiparametric estimation of long range dependence.
The Annals of Statistics, Vol. 23, No. 5, 1630-1661.
Romano, J. (1988): A bootstrap revival and some nonparametric distance tests.
Journal of the American Statistical Association, Vol. 83, No. 403, 698-708.
Samorodnitsky, G. (2006): Long Range Dependence. Foundation and Trends in
Stochastic Systems, Vol. 1, No 3, pp 163–257.
Samorodnitsky, G. and Taqqu, M. (1994). Stable non-Gaussian random processes.
Chapman & Hall.
Silva, E.M., Franco, G.C., Reisen, V.A., Cruz, F.R.B. (2006): Local bootstrap
approaches for fractional differential parameter estimation in ARFIMA models.
Computational Statistics & Data Analysis, Vol. 51, 1002-1011.
Singh, K. (1981): On the Asymptotic Açuracy of Efron’s Bootstrap, Annals of
Statistics. Vol. 9, No. 6, 1187-1195.
Sowell, F. (1992): Maximum likelihood estimation of stationary univariate
fractionally integrated time series models. Journal of Econometrics, Vol. 53, 165-188.
100
Taqqu, M., Teverovsky, V., Willinger, W. (1995): Estimators for long-range
dependence: an empirical study. Fractals, Vol. 3, 785-798.
Teverovsky, V., Taqqu, M. S. (1997): Testing for long-range dependence in the
presence of shifting means or the slowly declining trend, using a variance-type
estimator. Journal of Time Series Analysis, Vol. 18, No. 3, 279-304.
Teverovsky, V., Taqqu, M. S., Willinger, W. (1999): A critical look at Lo’s modified
R/S statistic. Journal of Statistical Planning and Inference, Vol. 80, 211-227.
Wang, W., Van Gelder, P. H. A., Vrijling, J. K., Chen, X. (2007): Detecting long-
memory: Monte Carlo simulations and application to daily streamflow processes.
Hydrology and Earth System Sciences, Vol. 11, 851-862.
Whittle, P. (1951): Hypothesis testing in time series analysis. Hafner, New York.
101
Përmbledhje
Gjatë viteve të fundit, një literaturë e bollshme i është kushtuar studimit të serive kohore me memorie
të gjatë. Për matjen e intesitetit të memories së gjatë të një procesi rasti përdoren dy madhësi të
ndryshme.
1. Madhësia (0, 1)H , që quhet eksponenti Hurst ose parametri i vetëngjashmërisë, dhe përdoret
gjerësisht në literaturën e proceseve me vetëngjashmëri dhe të lëvizjes brouniane thyesore.
2. Parametri ( 0.5, 0.5)d , që quhet parametri i memories dhe përdoret në literaturën rreth proceseve
autoregressive të integruar në mënyrë thyesore me mesatare të lëvizshme, ARFIMA(p,d,q), të
prezantuara nga Granger dhe Joyeux (1980) dhe Hosking (1981), pavarësisht nga njëri tjetri.
Këto madhësi lidhen nëpërmjet barazimit 0.5H d .
Metodat bootstrap janë teknika rizgjedhjeje të prezantuara fillimisht nga Efron (1979). Prej atëherë ato
kanë marrë një zhvillim të shpejtë, falë thjeshtësisë dhe gjithëpërfshirjes së përdorimit të tyre. Një
procedurë e përgjithshme bootstrap për seritë kohore stacionare, e çliruar nga specifikimi i modelit,
është teknika bootstrap me blloqe, e cila rizgjedh (me kthim) blloqe me vrojtime të njëpasnjëshme.
Në këtë tezë, ne studiojmë përdorimet e metodave bootstrap për rizgjedhjen e serive kohore me
memorie të gjatë. Ne propozojmë një teknikë alternative, bootstrapin me blloqe me cikle. Ne
krahasojmë këtë metodë bootstrap me procedurat e tjera ekzistuese me anë të një eksperimenti Monte
Carlo duke vlerësuar parametrin e memories d. Gjithashtu tregohet se, metoda e propozuar është e
dobishme për të zbuluar ekzistencën e memories së gjatë në një seri kohore stacionare.
Fjalëkyçe: seri kohore, memorie e gjatë, modeli ARFIMA, metodat e rizgjedhjes, bootstrap me blloqe,
interval besimi.
Abstract
In the last years a wide literature has been dedicated to the study of the long memory time series. There
are usually two different names for the measure of long memory in a random process.
1. The quantity is called Hurst exponent or self-similarity parameter and is universally
recognized by the literature on self-similar processes and fractional Brownian motion.
2. The parameter is the memory parameter and is due to the literature about
autoregressive fractionally integrated moving average, ARFIMA(p,d,q), processes introduced by
Granger and Joyeux (1980) and Hosking (1981), separately.
These quantities are related by the equation 0.5H d .
Bootstrap methods are resampling techniques first introduced by Efron (1979). They have developed
quickly since then due to their simplicity and generality in use. A general bootstrap procedure for
stationary time series, free of specifying modeling, is the block bootstrap technique, that resamples
(with replacement) blocks of consecutive observations.
In this thesis we study the implement of bootstrap methods for replicating the time series with long
memory. We propose an alternative technique, the block bootstrap with cycles. We compare this
bootstrap method with other existing procedures in a wide Monte Carlo experiment, by estimating the
memory parameter d. It is also demonstrated that, the proposed approach is useful to detect the
presence of long memory in a stationary time series.
Keywords: time series, long memory, ARFIMA model, resampling methods, block bootstrap,
confidence interval.
(0, 1)H
( 0.5, 0.5)d