UNIVERSITETI I TIRANËS FAKULTETI I SHKENCAVE TË NATYRËS · Tabela 3.18 Fuqia (empirike), në...

UNIVERSITETI I TIRANËS

FAKULTETI I SHKENCAVE TË NATYRËS

PROGRAMI I STUDIMIT:

Metodat Probabilitare, Statistike

dhe Metodat e Analizës Numerike

TEZË DOKTORATURE

METODA BOOTSTRAP TEK MODELET

E SERIVE KOHORE, NË VEÇANTI TEK

MODELET ARFIMA

Doktoranti: Udhëheqësi:

Argjir BUTKA Prof. Llukan PUKA

Tiranë, 2015

i

UNIVERSITETI I TIRANËS

FAKULTETI I SHKENCAVE TË NATYRËS

DISERTACION

i paraqitur nga

Msc. Argjir BUTKA

Udhëhequr nga

Prof. Llukan PUKA

Për marrjen e gradës shkencore

DOKTOR

Me temë:

METODA BOOTSTRAP TEK MODELET

E SERIVE KOHORE, NË VEÇANTI TEK

MODELET ARFIMA

Mbrohet më datë _____ /_____/_____ , para jurisë:

1. Prof._______________________________________Kryetar

2. Prof._______________________________________Anëtar (Oponent)

3. Prof._______________________________________Anëtar (Oponent)

4. Prof._______________________________________Anëtar

5. Prof._______________________________________Anëtar

ii

PËRMBAJTJA

LISTA E FIGURAVE .................................................................................................. iii

LISTA E TABELAVE .................................................................................................. iv

FALENDERIME .......................................................................................................... vi

HYRJE .........................................................................................................................vii

1 PROCESET ME MEMORIE TË GJATË .............................................................. 1

1.1 Koncepti i memories së gjatë .......................................................................... 3

1.1.1 Shënime paraprake për memorien e gjatë ................................................ 3

1.1.2 Disa shembuj të serive kohore me memorie të gjatë ............................... 6

1.2 Përcaktimi i memories së gjatë ........................................................................ 9

1.3 Disa procese me memorie të gjatë ................................................................. 13

1.3.1 Proceset me vetëngjashmëri ................................................................... 13

1.3.2 Lëvizja brouniane ................................................................................... 16

1.3.3 Procesi zhurma thyesore gausiane ......................................................... 19

1.4 Diferencimi (integrimi) thyesor dhe modelet ARFIMA ............................... 20

1.4.1 Procesi i integruar pjesërisht (thyesor) .................................................. 23

1.4.2 Proceset ARFIMA ................................................................................. 27

1.5 Vlerësimi i memories së gjatë ....................................................................... 28

1.5.1 Zbulimi vizual i memories së gjatë ........................................................ 28

1.5.2 Vlerësues paramertikë ose gjysmë parametrikë. .................................... 36

2 METODA BOOTSTRAP TEK MODELET E SERIVE KOHORE .................... 44

2.1 Metodologjia bootstrap ................................................................................. 44

2.2 Metodat bootstrap me blloqe ......................................................................... 46

2.2.1 Bootstrap me blloqe të mbivendosur ..................................................... 47

2.2.2 Bootstrap me blloqe të ndarë ................................................................. 48

2.2.3 Bootstrap stacionar ................................................................................. 48

2.3 Bootstrap parametrik ..................................................................................... 50

2.4 Bootstrap sitë ................................................................................................. 52

2.5 Vlerësimi intervalor bootstrap ....................................................................... 54

2.6 Metoda bootstrap dhe kontrolli i hipotezave ................................................. 57

3 METODA BOOTSTRAP ME BLLOQE ME CIKLE ......................................... 59

3.1 Përcaktimi i blloqeve të përbërë nga cikle .................................................... 60

3.2 Gjatësia e ciklit .............................................................................................. 64

iii

3.2.1 Disa konsiderata teorike ......................................................................... 64

3.2.2 Cikli i serisë së vrojtuar ......................................................................... 66

3.3 Simulime Monte Carlo .................................................................................. 72

3.3.1 Vlerësimi pikësor ................................................................................... 72

3.3.2 Vlerësimi intervalor ............................................................................... 75

3.3.3 Kontrolli i hipotezës për praninë e memories së gjatë. .......................... 76

PËRFUNDIME ............................................................................................................ 89

SHTOJCA .................................................................................................................... 90

1. Shpërndarja e gjatësisë së ciklit ........................................................................... 90

2. Karakteristikat e shpërndarjes së gjatësisë së ciklit ............................................. 91

3. Një shënim për komandën “b.star” ...................................................................... 92

LITERATURA ............................................................................................................ 94

LISTA E FIGURAVE

Figura 1.1 Grafikët e dy modeleve që ilustrojnë dallimin vizual midis memories së

shkurtër dhe asaj të gjatë. ............................................................................................... 4

Figura 1.2 Prurjet minimale vjetore të lumit Nil, funksioni i autokorrelacioneve dhe

rendi i zvogëlimit të tyre. ............................................................................................... 6

Figura 1.3 Rrathët e pemëve të malit Campito, funksioni i autokorrelacioneve dhe

rendi i zvogëlimit të tyre. ............................................................................................... 7

Figura 1.4 Numri i bajts për milisekondë në rrjetin e ethernetit në Bellcore, funksioni i

autokorrelacioneve dhe rendi i zvogëlimit të tyre. ......................................................... 8

Figura 1.5 Autokorrelacionet teorike dhe kufijtë e sipërm të

intervalit të besimit me nivel 0.95 për vlera të ndryshme të vëllimit të zgjedhjes. ..... 11

Figura 1.6 Koeficienti i korrigjimit të devijimit standard të mesatares i një procesi me

autokorrelacione teorike (si raport me devijimin normal). .............. 12

Figura 1.7 Ilustrim i vetëngjashmërisë së bashkësisë së Mandelbrot. ......................... 13

Figura 1.9 Grafiku i metodës së variancës së grumbulluar për dy seritë kohore të

simuluara. ..................................................................................................................... 34

Figura 1.11 Peshat e dritares Parzen tek periodograma e lëmuar. ............................... 43

Figura 2.1 Formimi i blloqeve tek metodat MBB dhe NBB. ....................................... 48

Figura 3.1 Ilustrim i formimit të cikleve. ..................................................................... 61

Figura 3.2 Ilustrim i metodës bootstrap me blloqe me cikle........................................ 62

0.2( ) 0.1k k

0.2( ) 0.1k k

iv

Figura 3.3 Grafikët e një serie të simuluar dhe e replikimeve të saj duke përdorur

metoda të ndryshme boostrap me blloqe. .................................................................... 63

Figura 3.4 Densiteti dhe funksioni i shpërndarjes për gjatësinë e ciklit të një procesi

zhurmë e bardhë. .......................................................................................................... 65

Figura 3.5 Varësia e gjatësisë mesatare të ciklit nga parametri i memories, d për një

seri kohore e modelit ARFIMA(p,d,q). ....................................................................... 70

Figura 3.6 Mesatarja e gjatësive të ciklit të një zgjedhje rasti të modeleve zhurmë e

bardhë, AR(1) dhe ARFIMA(0,d,0). ........................................................................... 71

Figura 3.7 Efikasiteti relativ (në përqindje) i vlerësimeve GPH me metodat bootstrap

MBB, SB dhe BBC kundrejt vlerësimeve të zakonshme GPH, referuar rrënjës katrore

të gabimit mesatar katror. ............................................................................................ 74

LISTA E TABELAVE

Tabela 1.1 Rendi i konvergjencës për zhvendosjen, dispersionin dhe shpërndarjen

asimptotike të statistikave të zgjedhjes për një seri kohore normale me funksion të

autokovariancës kur n → ∞. ...................................................................... 26

Tabela 1.2 Rendi i konvergjencës së autokorrelacioneve empirike për një seri kohore

të modelit ARFIMA(p,d,q). ......................................................................................... 29

Tabela 3.1 Densiteti probabilitar i gjatësisë së ciklit të formuar nga një zhurme e

bardhë gausiane. ........................................................................................................... 64

Tabela 3.2 Rastet e mundshme për vlerat e numrit të cikleve të një zgjedhje me vëllim

n nga një zhurmë e bardhë gausiane. Raste gjithsej janë 2n-1

. ..................................... 69

Tabela 3.3 Gjatësia mesatare e ciklit të një serie kohore me vëllim n e gjeneruar nga

një proces ARFIMA(0,d,0). ......................................................................................... 69

Tabela 3.4 Zhvendosja (β) për vlerësimet e d-së në proceset ARFIMA(0,d,0). .......... 79

Tabela 3.5 Devijimi standard (SD) për vlerësimet e d-së në proceset ARFIMA(0,d,0).

...................................................................................................................................... 79

Tabela 3.6 Rrënja e gabimit katror mesatar (RMSE) për vlerësimet e d-së në proceset

ARFIMA(0,d,0). .......................................................................................................... 80

Tabela 3.7 Efikasiteti (në përqindje) i përdorimit të metodave bootstrap kundrejt

metodës përkatse të zakonshme. .................................................................................. 80

Tabela 3.8 Mbulimi i vrojtuar (në përqindje) i intervaleve të besimit të vlerësuesit

GPH, me nivel 1 0.95 , për parametrin d, tek modelet ARFIMA(0,d,0). ........... 81

Tabela 3.9 Gjatësia e vrojtuar (si mesatare) e intervaleve të besimit të vlerësuesit

GPH, me nivel 1 0.95 , për parametrin d, tek modelet ARFIMA(0,d,0). ........... 81


SP, me nivel 1 0.95 , për parametrin d, tek modelet ARFIMA(0,d,0). ............... 82

k k

v

Tabela 3.11 Gjatësia e vrojtuar (si mesatare) e intervaleve të besimit të vlerësuesit SP,

me nivel 1 0.95 , për parametrin d, tek modelet ARFIMA(0,d,0). ..................... 82

Tabela 3.12 Gabimi (empirik) i llojit të parë, në përqindje, i kriterit bootstrap SP për

verifikimin e hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti AR(1). ....................... 83

Tabela 3.13 Fuqia (empirike), në përqindje, e kriterit bootstrap SP për verifikimin e

hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti ARFIMA(1,d,0), 0.1d . .............. 84







Tabela 3.17 Gabimi (empirik) i llojit të parë, në përqindje, i kriterit R/S i modifikuar

për verifikimin e hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti AR(1). ................. 88

Tabela 3.18 Fuqia (empirike), në përqindje, e kriterit R/S i modifikuar për verifikimin

e hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti ARFIMA(0,d,0). .......................... 88

vi

FALENDERIME

Mbërritja në fund të një rrugëtimi të gjatë të jep kënaqësinë e arritjes së objektivit.

Por sigurisht, ardhja deri këtu nuk do të ishte e mundur pa ndihmën dhe përkrahjen e

gjithë miqve dhe shokëve të mi. Ndaj dua të falenderoj të gjithë miqtë që më kanë

mbështetur, që nga fillimi e deri në mbarim.

Një falenderim shumë special dhe gjithë mirënjohja ime i shkon udhëheqësit tim

shkencor profesor Llukan Puka, për këshillat e çmueshme që më ka dhënë dhe për

konsulencën e tij profesionale.

Falenderime u shpreh edhe kolegëve të mi të Departamentit të Matematikës me të

cilët jam këshilluar gjatë periudhës së realizimit të doktoraturës.

Falenderoj përgjegjësin e Departamentit dhe mikun tim profesor Lorenc Ekonomi,

për ndihmën dhe inkurajimin që më ka dhënë që ta vazhdoja këtë objektiv të

rëndësishëm.

Falenderime nga zemra kam edhe për familjen time, për durimin dhe mirëkuptimin që

kanë treguar, sidomos në këto kohët e fundit, gjatë hartimit përfundimtar të tezës.

vii

HYRJE

Duke folur jo rigorozisht, konceptet “varësi afatgjatë” (long range dependence) dhe

“memorie e gjatë” (long memory) janë sinonime që përdoren për të cilësuar një seri

kohore, që karakterizohet nga një varësi statistikore e rëndësishme midis vrojtimeve

edhe për distanca të largëta midis tyre. Në vijim ne do të përdorim më shpesh termin

“memorie e gjatë”. Funksioni i autokorrelacionit të një procesi me memorie të gjatë

zvogëlohet shumë ngadalë kur distanca rritet pambarimisht. Rendi i këtij zvogëlimi

është hiperbolik, në ndryshim me rendin eksponencial të zvogëlimit të

autokorrelacioneve të proceseve të modelit ARIMA (AutoRegressive Integrated

Moving Average) të propozuara nga Box dhe Jenkins (1970). Literatura është e pasur

me punime rreth proceseve me memorie të gjatë; mund të përmendim Beran (1994),

Palma (2007) midis të tjerësh. Megjithatë përkufizimi i memories së gjatë nuk është

përcaktuar në mënyrë të vetme. Në literaturë ekzistojnë disa përcaktime jo të gjitha

ekuivalente midis tyre të memories së gjatë (për një përmbledhje të përcaktimeve të

memories së gjatë shih Guegan, 2005).

Modelet autoregresive me mesatare të lëvizshme pjesërisht të integruara, (të

integruara në mënyrë thyesore) ARFIMA(p,d,q) (AutoRegressive Fractionally

Integrated Moving Average) të prezantuara nga Granger dhe Joyeux (1980) si dhe nga

Hosking (1981), pavarësisht nga njëri tjetri, ofrojnë një mjet të dobishëm për të

modeluar strukturën e varur të rendit të dytë (funksionet e autokovariancës dhe të

autokorrelacionit) për një seri kohore të vrojtuar me memorie të gjatë. Parametrin d do

ta quajmë parametri thyesor i integrimit dhe shpesh njihet edhe si parametri i

memories së gjatë. Literatura është e pasur me punime mbi identifikimin e procesit që

gjeneron të dhënat, që shfaqin veti të memories së gjatë, si dhe vlerësimin e

parametrave përkatës. Këto vlerësime mund të jenë parametrikë ose gjysmë

parametrikë.

Fox dhe Taqqu (1986), Dahlhaus (1989) si dhe Beran (1994) kanë shkrojtur rreth

vlerësimit të përgjasisë maksimale të parametrit thyesor d. Hurst (1951), Geweke dhe

Porter-Hudak (1983), Higuchi (1988), Robinson (1995a, 1995b) si dhe Hurvich etj.

(1998) kanë zhvilluar metodat gjysmë parametrike për vlerësimin e parametrave.

Siç ndodh shpesh në statistikë, është e pamundur të përcaktohet metoda më e mirë; në

lidhje me situatën konkrete secila metodë shfaq përparësitë dhe të metat e veta.

Megjithëse vlerësimet parametrike janë asimptotikisht normale dhe për rrjedhojë janë

më efikasët, në rast se modeli i përzgjedhur është i gabuar vlerësimet e përftuara

mund të jenë shumë të zhvendosura. Nga ana e vet, vlerësimet gjysmë parametrike

ofrojnë mundësinë e vlerësimit të parametrit të memories së gjatë, d, nëpërmjet pjesës

së memories së shkurtër, me defektin e një shpejtësie më të ngadaltë të konvergjencës

se sa konvergjenca e vlerësimeve me teknikat parametrike.

Ndër vlerësimet gjysmë parametrike të parametrit d, do të veçonim vlerësuesin e

njohur si vlerësuesi GPH, i cili është propozuar nga Geweke dhe Porter-Hudak (1983)

dhe është gjerësisht i përdorur në literaturë. Agiakloglou etj. (1993) tregoi që

vlerësimi GPH është i zhvendosur në prezencë të parametrave të pjesës ARMA afër

zonës jostacionare.

Për të përmirësuar vlerësimet klasike që mbështeten në teorinë asimptotike shpesh

përdoren metodat e rizgjedhjes. Një nga metodat gjerësisht të përdorura është metoda

bootstrap, e propozuar nga Efron (1979). Shënojmë se emërtimi “bootstrap” (lexohet

ˈbuːtˌstræp), i përdorur fillimisht nga propozuesi i kësaj metode, tregon një teknikë e

viii

cila, duke u nisur nga burimet ekzistuese dhe pa përdorur ndihma të jashtme, krijon

diçka më komplekse dhe efikase.

Në vitet e fundit janë zhvilluar shumë metoda bootstrap për seritë kohore. Disa nga

metodat më të spikatura janë:

(a) Bootsrap me blloqe (Block Bootstrap) (Carlsttein, 1986 dhe Kunsch, 1989).

(b) Bootstrap lokal (Local Bootstrap) (Paparoditis dhe Politis, 1999).

(c) Bootstrap i periodogramës (Periodogram Bootstrap) (Kreiss dhe Paparoditis,

2003).

(d) Bootstrap "sitë" (Sieve Bootstrap) (Buhlmann, 1997).

(e) Bootstrap parametrik (Parametric Bootstrap) (Andrews etj., 2006).

Ndër to më të përdorshme janë metodat bootstrap me blloqe.

Metodat bootstrap për seritë kohore përdoren tashmë gjerësisht për të gjetur intervalet

e besimit, sidomos në rastet kur teoria asimptotike nuk jep rezultate të kënaqshme

(shih p.sh. Arteche dhe Orbe, 2009; DiCiccio dhe Efron, 1996; Hall, 1988, 1992).

Zbatimi i metodave bootstrap në rastin e të dhënave të tipit seri kohore kërkon

përdorimin e teknikave të ndryshme të cilat varen nga natyra e serisë si dhe nga

qëllimi i përfundimeve statistikore. Problemi është ende i hapur për rastin kur ne

duam të kopjojmë (përsëritim) strukturën e varësisë të një procesi me memorie të

gjatë siç është rasti i modeleve ARFIMA(p,d,q).

Në këtë tezë ne do të zhvillojmë një metodë të re bootstrap për seritë kohore,

bootstrapin me blloqe të formuar nga cikle. Cikli është përcaktuar si një çift vargjesh

me vrojtime të njëpasnjëshme që ndodhen nën dhe mbi vlerën mesatare (ose

anasjelltas).

Teza është ndarë në tre kapituj: dy kapitujt e parë rishikojnë disa literatura, kapitulli i

tretë është kontribut i tezës.

Kapitulli 1 rishikon literaturë rreth proceseve me memorie të gjatë, vetitë e tyre,

funksionet e autokovariancës dhe të autokorelacionit së zgjedhjes dhe vlerësuesit

parametrikë dhe gjysmë parametrikë të intensitetit të memories, më të përdorshëm. Në

kapitullin 2 prezantohen shkurtimisht konceptet bazë të metodave bootstrap si dhe

përshkruhen disa metoda bootstrap për seritë kohore. Në kapitullin 3 ne prezantojmë

metodën bootstrap me blloqe të përbërë nga cikle. Disa pohime dhe konkluzione janë

treguar për këtë metodë. Më tej në këtë kapitulli, metoda e prezantuar do të përdoret

për të përmirësuar performancën e vlerësuesve gjysmë parametrike për parametrin d

të një procesi ARFIMA(0,d,0) në kuptimin e gabimit standard më të vogël, gabimit

mesatar kuadratik më të vogël si dhe mbulim më të mirë për intervalet e besimit. Me

ndihmën e eksperimenteve Monte Carlo kjo metodë do të krahasohet me metodat

ekzistuese bootstrap. Një zbatim tjetër i metodës bootstrap të propozuar është

procedura e kontrollit të hipotezës për praninë e memories së gjatë. Për vlerësuesit

gjysmëparmetrik, përdorimi i bootstrapit përmirëson mbulimin e intervaleve të

besimit të parametrit d dhe rrit fuqinë e kriterit në kontrollin e hipotezave për

memorien e gjatë, në rastet kur procesi është i modelit ARFIMA(1,d,0). Për

vlerësuesin gjysmë parametrik GPH, intervali i besimit i mbështetur në shpërndarjen

bootstrap ka një mbulim afër nivelit teorik, edhe në se gjatësia e serisë kohore të

vrojtuar është relativisht e vogël.

1

Kapitulli 1

1. PROCESET ME MEMORIE TË GJATË

Në këtë kapitull ne prezantojmë proceset me memorie te gjatë. Klasa e proceseve me

memorie të gjatë përmban një numër të madh procesesh, megjithatë ato kanë disa veti

të përbashkëta. Memoria e gjatë është vënë re te disa procese për arsye të shkallës së

zvogëlimit të dispersionit së mesatares së zgjedhjes e cila është proporcionale me n

për 0,1 , ndërkohë që shkalla e zakonshme për një zgjedhje nga vrojtime me

shpërndarje të njëjtë dhe të pavarura (i.i.d., independent and identically distributed),

ose nga të dhëna të korreluara dobët, është 1n (n është gjatësia e serisë). Një veti

tjetër e përbashkët në seritë me memorie të gjatë është fakti që funksioni i

autokovariancës zvogëlohet drejt zeros shumë ngadalë, aq sa që vrojtimet shumë larg

në të shkuarën kanë akoma efekt në sjelljen prezente të serisë. Për më tepër, edhe në

se seria mund të duket stacionare (e qëndrueshme), do të shfaqen trende lokale dhe

perioda të gjata me vrojtime shumë të mëdha (ose shumë të vogla) pa cikle

këmbëngulëse.

Fillimisht, le të bëjmë shënimet e mëposhtme të cilat do t’i përdorim përgjatë këtij

kapitulli.

Një proces rasti (stochastic process) përkufizohet si një familje ndryshoresh rasti,

{ , }tX t T , e indeksuar nga një bashkësi numrash realë T R . Në se bashkësia e

indekseve është nënbashkësi e numrave të plotë, T Z , procesi quhet proces rasti me

kohë diskrete. Kur bashkësia T përmban një interval procesi quhet proces rasti me

kohë të vazhduar. Bashkësitë e indekseve më të përdorshëm janë {0, 1, ,...}Z ,

{0,1,2,...}N , ( , )R dhe [0, )R .

Një seri kohore është një bashkësi të dhënash { }tx të vrojtuara njëra pas tjetrës në

momente të specifikuara, t, të kohës. Seria kohore konsiderohet si një varg vrojtimesh

1 2{ , ,..., }nx x x i n vrojtime të para të një procesi rasti, { , }tX t T , dhe shpesh referohet

si një realizim i procesit në fjalë. Termi “seri kohore” përdoret gjithashtu edhe për

proceset e rastit me kohë diskrete.

Le të jetë { , }tX t T një proces rasti me dispersion të fundëm, ( )tD X , për çdo

t T . Atëherë, përcaktohen funksioni i mesatares ( ) ( )X tt E X , për t T dhe

funksioni i kovariancës ( , ) ( , )X r sr s Cov X X për ,r s T .

Një seri kohore { , }tX t Z quhet seri stacionare e dobët (weakly stationary), ose

stacionare e rendit të dytë, në qoftë se

(i) ( )tD X për çdo t Z

(ii) ( )X t për çdo t Z (funksioni i mesatares është konstant kundrejt kohës)

(iii) ( , ) ( , )X Xr s r t s t për çdo , ,r s t Z (funksioni i kovariancës është

konstant kundrejt kohës; kovarianca varet vetëm nga largësia midis të dhënave dhe jo

nga momenti i vrojtimit të tyre).

2

Gjithashtu në literaturë përdoret dhe përkufizimi i stacionaritetit rigoroz (strictly

stationary), i cili kërkon që vektorët e rastit 1 2

( , ,..., )kt t tX X X dhe

1 2( , ,..., )

kt h t h t hX X X të kenë shpërndarje të njëjta për çdo 1,2,...k , për çdo varg

momentesh 1 2, ,..., kt t t dhe për çdo h Z .

Përgjatë materialit ne do të përdorim vetëm stacionaritetin e dobët. Në vazhdim me

shprehjen “stacionare” nënkuptohet “stacionare e dobët”.

Për një seri stacionare përcaktohen funksioni i autokovariancës (ACVF,

autocovariance function), ( ) ( , ) [( )( )]X t h t t h X t Xh Cov X X E X X , si dhe

funksioni i autokorrelacionit (ACF, autocorrelation function) ( )

( )(0)

XX

X

hh

.

Së fundmi po përmendim dy operatorë që përdoren shpesh në modelimin e serive

kohore.

(i) Operatori i vonesës ose i zhvendosjes prapa (përdoret shënimi L, lag operator ose

B, backshift operator), që përcaktohet nga barazimi 1t tBX X , dhe

(ii) Operatori i diferencimit (differencing operator) që shënohet me ose , dhe

përcaktohet sipas barazimit 1 (1 )t t t tX X X B X (këtu 1 tregon operatorin

identik).

Shembulli më i thjeshtë i një procesi rasti është procesi i zhurmës së bardhë (white

noise). Një proces { , 0, 1, 2, ...} t t quhet zhurmë e bardhë me pritje

matematike dhe dispersion të fundëm 2 , në qoftë se

( ) tE dhe 2 , për

( , )0, për

t s

t sCov

t s

(1.1)

Kur pritja matematike është zero zhurma e bardhë quhet e qendërzuar dhe, në se

ndryshoret e rastit t janë me shpërndarje normale, atëherë zhurma e bardhë quhet

normale.

Në disa literatura zhurma e bardhë përcaktohet si një varg ndryshoresh rasti të

pavarura dhe me shpërndarje të njëjtë me pritje matematike zero dhe dispersion të

fundëm 2 . Ky rast referohet si zhurmë e bardhë e pavarur, ose e fortë, dhe përdoret

shënimi 2~ . . .(0, )t i i d .

Një proces stokastik { , 0, 1, 2, ...}tZ t quhet proces i endjes së rastit (random

walk) në se procesi 1t t tZ Z , i përftuar nga diferencimi i tij, është një zhurmë e

bardhë e pavarur. Prej këtej rrjedh se 1t t tZ Z për çdo indeks (hap, lag). Në rastin

e kohës pozitive mund të gjejmë 1

t

t j

j

Z

për 0t . Shpesh supozohet që 0 0Z .

Kur zhurma e bardhë t është normale (ose siç quhet ndryshe, gausiane), atëherë

endja e rastit tZ quhet endje e rastit normale (ose gausiane).

3

Endja e rastit modelohet gjithashtu nga barazimi 1t t tZ Z , ku t janë ndryshore

rasti i.i.d., prej nga mund të shkruajmë (1 ) t tB Z . Pra ecja e rastit mund të shihet

si një proces ARMA(0,1,0).

Analogu i endjes së rastit normale në kohën e vazhduar është procesi i lëvizjes

brouniane (Brownian motion). Duke përgjithësuar lëvizjen brouniane mund të

përftohet lëvizja brouniane thyesore (fBm, fractional Brownian motion). Duke ndjekur

analogjinë e mësipërme, analogu i një procesi lëvizje brouniane thyesore, për rastin e

kohës diskrete, do të ishte procesi i përftuar nga diferencimi “thyesor” i procesit endje

e rastit gausiane. Më tej, nëpërmjet shtesave të një lëvizje brouniane thyesore mund të

përftohet zhurma gausiane thyesore (fGn, fractional Gaussian noise). Këto procese ne

do t’i shohim më hollësisht në paragrafin 1.3.

Në vijim me { }tX do të shënojmë një proces rasti me kohë diskrete, me hapësirë

gjendjesh një nënbashkësi të numrave realë dhe me dispersion të fundëm. Për një seri

të tillë, dispersioni i mesatares së zgjedhjes varet gjithashtu tek autokorrelacioni. Në

se seria është me pritje matematike dhe dispersion të fundëm dhe konstant në lidhje

me kohën, është i vërtetë barazimi (shih për shembull Beran, 1994):

2 2 2

2 2, 1 1 , 1 , 1

1( ) ( , ) [ ( , ) ( , )] [1 ( , )]

n n n n

i j i i j i ji j i j

D X i j i i i j i jn n n n

(1.2)

Barazimi i mësipërm ndryshon nga formula standarde e dispersionit të mesatares së

një zgjedhje rasti të thjeshtë nga termi korrigjues

, 1

1( ) ( , )

n

n

i ji j

i jn

(1.3)

me shënimet ( )iE X , 2 var( )tX , ( , ) [( )( )]i ji j E X X dhe

2

( , )( , )

i ji j

. Termi i korrigjimit i përcaktuar nga barazimi (1.3) është zero në se

ndryshoret tX janë të pakorreluara. Gjithashtu, në se { }tX është me varësi të dobët

(memorie të shkurtër), siç është rasti i proceseve ARMA, ky term është afërsisht

konstant për vlera të mëdha të vëllimit n të zgjedhjes. Megjithatë, në se procesi në

fjalë përmban memorie të gjatë, termi ( )n rritet së bashku me rritjen e n-së duke

ndikuar në rendin e zvogëlimit të dispersionit të mesatares.

1.1 Koncepti i memories së gjatë

Fillimisht po shohim disa shënime dhe shembuj që çojnë në kuptimin e memories së

gjatë.

1.1.1 Shënime paraprake për memorien e gjatë

Shkurtimisht po japim një ide rreth pasojave të prezencës së memories së gjatë tek një

seri kohore. Për të krijuar një ide paraprake rreth memories së gjatë, në figurën 1.1

janë paraqitur dy seri kohore të simuluara përkatësisht, nga një proces me memorie të

shkurtër dhe nga një proces me memorie të gjatë. Për të pasur një krahasim më të

qartë proceset janë parametrizuar në mënyrë të tillë që autokorrelacionet e rendit të

parë të jenë të njëjta për të dy proceset. Gjithashtu, gjatë simulimit është përdorur e

4

njëjta seri e zhurmës së bardhë. Ne kemi simuluar 1000 vrojtime dhe më pas kemi

larguar 200 të parat.

Modelet e simuluara janë përkatësisht modeli AR(1) me memorie të shkurtër,

1

0.3

1 0.3t t tX X

dhe modeli ARFIMA(0,d,0) me memorie të gjatë

0.3(1 ) t tB X ,

ku t është një proces zhurmë e bardhë gausiane, e njëjtë për të dyja modelet.

Figura 0.1 Grafikët e dy modeleve që ilustrojnë dallimin vizual midis memories së

shkurtër dhe asaj të gjatë.

Një dallim që mund të vërehet në një shikim të parë është se ciklet e procesit me

memorie të gjatë (figura 1.1b) janë më të çrregullt se ciklet në rastin e memories së

shkurtër (figura 1.1a). Në përgjithësi proceset me memorie të gjatë kanë tendencë të

krijojnë cikle të çrregullt.

5

Një tjetër “veti” e proceseve me memorie të gjatë është se ata duken sikur janë me

nivel të ndryshueshëm. Kjo nënkupton që vrojtimet kanë tendencë të qëndrojnë në një

nivel të lartë të vlerave për një periudhë kohore relativisht të gjatë dhe pastaj në një

nivel të ulët të vlerave përsëri për një periudhë kohore relativisht të gjatë, dhe

anasjelltas. Sigurisht kjo veti është e kombinuar me vetinë e cikleve të çrregullt. Siç

do shohim më poshtë (në paragrafin 1.4.1) këto veti janë të vërteta për modelet

ARFIMA(0,d,0) me vlera pozitive të d-së).

Një nga përkufizimet e memories së gjatë është përcaktuar nëpërmjet barazimit

limn

in

i n

(shih përkufizimin 1.1, më poshtë).

Kjo nënkupton që koncepti i memories së gjatë përcaktohet vetëm për seritë

stacionare, përderisa funksioni i autokokorrelacioneve, ( , ) i t t icorr X X , përcaktohet

vetëm për seritë stacionare.

Përkufizimet e memories së gjatë nuk përcaktojnë ndonjë kufizim për ndonjë

autokorrelacion të veçantë, kufizimi ka lidhje vetëm me sjelljen asimptotike të

autokorrelacioneve, pra me autokorrelacionet në “distancë infinit”. Një implikim i

menjëhershëm i kësaj është vështirësia që, bazuar në një zgjedhje të dhënash seri

kohore (që është gjithmonë e fundme), të përcaktojmë (testojmë) në se sjellja

asimptotike e autokorrelacioneve të procesit që ka gjeneruar të dhënat, është me

memorie të gjatë apo të shkurtër. Ky këndvështrim na bën të ndërgjegjshëm për

vështirësitë që dalin në procesin e verifikimit të hipotezave për praninë e memories së

gjatë në një seri kohore të vrojtuar.

Një implikim tjetër i përkufizimit të memories së gjatë është se, në se ne njohim ose

kemi vlerësuar relativisht saktë procesin stokastik që ka krijuar (gjeneruar) të dhënat,

edhe vrojtimet që janë larg në të shkuarën mund të jenë të dobishme për parashikimin

e vlerave të ardhshme të serisë. Pra, ne presim një parashikueshmëri më të “mirë” për

proceset me memorie të gjatë.

Një tjetër ndikim i prezencës së memories së gjatë lidhet me supozimet standarde që

përdoren në statistikë. Një nga rezultatet kryesore të statistikës klasike është se

dispersioni i mesatares (aritmetike) të një zgjedhje rasti të thjeshtë (të pavarur) është i

barabartë me dispersionin e një vrojtimi të vetëm (me dispersionin e ndryshores së

rastit në shqyrtim) pjesëtuar me vëllimin e zgjedhjes. Një përafrim i ngjashëm është i

vërtetë edhe për mesataren e një serie kohore për korrelacionet e së cilës limiti

1lim ( , )n

i j

i jn

ekziston dhe është i fundëm. Pikërisht, në këtë rast ka vend përafrimi

1( )nD X c

n për n , ku n është vëllimi i zgjedhjes dhe c një konstante që nuk

varet nga n. Ky përafrim është i vlefshëm për shumicën e modeleve të njohura të

serive kohore si proceset e Markovit dhe modelet ARMA. Ndërkohë, Beran (1994) ka

treguar se kur tX është një seri stacionare dhe ka vetinë e memories së gjatë, atëherë

për n është i vërtetë përafrimi

1 2

1ˆ( )n dD X C

n ,

6

ku 0C dhe 1

02

d . Pra rendi i zvogëlimit të dispersionit së mesatares së

zgjedhjes për seritë me memorie të gjatë është më i vogël se ai i pranuar në supozimet

e statistikës klasike. Nga ana tjetër, rendi i zvogëlimit të dispersionit të mesatares

është i lidhur ngushtë me kontrollin e hipotezave apo intervalet e besimit për pritjen

matematike. Në këtë këndvështrim mund të themi se memoria e gjatë nuk “përputhet”

me supozimet e statistikës klasike. Injorimi i ekzistencës së memories së gjatë mund

të ketë efekte të tejskajshme (“shkatërrimtare”) në përfundimet apo vendimet

statistikore.

1.1.2 Disa shembuj të serive kohore me memorie të gjatë

Shembull 1.1 Niveli minimal vjetor i prurjeve të lumit Nil.

Të dhënat janë matur përgjatë viteve 622-1281 në ishullin Roda afër Kairos dhe janë

të disponueshme në programin R nëpërmjet paketës “FGN”.

Figura 0.2 Prurjet minimale vjetore të lumit Nil, funksioni i autokorrelacioneve dhe

rendi i zvogëlimit të tyre.

Në figurën 1.2 paraqitet grafiku i prurjeve mesatare të lumit Nil (sipër majtas), grafiku

i 100 autokorrelacioneve empirike të para (sipër djathtas), grafiku i të gjitha

7

autokorrelacioneve (poshtë majtas) si dhe grafiku i logaritmit të vlerës absolute të

autokorrelacioneve kundrejt logaritmit të distancës (poshtë djathtas). Nga figura 1.2

mund të kuptohet se autokorrelacionet e vrojtuara zvogëlohen shumë ngadalë.

Historikisht studimi i të dhënave të prurjeve të lumit Nil ka çuar në zbulimin e të

ashtuquajturit fenomeni i Hurst-it (Hurst, 1951). Hurst studioi gjetjen e një modeli për

të modeluar prurjet e lumit Nil, me qëllim ndërtimin e një sistemi rezervuarësh me

përmasë të përshtatshëm. Ai vuri re se prurjet e lumit Nil kishin tendencë për të

ruajtur nivelin e prurjes për një kohë relativisht të gjatë në vlera të përafërta. Më vonë,

Mandelbrot dhe Wallis (1968, 1969a,b,c) dhe Mandelbrot dhe van Ness (1968)

prezantuan zhurmën thyesore (të pjesshme) të Gausit, si një model statistikor me

memorie të gjatë.

Shembull 1.2 Rrathët e pemëve të malit Campito.

Një tjetër shembull është seria kohore e vrojtimeve të madhësisë së rrathëve të

pemëve në malin Campito në Kaliforni (në .01 mm).

Figura 0.3 Rrathët e pemëve të malit Campito, funksioni i autokorrelacioneve dhe

rendi i zvogëlimit të tyre.

8

Kjo seri kohore përmban 5405 vrojtime njëvjeçare prej vitit 3436 para Krishtit deri në

vitin 1969 pas Krishtit dhe është studiuar nga Hurst (1951), duke e motivuar atë në

formulimin e konceptit të memories së gjatë. Këto të dhëna janë të disponueshme në

programin R nëpërmjet paketës “FGN” ose në linkun

http://datamarket.com/data/list/?q=provider:tsdl

Në figurën 1.3 paraqiten grafikët e njëjtë si tek figura 1.2 për serinë e rrathëve të

pemëve. Edhe në këtë shembull, prania e një varësie të fortë midis vrojtimeve është

evidente.

Shembull 1.3 Trafiku i Ethernetit

Në figurën 1.4 tregohen grafikët analogë si tek figurat 1.2 dhe 1.3 për të dhënat e

serisë kohore me numrin e bajts (bytes) për milisekondë të grumbulluara në disa LAN

(Local Area Network) etherneti në qendrën e kërkimit Bellcore në Morristown, New

York. Këto të dhëna janë të disponueshme në paketën “longmemo” të programit R.

Figura 0.4 Numri i bajts për milisekondë në rrjetin e ethernetit në Bellcore, funksioni

i autokorrelacioneve dhe rendi i zvogëlimit të tyre.

http://datamarket.com/data/list/?q=provider:tsdl

9

Leland etj. (1994) tregoi se të dhënat janë statistikisht me vetëngjashmëri. Siç do të

shohim më poshtë proceset me vetëngjashmëri kanë lidhje të ngushtë me proceset me

memorie të gjatë (paragrafi 1.3.1).

Këta shembuj ilustrojnë faktin se korrelacionet mund të shfaqen edhe në largësi të

gjata midis të dhënave, dhe për më tepër ato mund të jenë statistikisht të rëndësishme.

Disa nga vetitë e përbashkëta të vrojtimeve të mara nga seri kohore me memorie të

gjatë, të cilat mund të dallohen dhe në shembujt e mësipërm, mund të përmblidhen si

më poshtë.

Veti te serive me memorie të gjatë:

1) Veti cilësore të një zgjedhje tipike nga procese me memorie të gjatë.

a) Ekzistojnë periudha kohore relativisht të gjata përgjatë të cilave vrojtimet

tentojnë të qëndrojnë në një nivel të lartë, dhe nga ana tjetër periudha të gjata

ku vrojtimet tentojnë të qëndrojnë në një nivel të ulët. Mandelbrot e quajti një

sjellje të tillë si efekti i Jozefit, duke iu referuar Biblës, ku Jozefi parashikoi 7

vjet begati të ndjekura nga 7 vjet urie në Egjiptin e lashtë (Bibla, Fillesat 41:29

- 41:30).

b) Në se fokusohemi vetëm në periudha të shkurtra kohore, atëherë vrojtohen

cikle ose trende lokale. Megjithatë, në se fokusohemi në gjithë serinë, atëherë

nuk vrojtohen ndonjë trend apo cikël i dukshëm. Më tepër të krijohet ideja se

ciklet e shfaqura janë të mbivendosura dhe në një renditje të rastit.

c) Në vështrim të përgjithshëm seria duket stacionare.

2) Veti sasiore

a) Autokorrelacionet e zgjedhjes zvogëlohen drejt zeros me një shpejtësi më të

vogël se zvogëlimi eksponencial. Ky zvogëlim mund të përafrohet me një

funksion hiperbolik, pra ˆ( )k k për 0 1 (pra i ndryshëm nga rendi

eksponencial i zvogëlimit të modeleve ARIMA)

1.2 Përcaktimi i memories së gjatë

Megjithëse proceset me memorie të gjatë kanë tërhequr vëmendjen e shumë

studiuesve përcaktimi i memories së gjatë nuk është dhënë në një mënyrë të unifikuar.

Në literaturë ekzistojnë disa përkufizime për memorien e gjatë jo detyrimisht

ekuivalente midis tyre (për një përmbledhje të kuptimeve të memories së gjatë shih

Guegan, 2005). Përcaktimi i proceseve me memorie të gjatë realizohet në disa mënyra

të lidhura ngushtë me njëra tjetrën. Më poshtë po japim disa prej tyre që përdoren më

shpesh në literaturë.

Le të jetë { , 1,2,...}tX t një proces i rastit stacionar me dispersion të fundëm.

Stacionariteti nënkupton që pritja matematike dhe funksioni i autokovariancës nuk

varen nga çasti t, pra ( )tE X dhe ( , ) ( )t t kCov X X k për çdo çast t. Gjithashtu

përcaktohet dhe funksioni i autokorrelacionit ( ) ( ) / (0)k k .

Çdo proces rasti stacionar mund të karakterizohet nëpërmjet funksionit të densitetit

spektral të tij, i cili përcaktohet nga barazimi 1

( ) ( )cos( )2 k

f k k

.

10

Përkufizim 1.1 (McLeod dhe Hipel, 1978).

Procesi { }tX quhet proces stacionar me memorie të gjatë (ose me varësi të fortë; ose

me varësi për periudhë të gjatë), në qoftë se shuma e vlerave absolute të

autokovariancave (pra dhe të autokorrelacioneve) është e pafundme, pra kur kemi

( ) lim ( )n

nk k n

k k

(1.4)

Përkufizim 1.2 (Brockwell dhe Davis, 1991).

Procesi { }tX quhet proces stacionar me memorie të gjatë, në qoftë se ekziston një

numër real 0.5d dhe një konstante 0C , të tilla që

2 1( ) dk Ck , kur k (1.5)

Konstantet C dhe d nuk varen nga argumenti k i funksionit të autokorrelacionit ( )k ,

por vetëm nga procesi në shqyrtim.

Një përkufizim i ngjashëm jepet edhe tek Beran (1994). Përdoren edhe shprehjet

proces me varësi në distancë të gjatë, ose me varësi afatgjatë; ose proces me varësi të

fortë, ose proces me korrelacione që zvogëlohen ngadalë apo me korrelacione në

distancë të gjatë. Më poshtë ne po japim një përkufizim tjetër nga Beran (1994).

Përkufizim 1.3 (Beran, 1994).

Procesi { }tX quhet proces stacionar me memorie të gjatë, në qoftë se ekziston një

numër real 0,1 dhe një konstante 0fc , të tilla që:

0

( )lim 1

f

f

c

, pra ( ) ff c kur 0 (1.6)

Përkufizimet 1.2 dhe 1.3 janë ekuivalente.

Rendi i konvergjencës së funksionit të autokorelacionit, i përcaktuar tek përkufizimi

1.2, sjell që, për një proces me memorie të gjatë kemi

( )k

k

(1.7)

Disa autorë e përdorin këtë veti si përkufizim për memorien e gjatë.

Është e rëndësishme të theksohet se përkufizimet e mësipërme të varësisë afatgjatë

janë përkufizime asimptotike. Ato përcaktojnë sjelljen e korrelacioneve të procesit kur

distanca midis vrojtimeve shkon në infinit (pambarim). Në këtë kuptim, përkufizimet

e memories së gjatë nuk specifikojnë ndonjë veçori të autkorrelacioneve për ndonjë

distancë të fundme. Për më tepër, përkufizimet e mësipërme përcaktojnë vetëm

shkallën e konvergjencës të autokorrelacioneve dhe jo masën absolute të saj. Çdo

autokorrelacion individual mund të jetë arbitrarisht (sado) i vogël. E rëndësishme

është në se rendi i zvogëlimit të korrelacioneve është i vogël. Kjo e bën verifikimin e

zvogëlimit të ngadaltë të korrelacioneve më të vështirë. Në se përdorim intervalin e

11

zakonshëm 1.96

n për testimin e korrelacioneve të ndryshëm nga zero, ku n është

vëllimi i një zgjedhje seri kohore, atëherë një korrelacion empirik (i zgjedhjes) ˆ( )k

do të konsiderohet i rëndësishëm në se plotësohet mosbarazimi ˆ( ) 1.96k n

(Priestly, 1981). Megjithatë, mund të ndodhë lehtë që në rastin e një zvogëlimi të

ngadaltë të korrelacioneve, të gjithë korrelacionet empirike të jenë brenda intervalit

1.96

n . Le të shohim shembullin e mëposhtëm.

Shembull 1.4

Supozojmë se autokorrelacionet teorikë të një procesi stacionar jepen nëpërmjet

barazimit 2 2

( )H

k C k

, ku 0.1C dhe 0.9H (pra plotësohet përkufizimi 1.2

me 0.1C dhe 0.5 0.4d H ).

Figura 0.5 Autokorrelacionet teorike dhe kufijtë e sipërm të

intervalit të besimit me nivel 0.95 për vlera të ndryshme të vëllimit të zgjedhjes.

0.2( ) 0.1k k

12

Në figurën 1.5 paraqitet grafiku i autokorrelacioneve si dhe kufijtë e sipërm të

intervalit të besimit me nivel 0.95, që janë të trajtës 1.96 / n , për n=100, 200, 400,

dhe 1000. Mund të shihet qartë se, edhe pse korrelacionet e zgjedhjes janë

zëvendësuar me korrelacionet e vërteta, ato janë të gjitha të parëndësishme, të paktën

për 400n . Ndërkohë, ndikimi i autokorrelacineve në dispersionn e mesatares është i

konsiderueshëm edhe për n të vogla. Ky ndikim tregohet në figurën 1.6. Figura 1.6

paraqet grafikun e raportit të devijimit standard teorik të mesatares me devijimin

standard normal, pikërisht vlerën e 1 ( )n , ku ( )n është përcaktuar në

barazimin (1.3) (shih gjithashtu barazimin (1.2)). Mund të dallohet qartë se ky

koeficient rritet me rritjen e n-së duke qenë i konsiderueshëm edhe për n relativisht të

vogla.

Figura 0.6 Koeficienti i korrigjimit të devijimit standard të mesatares i një procesi me

autokorrelacione teorike (si raport me devijimin normal). 0.2

( ) 0.1k k

13

1.3 Disa procese me memorie të gjatë

Është e mundur të veçojmë dy procese themelore të Gausit, me memorie të gjatë. Ato

kanë të njëjtën origjinë, por një është i përcaktuar për kohë të vazhdueshme dhe quhet

zhurmë e Gausit thyesore, ndërsa i dyti është versioni diskret (i ndërprerë) i tij dhe

quhet zhurmë e integruar thyesore (pjesërisht). Ne do ti diskutojmë ato në paragrafin

1.3.3 dhe 1.4.1. Në paragrafin 1.4.1 ne gjithashtu do të shqyrtojmë materialin rreth

funksionit asimptotik dhe funksionit të zgjedhjes të autokovariancës dhe

autokorlacionit. Paragrafi 1.5. i kushtohet problemit të identifikimit dhe vlerësimit të

memories së gjatë.

Zhurma thyesore e Gausit është pjesë e familjes së gjerë të proceseve me

vetëngjashmëri (self-similar processes). Për arsye të plotësisë së materialit, ne do

japim një prezantim për konceptin e vetëngjashmërisë në paragrafin 1.3.1. Kjo do

ndihmojë në realizimin e një kuptimi më të mirë të memories së gjatë në përgjithësi,

dhe të metodave të vlerësimit për parametrin e memories në veçanti. Më poshtë

shënimin tX do ta përdorim për të treguar një proces diskret, ku indeksi t merr vlera

të plota 0, 1, 2,...t , ndërsa shënimi ( ), X t t T është më i përgjithshëm; T

mund të jetë një interval i bashkësisë së numrave realë R (domethënë ( )X t është një

proces rasti me kohë të vazhduar).

1.3.1 Proceset me vetëngjashmëri

Shpesh në natyrë ndeshen objekte ose procese që shfaqin vetëngjashmëri. Për

shembull valët, lëvizja e atomeve, gjethet, etj. Vetëngjashmëria është e lidhur me

idenë e pjesës dhe tërësisë; proceset apo objektet me vetëngjashmëri shfaqin të njëjtën

strukturë apo mënyrë të sjelluri në të gjitha nivelet e saj. Kështu çdo degë e një

gjetheje përsërit në një shkallë më të vogël vetë gjethen. Figura 1.7 tregon një

shembull klasik të vetëngjashmërisë, shembull i krijuar nga një bashkësi e

Mandelbrot. Bashkësia e Manderbrot përftohet nga një ekuacion rekursiv i shkallës së

dytë, duke filluar nga një element 0z C në planin kompleks, sipas formulës 2

1n nz z C (për një përkufizim të bashkësisë së Mandelbrot shih psh Devaney,

1999).

Figura 0.7 Ilustrim i vetëngjashmërisë së bashkësisë së Mandelbrot.

http://en.wikipedia.org/wiki/Fractal#mediaviewer/File:Mandelbrot-similar-x1.jpg

http://en.wikipedia.org/wiki/Fractal#mediaviewer/File:Mandelbrot-similar-x1.jpg

14

Çdo pjesë e bashkësisë e treguar në figurën 1.7, shfaq model te njëjtë në çdo zmadhim

të saj, dhe kjo duket se është e mundshme të ruhet sa herë zmadhohet bashkësia, pra

në pafundësi.

Proceset me vetëngjashmëri janë prezantuar teorikisht nga Kolmogorov (1941) dhe

më tej janë prezantuar në statistikë fillimisht nga Mandelbrot dhe bashkëpuntorët e tij

(shih p.sh. Mandelbrot dhe van Ness (1968), Mandelbrot dhe Wallis 1969 a,b,c, si dhe

Mandelbrot 1983). Në kontekstin e proceseve të rastit (stokastike), vetëngjashmëria

përkufizohet nëpërmjet shpërndarjes së procesit.

Përkufizim 1.4 (Samorodnitsky dhe Taqqu, 1994)

Procesi me vlera reale ( ), X t t T quhet proces me vetëngjashmëri (self-similar

process) me tregues 0H në qoftë se për çdo 0a shpërndarjet me dimension të

fundëm të ( )X at janë të njëjta (identike) me shpërndarjet me dimension të fundëm të

( )Ha X t , domethënë, në qoftë se për çdo 1 21, , ,..., kk t t t T dhe për çdo 0a të

kemi

1 2 1 2( ( ), ( ),..., ( )) ( ( ), ( ),..., ( ))d

H H H

k kX at X at X at a X t a X t a X t (1.8)

Këtu, H shtë parametri (treguesi) i vetëngjashmërisë dhe luan një rol kyç në studimin

e këtyre proceseve.

Në teorinë e probabilitetit, të gjitha shpërndarjet probabilitare që mund të merren si

shpërndarje limite të shumave të ndryshoreve të rastit me shpërndarje të njëjtë dhe të

pavarura (të normalizuara në mënyrë të përshtatshme) quhen shpërndarje të

qëndrueshme (stabël; stable), shiko p.sh. Davidson (1997). Për shembull shpërndarja

normale është e tillë; ajo merret si limit i ndryshoreve i.i.d. me dispersion të fundëm.

Një rezultat i ngjashëm vlen edhe për proceset e rastit. Lamperti (1962) ka treguar se

teoremat limite për shumat e proceseve të rastit japin në përgjithësi procese limite që

janë me vetëngjashmëri (ai përdori termin gjysmë të qëndrueshme (semi-stable)).

Për të treguar lidhjen midis proceseve me vetëngjashmëri dhe proceseve me memorie

të gjatë le të shqyrtojmë shembullin e mëposhtëm.

Shembull 1.5. Shqyrtojmë një proces Yt me vetëngjashmëri me parametër

vetëngjashmërie 0H , me shtesa stacionare dhe të tillë që 0 0Y me probabilitet 1.

Për të thjeshtuar shënimet, supozojmë gjithashtu se 1( ) 0E Y . Me që Yt është me

vetëngjashmëri, atëherë nga barazimi 1

dH

tY t Y , që merret nga barazimi (1.8) për 1k ,

1 1t dhe c t , rrjedh se 1( ) ( ) 0H

tE Y t E Y dhe 2 2 2

1( ) ( )H

tE Y t E Y . Shënojmë

1t t tX Y Y procesin e shtesave, i cili është stacionar. Dispersioni i procesit të

shtesave do të jetë

2 2 2 2

1 1 1 0 1var( ) var( ) [( ) ] [( ) ] [ ] X t t t t tX Y Y E Y Y E Y Y E Y .

Atëherë, për s t , kemi

2 2 2 2 2

0[( ) ] [( ) ] [ ] ( ) H

t s t s t s XE Y Y E Y Y E Y t s (1.9)

Nga ana tjetër është i vërtetë barazimi

2 2 2 2 2 2 2[( ) ] [( ] [ ] 2 [ ] 2cov( , )H H

t s t s t s X X t sE Y Y E Y E Y E YY t s Y Y (1.10)

15

Atëherë, nga barazimet (1.9) dhe (1.10) marrim barazimin e mëposhtëm për

funksionin e autocovariancës të procesit tY me vetëngjashmëri

2 2 2 21( , ) [ ( ) ]

2

H H H

Y Xt s t t s s (1.11)

Më tej njehsojmë autokovariancat e procesit të rritjeve, tX . Për 0k ka vend

barazimi 2 2 2 2

1 1

1( ) cov( , ) cov( , ) [( 1) 2 ( 1) ]

2

H H H

X i i k k Xk X X X X k k k

(shih Beran, 1994, barazimi (2.11)).

Gjithashtu, për 0k kemi ( ) ( )X Xk k . Prej këtej rrjedh se autokorrelacionet e

procesit të rritjeve tX jepen nëpërmjet barazimeve

2 2 21( ) co ( , ) [( 1) 2 ( 1) ]

2

H H H

X i i kk rr X X k k k

2 2 2 21 1 1 1 1[(1 ) 2 (1 ) ] ( )2 2

H H H Hk k gkk k

për 0k dhe, ( ) ( ) X Xk k për 0k . Këtu me g kemi shënuar funksionin

2 2( ) (1 ) 2 (1 )H Hg x x x .

Pas zbërthimit të Tejlorit për funksionin g tek barazimi i fundit, rrotull pikës 0x

(ose 1

0k , pra kur k ; gjithashtu supozohet që 0 1H dhe

1

2H ) marrim

barazimin

221 '(0)( 0) ''(0)( 0)

( ) (0) ...2 2 6

H

X

g x g xk k g

(1.12)

Por, (0) 1 2 1 0g , 2 1 2 1

0'(0) 2 (1 ) 2 (1 ) 0H H

xg H x H x

dhe

2 2 2 2

0''(0) 2 (2 1)(1 ) 2 (2 1)(1 ) 4 (2 1)H H

xg H H x H H x H H

Zëvendësojmë tek barazimi (1.12) dhe marrim

2

2 2 2

14 (2 1)

1 1( ) 0 0 ... (2 1) ...

2 6 3

H H

X

H Hk

k k H H k

(1.13)

Pra mund të themi që

2 2( ) (2 1) , kur H

X k H H k k (1.14)

(termat mbetës të zbërthimit (1.13) shkojnë më shpejt në zero se termi i parë).

Prej ekuivalencës (1.14) rrjedh se kur 0.5 1 H , autokorrelacionet ( )X k

zvogëlohen drejt zeros aq ngadalë sa që seria ( )X

k

k

divergjon. Pra, procesi i

16

shtesave { , 1,2,...}tX t , është proces me memorie të gjatë sipas përkufizimit 1.2, me (2 1) C H H dhe 0.5 d H (shih barazimin (1.5)).

Për 0.5H kemi ( ) 0X k për të gjitha 0k , pra vrojtimet tX janë të

pakorreluara, ndërsa për 0 0.5 H autokorrelacionet janë të shumueshëm dhe për

më tepër ka vend barazimi

( ) 0X

k

k

(1.15)

Në rastin e fundit thuhet se procesi është antikëmbëngulës (antipersistent). Megjthatë,

ky rast është shumë rrallë i ndeshur në praktikë, kryesisht për arsye se kushti (1.15)

është shumë i paqëndrueshëm.

Përfundimisht mund të themi se, proceset me vetëngjashmëri me parametër 1

12

H

dhe me shtesa stacionare (të qëndrueshme) janë procese me shtesa me memorie të

gjatë.

Ky shembull tregon se ekziston një lidhje e ngushtë midis parametrit të

vetëngjashmërisë, H, dhe “sasisë” së memories së procesit. Siç e përmendëm më lart,

teoremat limite, në përgjithësi, japin procese me vetëngjashmëri, dhe shembulli i

mësipërm tregon se mund të themi se proceset me memorie të gjatë përbëjnë një

nënbashkësi të proceseve limite të shumave të ndryshoreve të rastit, prej nga rrjedh

dhe rëndësia teorike e studimit të tyre.

Procesi më i rëndësishëm i proceseve me vetëngjashmëri është procesi i lëvizjes

brouniane, të cilin e shqyrtojmë në nënparagrafin e mëposhtëm 1.3.2.

1.3.2 Lëvizja brouniane

Historikisht, emërtimi i lëvizjes brouniane lidhet me botanistin skoces Robert Brown

(1773-1858). Në vitin 1827, Brown vrojtoi në mikroskop lëvizjen e grimcave të

polenit në ujë dhe vuri re se ato kryenin një lëvizje kaotike të vazhdueshme. Në se ne

do të projektonim këtë lëvizje sipas një drejtimi, atëherë do merrnim lëvizjen

brouniane njëpërmasore, të përcaktuar si më poshtë.

Përkufizim 1.5 (Puka, 2010).

Procesi i rastit ( ), 0B t t quhet lëvizje brouniane (një përmasore) me dispersion

2 në qoftë se plotësohen kushtet e mëposhtme.

a) (0) 0B

b) Procesi ( )B t është me shtesa të pavarura. Me fjalë të tjera, për çdo varg

momentesh kohe 0 10, ,..., nt t t , për çdo n N , të tilla që 0 1 20 ... nt t t t ,

ndryshoret e rastit 1 0 2 1 1( ) ( ), ( ) ( ),..., ( ) ( )n nB t B t B t B t B t B t janë të pavarura.

c) Procesi ( )B t është me shtesa stacionare. Me fjalë të tjera, për çdo 0 s t ,

shtesa ( ) ( )B t B s varet vetëm nga t s .

d) ( )B t ka shpërndarje normale 2(0, )N t për çdo 0t .

e) Trajektoret ( )t B t janë të vazhdueshme për çdo 0t .

17

Kur 2 1 themi se ( )B t është lëvizje brouniane standarde.

Menjëherë nga përkufizimi 1.5 rrjedhin barazimet e mëposhtme.

[ ( ) ( )] 0E B t B s (1.16)

2[ ( ) ( )]D B t B s t s (1.17)

Këto barazime përdoren shpesh edhe tek përkufizimi i lëvizjes brouniane (duke

zëvendësuar kushtet c) dhe d), por duke supozuar shpërndarjen normale). Është i

vërtetë pohimi i mëposhtëm.

Pohim 1.1

Lëvizja brouniane është një proces me vetëngjashmëri me parametër 0.5H .

Vërtet, nga kushti d) i përkufizimit 1.5 kemi 1

2[ ( )] 0 [ ( )]E B at a E B t për çdo 0a

dhe 0t . Shqyrtojmë tani kovariancën [ ( ), ( )]Cov B t B s , për t > s.

Me që ( ) ( )B t B s është e pavarur me ( ) (0) ( )B s B B s (kushti b) dhe a)), kemi

0 [ ( ) ( ), ( )] [ ( ), ( )] [ ( )] [ ( ), ( )] [ ( ) (0)]Cov B t B s B s Cov B t B s D B s Cov B t B s D B s B

Atëherë, nga barazimi (1.17), gjejmë se 2 2[ ( ), ( )] min( , )Cov B t B s s t s . Prandaj,

duke përdorur dhe simetrinë e indekseve t dhe s, ne mund të shkruajmë 1 1

2 2 2 2[ ( ), ( ] min( , ) min( , ) [ ( ), ( )] [ ( ), ( )]Cov B ct B cs ct cs c t s cCov B t B s Cov c B t c B s

Përfundimisht, duke pasur parasysh se ( )B t ka shpërndarje normale, e cila

përcaktohet plotësisht nga pritja matematike dhe kovariancat e saj, ne konkludojmë se

( )B ct dhe 1

2 ( )c B t kanë të njëjtën shpërndarje, pra ( )B t është një proces me

vetëngjashmëri me parametër të vetëngjashmërisë 1

2H .

Për lëvizjen brouniane, nga barazimi (1.17), mund të shkruajmë

2[ ( ) ( )]D B t T B t T për 0T .

Pra,devijimi standard i shtesave të një lëvzje brouniane standarde (2 1 ) është

12[ ( ) ( )]SD B t T B t T T (1.18)

ndërsa për lëvzjen brouniane të çfarëdoshme kemi

12[ ( ) ( )]SD B t T B t T (1.19)

Ky fakt referohet në literaturë si “ligji 1

2T ”.

Për më shumë pohime dhe procese që përftohen prej lëvizjes brouniane shih Puka

(2010).

Gjithashtu mund të tregohet se procesi i shtesave i një lëvizje brouniane është një

proces stacionar i cili ka densitet konstant, pra është analogu i zhurmës së bardhë

Gausiane, në hapësirën kohore të vazhdueshme. Pra, lëvizja brouniane mund të

interpretohet si analogu i një procesi endje rasti Gausiane, në hapësirën kohore të

vazhdueshme.

18

Duke përgjithësuar lëvizjen brouniane mund të marrim lëvizjen brouniane thyesore

me parametër 0 1H si më poshtë.

Përkufizim 1.6 (Mandelbrot dhe Van Ness, 1968).

Le të jetë 0 1H , 0b një numër real çfarëdo dhe ( )B t një lëvizje brouniane

standarte. Atëherë, procesin ( )HB t të përcaktuar sipas barazimeve:

0(0)HB b ,

0 1 1 1

2 2 2

12 0

1( ) (0) [( ) ( ) ] ( ) ( ) ( )

( )

tH H H

H HB t B t s s dB s t s dB sH

për 0t

dhe në mënyrë të ngjashme për 0t ,

e quajmë lëvizje brouniane thyesore me parametër H.

Lëvizjet brouniane thyesore ndahen në tre klasa të dallueshme esencialisht njëra nga

tjetra, që u korrespondojnë respektivisht vlerave 1

02

H , 1

12

H dhe 1

2H .

Në qoftë se 0 0b dhe 1

2H , atëherë merret lëvizja brouniane e zakonshme,

1

2

( ) ( )B t B t . Pohimet e mëposhtëm motivojnë propozimin e lëvizjes brouniane

thyesore (Mandelbrot dhe Van Ness, 1968, Teorema 3.3).

Pohim 1.2

Shtesat e një procesi lëvizje brouniane thyesore janë stacionare dhe me

vetëngjashmëri me parametër të vetëngjashmërisë H.

Në fakt, tregohet se lëvizja brouniane thyesore është i vetmi proces gausian me shtesa

stacionare që është me vetëngjashmëri (Cox, 1984).

Pohim 1.3

Proceset e lëvizjes brouniane thyesore ndjekin një “ligj HT ” në kuptimin e devijimit

standard të shtesave të tij.

Ky pohim justifikohet nga vërtetësia e barazimit

2 2[{ ( ) ( )} ] H

H H HE B t T B t T C (1.20)

ku konstantja HC varet vetëm nga parametri H.

Pohim 1.4

Funksioni i kovariancave të një procesi lëvzje brouniane thyesore është proporcional

me 2 2Hk

.

Pohim 1.5

Funksioni i densitetit spektral i një procesi lëvzje brouniane thyesore është

proporcional me 2 1H

.

Mund të përmendim, gjithashtu, se lëvzja brouniane thyesore nuk e plotëson kushtin e

përzieries së fortë (strong mixing) për seritë kohore.

19

Proceset e lëvizjes brouniane thyesore u propozuan nga Mandelbrot dhe Van Ness me

qëllim për të krijuar një familje procesesh rasti me sa më pak parametra, të tilla që në

një farë mënyre të jenë të përshtatshme për modelimin e asaj që mund të ndodhë në

procese (fenomene), që karakterizohen nga mungesa e pavarësisë asimptotike.

Integrali i përdorur në përkufizimin 1.6 jepet në kuptimin e integrimit pikësor dhe

mund të interpretohet si një integrim thyesor i lëvizjes brouniane. Hosking (1981) e

interpreton lëvizjen brouniane thyesore si derivat thyesor të rendit 1

( )2

H të lëvizjes

brouniane të zakonshme. Një këndvështrim më intuitiv të këtij derivimi thyesor jepet

nga Beran (1994).

Vlen të përmendim se teorema qëndrore limite nuk është e vlefshme për mesataren e

zgjedhjes nga procesi i shtesave të një lëvizje brouniane thyesore me parametër të

vetëngjashmërisë 1

2H . Kjo bëhet e qartë në se vemë re se mesatarja e shtesave

(1) (0)H HB B , (2) (1)H HB B ,..., ( ) ( 1)H HB n B n është e formës

1[ ( ) (0)]H Hx B n B

n dhe, nga barazimi (1.20), kemi 2 2( ) HD x n .

1.3.3 Procesi zhurma thyesore gausiane

Mund të tregohet se procesi i shtesave i një lëvizje brouniane është një proces

stacionar i cili ka densitet konstant, pra është analogu i zhurmës së bardhë gausiane,

në hapësirën kohore të vazhdueshme. Pra, lëvizja brouniane mund të interpretohet si

analogu i një procesi endje rasti gausiane, në hapësirën kohore të vazhdueshme. Duke

ruajtur këtë analogji, derivati ' ( )HB t , pra procesi i shtesave i një lëvizje brouniane

thyesore, mund të interpretohet si një zhurmë e bardhë thyesore me hapësirë të

vazhdueshme.

Ky interpretim na lejon mundësinë e përftimit të procesit që quhet zhurmë thyesore (e

pjesshme) gausiane në hapësirën diskrete. Mandelbrot dhe Wallis (1969a) e

përcaktuan zhurmën e bardhë thyesore gausiane me hapësirë diskrete si një proces

stacionar, funksioni i autokorrelacioneve të të cilit është i njëjtë me atë të procesit të

shtesave me një njësi të një lëvizje brouniane thyesore.

Përkufizim 1.8 (Mandelbrot dhe Wallis (1969a)

Le të jetë ( )HB t një lëvizje brouniane thyesore me parametër të vetëngjashmërisë H .

Atëherë, procesi tZ që jepet nga barazimi

( 1) ( ), 0, 1, 2,...t H HZ B t B t t (1.22)

quhet zhurmë e bardhë thyesore gausiane (e Gausit) me parametër thyesor H (ose

thjesht zhurmë thyesore e Gausit; në literaturë përdoret shkurtimi fGn, fractional

Gaussian noise).

Nga përkufizimi rrjedh se zhurma thyesore gausiane është një proces stacionar.

Gjithashtu, tregohet se kovariancat e një zhurme thyesore gausiane jepen sipas

barazimit të mëposhtëm (Samorodnitsky, 2006)

20

222 2( , ) [( 1) 1 2 ]

2

HH HHk t k t

CCov Z Z k k k

(1.23)

për 1t dhe 0k . Këtu, HC është një konstante pozitive e përcaktuar vetëm nga

parametri H. Prej këtej, rrjedh se zhurma thyesore gausiane është një proces stacionar.

Në varësi të vlerave e parametrit H mund të dallojmë tre raste:

(i) Për 0.5H procesi Zt është i pakorreluar, pra imiton zhurmën e bardhë.

(ii) Për 0.5H procesi Zt është me autokorrelacione negative (vlerat luhaten më

shpesh (shpejt) se tek zhurma e bardhë).

(iii) Për 0.5H procesi Zt është me autokorrelacione pozitive (vlerat luhaten më

rrallë (ngadalë) se tek zhurma e bardhë).

Gjithashtu, nga barazimi (1.23) rrjedh se për 0,5H kemi

2(1 )(2 1) H

k H H k , kur k

Pra, funksioni i autokorrelacionit të një zhurme thyesore gausiane konvergjon drejt

zeros kur distanca rritet pambarimisht. Rendi i këtij zvogëlimi është hiperbolik, sipas

ligjit 2 2Hk . Kur 0.5 1H rendi i zvogëlimit është i tillë që procesi Zt është me

memorie të gjatë. Gjithashtu, densiteti spektral i një zhurme thyesore gausiane jepet

nga barazimi (shih Samorodnitsky, 2006, shembull 5.1).

2(1 2 )

( ) (1 cos ) 22

H

H

k

f C k

, për1

2H (1.24)

Prej këtej rrjedh se

1 2( )

Hf

, kur 0 (1.24a)

Në qoftë se , kemi 0

lim ( )f

; në këtë rast thuhet se densiteti spektral

ka (shfaq) pol në origjinë.

Siç përmendëm në fillim të paragrafit, analogu i lëvizjes brouniane për rastin e kohës

diskrete është endja e rastit me diferenca normale. Kjo lejon mundësinë e përftimit të

zhurmës thyesore gausiane si një varg shtesash “thyesore” të endjes së rastit (sikundër

lëvizja brouniane thyesore merret nga lëvizja brouniane nëpërmjet integrimit thyesor).

Një këndvështrim i tillë e çoi Hosking (1981) në prezantimin e modeleve ARFIMA si

përgjithësim i modeleve ARMA. Paragrafi vijues i kushtohet përcaktimit dhe vetive të

modeleve ARFIMA.

1.4 Diferencimi (integrimi) thyesor dhe modelet ARFIMA

Qëllimi i modeleve ARFIMA, sipas Hosking (1981) është që të prezantohet një

familje modelesh që të kenë vetitë për:

(a) të modeluar në mënyrë shtjelluese (eksplicite) varësinë afatgjatë midis vrojtimeve.

(b) të qenë mjaftushëm të manovrueshëm (fleksibël) për të shpjeguar njëkohësisht

strukturën afatshkurtër dhe afatgjatë të korrelacioneve të serisë.

(c) të gjeneruar sa më thjesht seri kohore me veti të memories së gjatë.

0.5 1H

21

Deri ne vitet ‘80, para punimeve të Granger dhe Joyeux (1980) dhe të Hosking

(1981), seritë kohore lineare grupoheshin në dy grupe:

- seri kohore stacionare me memorie te shkurtër, dhe

- seri kohore jo stacionare (ose të integruara të rendit 1).

Tipi i parë i proceseve është procesi ARMA(p,q) dhe është një mjet i dobishëm për të

modeluar sjelljen e memories së shkurtër. Ai është zgjidhja stacionare e ekuacionit së

diferencës të rastit

( )( ) ( )t t tB X X (1.25)

ku është pritja matematike e procesit, B është operatori i kthimit prapa,

1( )t tB X X , t është një zhurmë e bardhë 2. . .(0, )i i d , si dhe

2

1 2( ) 1 ... p

pz z z z dhe 2

1 2( ) 1 ... q

qz z z z janë polinomet e

pjesës AR dhe MA respektivisht.

Për të siguruar stacionaritetin supozohet se polinomet dhe nuk kanë rrënjë në

rrethin njësi. Që procesi të jetë i identifikueshëm, duhet që polinomet dhe të

mos kenë rrënjë të përbashkëta dhe, që procesi të jetë shkakësor (causal) dhe i

kthyeshëm duhet që të dy polinomet ti kenë të gjitha rrënjët jashtë rrethit njësi,

domethënë ( ) 0z dhe ( ) 0z për të gjitha 1z (për më tepër detaje për

proceset ARMA shih për shembull Brockwell dhe Davis, 1991).

Pa e humbur përgjithësimin ne mund të supozojmë që ( ) 0tE X . Densiteti

spektral i një procesi ARMA(p,q) jepet nga barazimi:

2 ( )( ) ,

2 (

i

i

ef

e

(1.26)

Box dhe Jenkins (1976) kanë prezantuar modelin ARIMA(p,d,q) për seritë kohore

lineare jo stacionare si një përgjithësim të proceseve ARMA, në kuptimin që tY është

një proces ARIMA(p,d,q), për ndonjë numër të plotë pozitiv d, në qoftë se, pas një

numri të fundëm diferencash (pikërisht d herë) të tY , d

t tY X , ne marrim një proces

ARMA(p,q), sipas ekuacionit ( ) ( )T TB X B . Operatori d nënkupton kryerjen e

njëpasnjëshme d herë të operatorit të diferencës dhe jepet sipas barazimit

0 1

!(1 ) ( )

!( )!

d dd d j j

t t d t t t j

j j

dX B X C B X X X

j d j

(1.27)

Proceset ARIMA(p,d,q) quhen gjithashtu, edhe procese të integruara të rendit d dhe

shënohen I(d). Në këtë kuptim, proceset ARMA(p,q) janë rast i veçantë i proceseve

ARIMA(p,d,q), kur d=0, pra ato janë procese I(0). Një rast tjetër shumë i zakonshëm

merret për d=1, pra kur seria tX është jo stacionare, por seria e diferencave

1t t tY X X është një proces ARMA(p,q). Një shembull i këtij rasti është dhe

procesi i endjes së rastit.

Edhe pse klasa e proceseve ARIMA është mjaft e gjerë, pasi ajo mund të përshkruajë

statistikisht mjaftueshëm procesin që gjeneron të dhënat në shumë situata, në praktikë

ndeshen seri kohore të cilat nuk janë as I(0) as I(1), sjellja e të cilave duket se është

22

midis këtyre dy modeleve. Për këtë arsye Granger dhe Joyeux (1980) si dhe Hosking

(1981), pavarësisht nga njëri tjetri, morën në konsideratë mundësinë që d të marrë

çfarëdo vlerë reale.

Në këtë paragraf përshkruhen bazat teorike të modelit ARFIMA, i cili është një model

parametrik, që mund të përmbajë memorie të gjatë dhe përdoret gjerësisht në

literaturë për të modeluar seri kohore me veti të memories së gjatë.

Fillimisht për qëllimet e këtij paragrafi po japim dy shënimet e mëposhtme.

Shënim 1.1. Funksioni gama, , përcaktohet sipas barazimit (Brockwell dhe Davis

(1991))

1

0

, 0

( ) , x=0

1( 1), x 0

x tt e dt x

x

xx

(1.28)

Disa veti të këtij funksioni janë: (Abramowitz dhe Stegun 1964, faqe 255-258) )

(1) 1 .

1

2

.

( ) ( 1)!n n për çdo n natyror.

( 1) ( )x x x .

(1 ) ( )sin( )

x xx

, prej nga rrjedh se

( 1) ( ) (1 )( )

( 1 )

n x xx n

n x

për çdo n natyror.

( )lim 1

( )n

n

n n

për n dhe R (forma limite e përafrimit të Stirlingut), prej

nga rrjedh se

( ) kur

( )

nn n

n

.

Shënim 1.2. Funksioni i autokovariancave inverse i një serie kohore stacionare

përcaktohet nëpërmjet funksionit të densitetit spektral, në mënyrë të ngjashme si

funksioni i autokovariancës, por duke zëvendësuar funksionin e densitetit spektral

( )f me të përmbysurin e tij, 1

( )f (kur ky i fundit është i integrueshëm). Më

formalisht shih Cleveland, 1972.

1

2

,

0

1

( )

k

inv k e df

23

Më tej, funksioni i autokorrelacioneve inverse është

,

,

,0

inv k

inv k

inv

Autokovariancat inverse interpretohen në mënyrë të ngjashme me autokovariancat e

pjesshme, megjithëse ato disa herë japin një ide më të qartë për diagnostikimin e

modelit. Kur procesi që duam të identifikojmë është i tipit MA(q), autokovariancat

inverse kanë avantazh në lidhje me autokovariancat e pjesshme (shih dhe Chatfield,

1980).

1.4.1 Procesi i integruar pjesërisht (thyesor)

Endja e rastit mund të modelohet nga barazimi 1t t t tX X X ku t janë

ndryshore rasti i.i.d.. Duke përdorur operatorin e vonesës (ose të kthimit një hap

prapa) formalisht mund të shkruajmë (1 ) t tB X . Pra ecja e rastit mund të shihet si

një proces ARMA(0,1,0).

Granger dhe Joyeux (1980) dhe Hosking (1981) e përgjithësuan shprehjen e

mësipërme duke marrë diferencat thyesore (e pjesshme) të procesit. Pikërisht,

Hosking (1981) përdori zbërthimin binomial për të shkruar barazimin e pafundmë të

mëposhtëm

2 3

0

1 11 1 (1 ) (1 )(2 ) ...

2! 3!

d kd k

d

k

B C B dB d d B d d d B (1.29)

(shenja merret gjithmonë negative për arsye të ndërrimit një numër tek ose çift herësh

të vendeve të kufizave d − k me k – d).

Atëherë, një proces , 0, 1, 2...tX t quhet pjesërisht i integruar (ose i integruar

në mënyrë thyesore; fractionally integrated) me parametër d në qoftë se ai mund të

shkruhet nëpërmjet barazimit:

(1 )d

t tB X , (1.30)

ku 2~ . . .(0, )t i i d është një proces zhurmë e bardhë e pavarur me pritje matematike

( ) 0tE dhe dispersion 2( )tD . Hosking e përkufizoi një proces të tillë si

proces ARMA(0,d,0) me d thyesor por në literaturën e sotme shpesh referohet si

proces i pjesërisht i integruar (ose i integruar thyesor) dhe përdoret shënimi FI(d)

(Fractionally Integrated).

Atëherë, duke përdorur barazimet (1.29) dhe (1.30) kemi:

1 2 3

1 1(1 ) (1 )(2 ) ....

2 6t t t t tX dX d d X d d d X , ose

1 2 3

1 1(1 ) (1 )(2 ) ....

2 6t t t t tX dX d d X d d d X

Pra marrim kështu një paraqitje të pafundme autoregresive, AR(∞), sipas barazimit

1

t k t k t

k

X X

(1.31)

24

ku koeficientët k jepen sipas barazimeve

1

(1 )(2 )...( 1 ) 1

!k k

d d d k d k d

k k

, për 1, 2,...k (1.32a)

Këta koeficientë kanë shenjë të njëjtë me , kur 1d d . Duke përdorur funksionin

gama ata mund të shkruhen me anë të barazimeve

( ) ( )

(1 ) ( 1) ( ) ( 1)k

d k d k d

d k d k

(1.32b)

Barazimi i parë përdoret kur 0d , ndërsa kur 0d mund të përdoret barazimi i

dytë.

Gjithashtu nga barazimi (1.30) dhe duke përdorur formalisht barazimin (1.29) për

d d , marrim

1 2 3

1 1(1 ) (1 )(2 ) ...

2 6t t t t tX d d d d d d

Pra, kemi një paraqitje të pafundme të mesatares rrëshqitëse, MA(∞) sipas barazimit

0

t k t k

k

X

(1.33)

ku koeficientët k jepen sipas barazimeve

0 1 dhe

1

(1 )(2 )...( 1 ) 1

!k k

d d d k d k d

k k

, për 1, 2,...k (1.34)

Duke përdorur funksionin gama ata mund të shkruhen me anë të barazimeve

( ) ( )

( ) ( 1) (1 ) ( 1)k

k d d k d

d k d k

(1.35)

Barazimi i parë përdoret kur 0d , ndërsa kur 0d mund të përdoret barazimi i

dytë.

Përsëri, këta koeficientë kanë shenjë të njëjtë me d kur 1d . Vërejmë se

koeficientët k dhe k mund të merren nga njëri-tjetri nëpërmjet zëvendësimit të d

me d .

Barazimet e mësipërme që ne i shkruajtëm formalisht, janë të përligjura nga teorema e

mëposhtme treguar nga Hosking (1981) (Hosking, 1981, teorema 1, faqe 167). Kjo

teoremë jep gjithashtu karakteristikat statistikore të procesit FI(d).

Teorema 1.1

Le të jetë tX një proces ARIMA(0,d,0).

(a) Kur 0.5d , procesi tX është stacionar dhe ka një paraqitje të pafundme të

mesatares rrëshqitëse MA(∞) sipas barazimit (1.33) me koeficientë sipas (1.34)

Gjithashtu, kur k , kemi 1

( 1)!

d

k

k

d

(1.36)

25

(b) Kur 0.5d , procesi tX është i kthyeshëm dhe ka një paraqitje të pafundme

autoregresive, AR(∞) sipas barazimit (1.31) me koeficientë si tek (1.32a,b).

Gjithashtu, kur k , kemi 1

( 1)!

d

k

k

d

(1.37)

Për pikat pasardhëse supozohet se 1 1

2 2d .

(c) Funksioni i densitetit spektral për procesin tX është

22

( ) 2sin2 2

d

f

për 0 (1.38)

dhe kemi 2( ) kur 0df (1.39)

(d) Funksioni i autokovariancës i tX është

( 1) ( 2 )!cov( , ) ( )

( )!( )!

k

k t t k t t k

dX X E X X

k d k d

(1.40)

(kujtojmë se kemi supozuar që ( ) 0tE X ).

Gjithashtu mund të shkruajmë

( ) (1 2 )

( 1 ) (1 ) ( )k

k d d

k d d d

(Brockwell dhe Davis (1991))

Funksioni i autokorrelacionit i tX është

0

( )!( 1)!, ( 0, 1,...)

( 1)!( )!

kk

d k dk

d k d

(1.41)

ose ( ) (1 )

( 1 ) ( )k

k d d

k d d

(Brockwell dhe Davis (1991)).

ose akoma (1 )...( 1 )

, ( 1, 2, ...)(1 )(2 )...( )

k

d d k dk

d d k d

(1.41a)

Në veçanti, 0 2

( 2 )!

[( )!]

d

d

dhe

11

d

d

(1.42)

Gjithashtu, kur k , kemi

2 1( )!

( 1)!

d

k

dk

d

(ose, 2 1(1 )

( )

d

k

dk

d

) (1.42a)

(e) Autokorrelacionet inverse të procesit tX janë

2 1

,

!( 1)! !

( 1)!( )! ( 1)!

d

inv k

d k d dk

d k d d

për k (1.43)

(f) Autokorrelacionet e pjesshme të { }tX janë

26

, ( 1, 2, ...)kk

dk

k d

(1.44)

Më tej do shohim disa veti asimptotike për zhvendosjen, dispersionin, dhe

shpërndarjen asimptotike të mesatares së zgjedhjes dhe për autokovariancën dhe

autokorrelacionin e serive me memorie të gjatë.

Supozojmë se plotësohen kushtet e mëposhtme:

Kushti 1.1. Seria tX mund të paraqitet në formën

0

t j t j

j

X

(1.45)

ku t është një zhurmë e bardhë e pavarur.

Kushti 1.2. Kur k , funksioni i autokovariancës k plotëson relacionin

k k , 0 , 0 1 (1.46)

Kushti 1.3. Koeficientet j , të përdorur tek barazimi (1.45), plotësojnë relacionin

j j kur j , ku >0 dhe 1

= (1 )2

(1.47)

Kushti 1.4. Për më tepër supozojmë se shpërndarja e t plotëson një nga kushtet e

mëposhtme:

2 2( )tE (1.48a)

4 4( ) (3 )tE (1.48b)

( )m

tE për çdo numër të plotë pozitiv m (1.48c)

2~ (0, )t N (1.48d)

Atëherë, Hosking (1996) ka treguar se janë të vërteta rezultatet e tabelës 1.1 së

mëposhtme.

Tabela 0.1 Rendi i konvergjencës për zhvendosjen, dispersionin dhe shpërndarjen

asimptotike të statistikave të zgjedhjes për një seri kohore normale me funksion të

autokovariancës kur n → ∞.

Statistika Vlerat e Zhvendosja Dispersioni Shpërndarja

asimptotike

Mesatarja e

zgjedhjes 0 1 0 n Normale

Autokovariancat

dhe

autokorelacionet

empirike

10

2 n 2n

Rosenblatt i

modifikuar

1

2 n

1 logn n Normale

11

2 n 1n Normale

k k

27

Disa nga kushtet e mësipërme janë më shumë shtrënguese se sa është e nevojshme,

por janë vendosur për të lehtësuar prezantimin.

Tregohet se zhurma e pjesshme e Gausit si dhe proceset ARFIMA plotësojnë kushtin

1.1 me koeficientë që plotësojnë kushtin 1.3. Megjithatë ekzistojnë procese me

shpërndarje jo normale me memorie të gjatë për të cilat nuk ekziston një paraqitje

lineare si tek kushti 1.1 (për më tepër shih Hosking, 1996).

1.4.2 Proceset ARFIMA

Procesi pjesërisht i integruar FI(d), i përkufizuar nga barazimi (1.30) përshkruhet

vetëm nga një parametër, d (përveç 2

). Për këtë arsye klasa e modeleve FI(d) është

një klasë e kufizuar, ku forma e funksionit të autokorrelacioneve është e përcaktuar

vetëm nga një parametër. Zvogëlimi i ngadaltë i autokorrelacioneve është një

fenomen që është vërejtur në një sërë faktesh empirike në ekonomi dhe për këtë arsye,

ai është një cilësi e vlefshme e modelit FI(d). Por, megjithatë ky model është tepër i

kufizuar në modelimin e dinamikave afatshkurtra. Për këtë qëllim procesi FI(d)

përgjithësohet duke marrë modelin ARFIMA(p,d,q) (AutoRegressive Fractionally

Integrated Moving Average) të proceseve autoregresive të integruara pjesërisht me

mesatare të lëvizshme. Në mënyrë të përmbledhur, një model ARFIMA është një

model ARIMA ku mbetjet (inovacionet) janë një zhurmë e bardhë thyesore.

Përpara punimeve të Granger dhe Joyeux (1980) dhe Hosking (1981), seritë kohore

lineare përgjithësisht ndaheshin në seri stacionare me memorie të shkurtër dhe në seri

jostacionare (ose seri të integrueshme të rendit një). Tipi i parë i proceseve është

modeluar nga klasa e gjerë e modeleve ARMA(p,q), propozuar nga Box dhe Jenkins

(1970). Ky model është një mjet shumë i dobishëm për të modeluar sjelljen me

memorie të shkurtër. Ai paraqitet sipas barazimit (1.25) dhe ka densitet spektral të

dhënë sipas barazimit (1.26). Prej barazimit (1.26) gjejmë se

22

20

(1)lim ( ) konstante

2 (1)f

(1.49)

Një model ARIMA(p,d,q), ku 1, 2, ...d , mund të shihet si një model ARMA(p,q) i

zbatuar pasi seria fillestare është diferencuar d herë për t’u bërë stacionare, pra në

serinë 1t t tY X X kur 1d , ose 1 1 2t t t t tY X X X X kur 2d , e

kështu me radhë. Parametri i integrimit d mund të marrë edhe vlera të plota negative

dhe në këtë rast seria fillestare integrohet d herë (p.sh. kur 1d seria e re është t

t j

j

Y X

).

Granger dhe Joyeux (1980) dhe Hosking (1981), pavarësisht nga njëri tjetri, i

përgjithësuan modelet ARIMA(p,d,q), duke lejuar që d të marrë edhe vlera thyesore

dhe duke përftuar në këtë mënyrë modelet ARFIMA.

Modeli ARFIMA(p,d,q) përcaktohet nga barazimi:

( )(1 ) ( )d

t tB B X B (1.50)

për t , ku t janë ndryshore rasti i.i.d. me pritje matematike ( ) 0tE dhe

dispersion 2( )tD , ndërsa është pritja matematike e procesit. Pra, ky proces

28

mund të mendohet si një model ARMA(p,q) i ndërtuar për ndryshoren e përftuar nga

diferencimi i pjesshëm (d herë) i ndryshores fillestare, ku me diferencim d herë

nënkuptohet barazimi (1.27) i përdorur në modelin FI(d). Supozohet se parametri

thyesor d i merr vlerat në intervalin ( 0.5,0.5) , përndryshe procesi diferencohet një

numër të plotë herësh deri sa të arrihet ( 0.5,0.5)d .

Edhe modeli ARFIMA(p,d,q) mund të paraqitet si një model AR(∞) ose si një model

MA(∞) duke supozuar të njëjtat kushte si tek modelet ARMA(p,q). Mund të tregohet

se sjellja asimptotike e funksionit të autokovariancës (dhe autokorrelacionit) të

procesit ARFIMA(p,d,q)është e njëjtë me atë të procesit FI(d) përkatës. Kjo ndodh

pasi efektet e parametrave të memories së shkurtër, që përfaqësohet nga pjesa

ARMA(p,q) e modelit, janë të neglizhueshme (parëndësishme) për distancat e largëta

(kur k ). Për më tepër, densiteti spektral i një procesi ARFIMA(p,d,q) jepet sipas

barazimit

2

( ) ( ) 2sin2

d

ARMAf f

(1.51)

ku ( )ARMAf është densiteti spektral i pjesës ARMA të modelit (pra i procesit

(1 )d

t tU B X ). Prej këtej rrjedh se 2( ) kur 0df , ashtu si tek barazimi

(1.39) për proceset FI(d). Duke iu referuar barazimeve (1.49) dhe (1.51) mund të

kuptojmë dallimin e serive me memorie të gjatë nga ato me memorie të shkurtër për

sa i përket sjelljes së densitetit spektral afër origjinës (zeros).

Proceset e diferencuara thyesore ARFIMA(p,d,q), zotërojnë mjaft veti të mira

(Hosking, 1981); ato janë mjaft fleksibël dhe lejojnë modelimin e njëkohshëm të

sjelljes afatshkurtër dhe asaj afatgjatë të serisë. Gjithashtu, është mjaft e lehtë për të

krijuar (simuluar) një seri artificiale nga modeli (i supozuar i njohur).

1.5 Vlerësimi i memories së gjatë

Ekziston një literaturë e gjerë rreth problemit të identifikimit dhe të vlerësimit të një

procesi ARFIMA(p,d,q). Beran (1994) jep një paraqitje të gjerë të këtyre metodave.

Metodat e vlerësimit të memories së gjatë mund të përmblidhen në tre klasa:

- metoda vizuale (heuristike)

- metoda gjysmë parametrike

- metoda parametrike

Ne do të konsiderojmë disa nga metodat më të përdorshme, për evidentimin dhe

vlerësimin e memories së gjatë.

1.5.1 Zbulimi vizual i memories së gjatë

Në literaturë ekzistojnë disa metoda të thjeshta grafike për evidentimin dhe vlerësimin

e parametrit të memories d. Zakonisht hapi i parë në një zbatim praktik është ndërtimi

i korrelogramit të serisë, pra i grafikut të autokorrelacioneve empirike. Një zvogëlim i

ngadaltë i autokorrelacioneve është një tregues i memories së gjatë. Autokorrelacionet

e zgjedhjes janë vlerësuesa konvergjent të autokorrelacioneve teorikë të një serie me

memorie të gjatë (Baillie, 1996). Duke iu referuar tabelës 1.1 dhe barazimit (1.42a)

për rastin e modeleve FI(d), rendi i konvergjencës të autokorrelacioneve të zgjedhjes

29

nga një seri e modelit ARFIMA(p,d,q) jepet sipas tabelës 1.2, së mëposhtme (rendi

gjendet nga tabela 1.1 duke pozuar 1 2d dhe duke shumëzuar formalisht rendin

e konvergjencës së zhvendosjes me rrënjën katrore të rendit të konvergjencës së

dispersionit).

Tabela 0.2 Rendi i konvergjencës së autokorrelacioneve empirike për një seri kohore

të modelit ARFIMA(p,d,q).

Vlerat e d-së Shkalla e konvergjencës

0.5 0.25d 0.5n

0.25d

0.5

ln( )

n

n

0.25 0.5d 0.5 dn

Megjithatë, Newbold dhe Agiakloglou (1993) treguan se autokorrelacionet e

zgjedhjes të zhurmës thyesore janë në përgjithësi të zhvendosur, dhe se vetia e

zvogëlimit të ngadaltë e autokorrelacioneve të një serie me memorie të gjatë, shpesh

herë nuk vrojtohet tek autokorrelacionet e zgjedhjes. Një gjë e tillë shpesh rrjedh për

arsye të rendit të ngadaltë të konvergjencës së dispersionit të mesatares së zgjedhjes.

Në vijim ne prezantojmë tre metoda vizuale për evidentimin e memories së gjatë.

Metodat e mëposhtme japin një vlerësim të katrorëve më të vegjël për parametrin e

vetëngjashmërisë H, i cili lidhet me parametrin e memories d sipas barazimit

0.5H d (1.52)

Për secilën nga metodat e prezantuara më poshtë është e mundur dhe ndërtimi i

grafikut të drejtëzës së regresit për metodën përkatëse, por saktësia e tyre varet shumë

nga parametrat përkatës, të cilët siç do të shohim, mund të përcaktohen vetëm në

mënyrë orientuese.

(i) Vlerësusi R/S.

Vlerësuesi R/S është përdorur gjerësisht nga hidrologu i famshëm Hurst (1951) gjatë

investigimeve të tij të prurjeve të lumit Nil. Ai vuri re të ashtuquajturën efekti Jozef,

domethënë, periudha të gjata me prurje të skajshme dhe periudha të gjata me prurje të

ulëta. Problemi ishte i lidhur me ndërtimin e një rezervuari ideal për ujin. Hurst mundi

të përshkruante kapacitetin ideal të një rezervuari uji nëpërmjet statistikës së

përshtatur të amplitudës ,R t k të dhënë nga barazimi

00

, max mint i t t i t t i t t i ti ki k

i iR t k Y Y Y Y Y Y Y Y

k k

(1.53)

ku 1

j

j i

i

Y X

është seria e shumave të pjesshme.

Kjo amplitudë standardizohet nga devijimi empirik i mëposhtëm

2

,

1,

t k

i t k

i t

X X

S t kk

(1.54)

30

ku ,

1

1 t k

t k i

i t

X Xk

.

Atëherë, statistika

,,

,

R t kQ t k

S t k (1.55)

është quajtur amplituda e rregulluar e rishkallëzuar ose statistika R/S dhe, shpesh

shënohet thjesht Q. Duke vizatuar grafikun e logaritmit log ,Q t k kundrejt log(k)

do të vrojtonim një vijë të drejtë. Kjo drejtëz mund të vlerësohet me metodën e

katrorëve më të vegjël (me term të lirë) për të matur lidhjen lineare ndërmjet

dhe log(k). Përcaktohet se në rastin kur të dhënat janë të pakorreluara

ose me memorie të shkurtër, pjerrësia β, e drejtëzës së regresit tenton të jetë afërsisht

1

2, ndërsa në prezencën e memories së gjatë ajo tenton drejt një konstante me vlerë

më të madhe, ndërmjet 1

2 dhe 1. Tregohet se për proceset ARFIMA(p,d,q) ka vend

barazimi 1

2d . Këto rezultate empirike janë mbështetur nga dy teorema të

Mandelbort (1975). Teorema e parë është një rezultat asimptotik për 1

2 ,k Q t k

i

vlefshëm për proceset me memorie të shkurtër, ndërsa teorema e dytë tregon veti

asimptotike të ngjashme për ,Hk Q t k për proceset që konvergjojnë në lëvizje

thyesore brouniane.

Pohim 1.6. Le të jetë tX , i tillë që 2

tX është ergodik dhe 1

2

1

t

s

s

t X

konvergjon dobët

tek lëvzja brouniane kur t .

Atëherë, 1

2 , kur kdk Q t k

, ku është një ndryshore rasti e

padegjeneruar.

Pohim 1.7. Le të jetë tX , i tillë që 2

tX është ergodik dhe 1

tH

s

s

t X

konvergjon dobët

tek lëvzja brouniane kur t .

Atëherë, , kur kdHk Q t k , ku është një ndryshore rasti e

padegjeneruar.

Statistika R/S ka vetinë e pëlqyeshme të të qenit e qëndrueshme (robust) karshi

shpërndarjeve larg normales. Megjithatë, përderisa metoda R/S mbështetet në

ndryshimin e rendeve të konvergjencës për memorien e gjatë apo të shkurtër, ajo

kërkon të kemi një numër konsiderueshëm të madh vrojtimesh për të dhënë rezultate

të “besueshme”. Gjithashtu Lo (1991) tregoi se statistika R/S nuk është e

qëndrueshme kundrejt varësisë afatshkurtër.

log ,Q t k

31

Në figurën 1.8 tregohen grafikët e zbatimit të metodës R/S për dy seri të simuluara,

përkatësisht nga një model AR(1) me koeficient 1 0.45 (memorie e shkurtër) dhe

nga një model ARFIMA(0,d,0) me parametër 0.3d (memorie e gjatë).

Figura 0.8 Grafiku i metodës R/S për dy seri kohore të simuluara.

Të dy pjerrësitë e vlerësuara janë më të mëdha se 0.5 duke treguar prezencë të

memories së gjatë në të dyja seritë, megjithëse seria e parë është me memorie të

shkurtër.

Në fakt, është treguar se statistika R/S është mjaft e zhvendosur në prezencë të një

pjese AR(1) me koeficient 0.5 (Lo, 1991). Seria e parë e mësipërme është simuluar

nga një proces AR(1) me koeficient 0.45, pra afër vlerës 0.5.

Fatkeqësisht, nuk ka ndonjë teori asimptotike për statistikën Q, çka e bën të vështirë,

përdorimin e saj për konkluzione statistikore, p.sh. gjetjen e intervaleve të besimit.

Gjithashtu është e hapur çështja e zgjedhjes së pikës të ndërprerjes për k dhe,

rezultatet mund të ndryshojnë së tepërmi për vlera të larta të saj. Së fundmi,

Bhattacharya etj.(1983) ka treguar se vlerësuesi R/S nuk është i qëndrueshëm kundrejt

stacionaritetit, në veçanti ai mund të japë rezultate të gabuara në prezencë të një trendi

me shuarje të ngadaltë.

32

Në përgjithësi, sugjerohet se përdorimi i kësaj metode (ashtu si dhe i metodave të

mëposhtme) nuk duhet bërë i izoluar nga metodat e tjera.

Lo (1991) propozoi një modifikim të statistikës R/S duke përftuar statistikën

1 (1, )( )

( )q

q

R nV n

S nn (1.56)

ku (1, ) ( )R n R n është amplituda e serisë, që përftohet nga barazimi (1.58) për t=1

dhe k=n, ndërsa ( )qS n është një vlerësues konvergjent i devijimit empirik që jepet

sipas barazimit

1

22

1 1 1

1 2( ) ( )

qn n

q i i k k i

i i k i

S n X X q X X X Xn n

(1.57)

për një numër të plotë të fiksuar q. Me X është shënuar mesatarja e zgjedhjes ndërsa

koeficientët ( )i q jepen sipas barazimeve

( ) 1 , 1, 2, ..., 1

i

iq i q

q

(1.58)

Me supozimin se pika e cungimit, q duhet të rritet me rritjen e vëllimit të zgjedhjes n,

në rendin 1/4( )n o n , Lo (1991) tregoi se statistika ( )qV n konvergjon spas

probabilitetit tek një ndryshore rasti e përcaktuar dhe gjeti kuantilet e saj. Megjithatë,

performanca e statistikës ( )qV n në praktikë është tepër e ndjeshme nga vlerat e pikës

së cungimit q. Lo (1991) propozoi formulën e mëposhtme, të mbështetur tek zgjedhja,

e cila jep vlerën e përshtatshme të pikës së cungimit q, kur vrojtimet janë nga proceset

AR(1).

2/31/3

2

ˆ3 2

ˆ2 1

nq

(1.59)

Këtu, ̂ është vlerësuesi empirik i koeficientit autokorrelacionit të rendit të parë.

Teverovsky etj. (1999) treguan se në përgjithësi, me rritjen e q-së

, zvogëlohet

probabiliteti i refuzimit të hipotezës bazë se seria nuk përmban memorie të gjatë.

Butka etj. (2014) kanë treguar se përdorimi i statistikës ( )qV n , sugjeruar nga Lo

(1991), është i vlefshëm për testimin e memories së gjatë me metodën bootstrap me

cikle, që prezantohet në kapitullin 3.

(ii) Metoda e variancës së grumbulluar.

Kjo metodë është prezantuar nga Taqqu etj. (1995) dhe është përpunuar më tej nga

Giraitis etj. (1999) dhe Teverovsky dhe Taqqu (1997). Ideja e kësaj metode është të

vlerësojmë rendin e zvogëlimit të dispersionit të mesatares së zgjedhjes dhe duke

patur parasysh se ky zvogëlim është i rendeve të ndryshme konvergjence për seritë me

memorie të shkurtër dhe të gjatë, të përcaktohet në se kemi prezencë të memories së

gjatë apo jo. Metoda konsiston si më poshtë.

a) Për një numër të plotë m, serinë e vrojtuar 1 2, ,..., XnX X e ndajmë në n/m blloqe

të ndara nga njëra tjetra me gjatësi m secila (supozojmë se n plotpjesëtohet nga m).

33

b) Për çdo 1, 2, ..., /k n m njehsojmë vlerat mesatare

( 1) 1

1( )

km

m i

i k m

X k Xm

, si dhe dispersionin e zgjedhjes të tyre

2/ /

2

1 1

1 1ˆ ( ) [ ( )] ( )/ /

n m n m

m m m

k k

D X X k X kn m n m

(1.60)

Në se procesi është një zhurmë thyesore gausiane ose FI(d) është i vërtetë relacioni

2

0( )mD X m kur m , (1.61)

ku 2 2H për rastin e zhurmës thyesore gausiane, ose 2 1d për rastin e

procesit FI(d). Kështu që për të vlerësuar parametrin e memories ne mund të përdorim

regresin linear të logaritmit të ˆ ( )mD X me log(m) si dhe me term të lirë.

c) Atëherë, përsërisim hapat a) dhe b) për vlera të ndryshme të m-së. Vlerat e m-së

zgjidhen të tilla që të jenë të baraslarguara në shkallë logaritmike, pra të tilla që

1i

i

mC

m

, ku konstantja C përcaktohet në varësi të gjatësisë së serisë dhe të numrit të

pikave të regresit të dëshiruar (zakonisht merret C = 2)

d) Ndërtojmë dhe vlerësojmë drejtëzën e regresit të pikave me koordinata (log(m),

ˆlog{ ( )}mD X ).

Koeficienti i vlerësuar i pjerrësisë së drejtëzës së regresit shërben si vlerësim për

parametrin . Në se procesi ka memorie të shkurtër (ose është i pa

korreluar) atëherë drejtëza e përftuar duhet të ketë pjerrësinë të barabartë me -1.

Përndryshe vlera e del më e madhe.

Që procedura të jetë e vlefshme supozohet se m dhe n janë mjaftueshëm të mëdha si

dhe që m n në mënyrë që gjatësia e çdo blloku dhe numri i blloqeve të jenë

mjaftueshëm të mëdha.

Meqenëse zhvendosja e vlerësuesit tip variancë është e rendit jo më të vogël se

1

log n

, ky vlerësues mund të përdoret vetëm për seritë mjaft të gjata.

Në figurën 1.9 jepet grafiku i drejtëzës të përftuar nga metoda e mësipërme për të

njëjtat seri të simuluara tek rasti i figurës 1.9.

Në rastin e procesit AR(1) drejtëza e regresit është afërsisht paralele me drejtëzën me

pjerrësi -1. Pra nuk kemi “shenja” të pranisë së memories së gjatë. Vlerësimi i

parametrit d është negativ dhe afër zeros.

Në rastin e procesit ARFIMA(0,d,0) e ka koeficientin e pjerrësisë më të madh se -1,

duke treguar prezencë të memories së gjatë.

Pra, në të dy rastet metoda e variancës së grumbulluar ka dhënë konkluzion të saktë

(në përputhje me realitetin).

2 1d

34

Figura 0.8 Grafiku i metodës së variancës së grumbulluar për dy seritë kohore të

simuluara.

Teverovsky dhe Taqqu (1997) demonstruan, teorikisht dhe nëpërmjet eksperimenteve

Monte Carlo, se metoda e variancës së grumbulluar është e dobishme gjithashtu për të

zbuluar në se seria është stacionare apo shfaq ndryshime të nivelit të mesatares. Në se

grafiku i pikave të variancës së grumbulluar paraqet formë eksponenciale, atëherë kjo

është tregues i ndryshimeve të mesatares.

(iii) Metoda e Higuchi.

Higuchi (1988) modifikoi një metodë të propozuar nga Burlaga dhe Klein (1986), të

cilët u përpoqën të njehsonin dimensionin thyesor të densitetit spektral. Një kurbë

quhet thyesore në se ( ) Df , ku D është dimensioni thyesor dhe është i lidhur

me eksponentin H, të Hurstit, nëpërmjet barazimit 1D H . Në veçanti, Higuci

(1988) ndryshoi mënyrën e njehsimit të gjatësisë së kurbës, sepse metoda e

mëparshme e Burlaga dhe Klein (1986) jepte rezultate tepër të zhvendosura për vlera

të parametrit H afër njëshit. Ineteresant është fakti se formula e dhënë prej tij të

kujton formulën për variancën absolute të një funksioni prodhues real.

Kur na jepet një seri kohore e fundme , 1,2,...,tX t n , algoritmi i njehsimit të

dimensionit thyesor konsiston si më poshtë.

35

1. Për një numër të plotë k të fiksuar, formojmë k nënzgjedhje nëpërmjet barazimeve

( )

2, , , ..., k

m m m k m k n mm k

k

X X X X X

, për 1, 2, ..., m k (1.62a)

2. Gjatësia e çdo kurbe (serie) të krijuar përcaktohet nëpërmjet barazimit

11

1 1( )

n m

k

m m ik m i ki

nL k X X

n mkk

k

, (1.62b)

ku 1n

n mk

k

është një faktor normalizimi, ndërsa m dhe k janë dy numra të plotë

që tregojnë kohën fillestare dhe intervalin e kohës (përkatësisht).

3. Atëherë, gjatësia e kurbës tX përcaktohet si mesatare e gjatësive ( )mL k për

1, 2, ..., m k ,

1

1( ) ( )

k

m

m

L k L kk

(1.62c)

Në qoftë se tX është një kurbë thyesore, siç ndodh kur kemi memorie të gjatë, atëherë

ka vend relacioni

1H

HL k c k (1.62d)

ku koeficienti Hc nuk varet nga k.

4. Në se ndërtojmë një grafik të L k kundrejt k në një shkallë dy herë logaritmike

(pra duke logaritmuar anë për anë) vërehet një vijë e drejtë, pra është e mundshme të

marrim një vlerësim për H me metodën e katrorëve më të vegjël duke kryer regresin

linear të pikave log{ ( )}, log( )L k k për max1, 2, ..., k k . Me metodën e katrorëve

më të vegjël gjejmë vlerësimin e koeficientit të pjerrësisë, ̂ dhe, nga barazimet

ˆ D̂ , 1D H , dhe 0.5H d , marrim vlerësimin

ˆ ˆ 0.5d (1.62e)

Përcaktimi i pikës tavan, maxk , varet nga zgjedhja përkatëse, por ajo duhet të jetë e

tillë që të sigurojë që pikat e përdorura tek regresi logaritmik të ndodhen afër një

drejtëze pra, regresi të jetë i vlefshëm.

Në figurën 1.10 paraqitet regresi i metodë Higuchi për dy seritë e përdorura në figurat

1.8 dhe 1.9. Evidentimi i memories së gjatë është korrekt për të dy llojet e proceseve.

Vlerësimet e kësaj metode duken më afër vlerave reale se sa ato të metodave të

mësipërme (për rastin konkret të simuluar).

36

Figura 0.10 Grafiku i metodës Higuchi për dy seritë kohore të simuluara.

Vlerësuesi i ndërtuar me metodën e Higuchit ka dy të meta kryesore. Nga njëra anë

nuk kemi ndonjë rezultat asimptotik për shpërndarjen apo vetitë e tij; dhe nga ana

tjetër ky vlerësues mund të përdoret vetëm me seritë mjaft të gjata, për shkak të

zhvendosjes që ai shfaq për zgjedhje me vëllim të vogël.

1.5.2 Vlerësues paramertikë ose gjysmë parametrikë.

Në këtë paragraf, vlerën e vërtetë (të panjohur) të parametrit do ta shënojmë me

indeksin zero, p.sh. 0d , 2

0 , 0 etj., ndërsa vlerësimin e tij me ̂ ( kapuç sipër), p.sh. d̂ ,2̂ ,̂ , etj. Gjithashtu me ( )f shënojmë densitetin spektral, ndërsa me ( )jI

shënohet vlerësuesi i tij nëpërmjet periodogramës së zgjedhjes, sipas barazimit

1

0

( 1)

1 1ˆ ˆ( ) cos( )

2

n

j k j

k n

I k

(1.63)

37

i njehsuar për frekuencat Furie (ose harmonike) 2

per 1,...,2

j

j nj

n

(këtu

simboli qëndron për pjesën e plotë). Është me interes të theksojmë se metodat

parametrike vlerësojnë të gjitha parametrat e modelit, 2

1 1, ,..., , , ,...,p qd

njëkohësisht, ndërsa metodat gjysmë parametrike zakonisht përdoren gjatë vlerësimit

të sjelljes së termave te largët duke vlerësuar fillimisht parametrin e memories d dhe

më tej parametrat e tjerë. Të dyja rastet janë me interes dhe secila mund të

konsiderohet më e mirë se tjetra në varësi nga situata

Më tej shohim.disa nga vlerësuesit më të përdorur në literaturë.

(i) Vlerësuesi i përpiktë i përgjasisë maksimale.

Në se t në barazimin (1.50) është një proces i Gausit, atëherë është e mundshme që

të shkruhet shpërndarja e përbashkët e vektorit të rastit 1( ,..., ,..., )n t nX X XX .

Le të bëjmë shënimet e mëposhtme.

ˆn Z X 1 , ku ̂ është një vlerësues konvergjent i mesatares së procesit (p.sh.

mesatarja e zgjedhjes, X ) dhe 1 është një vektor shtyllë me njësha me dimension n .

2

1 1( , , ,..., , ,..., )p qd , vektorin e parametrave të panjohur me dimension

2m p q .

( )nT , matricën katrore të rendit n me element të përgjithshëm

( )

; , ( ) ( ; ) i j k

n j kT f e d

(kemi theksuar varësinë nga parametri , iështë numri

kompleks imagjinar). Kjo matricë është matricë me diagonale konstante.

Atëherë funksioni i përgjasisë i zgjedhjes nX (pra, densitetit të shpërndarjes së

vektorit nX ) mund të shkruhet (shih Beran, 1994, paragrafi 5.3).

1/2 1

/2

1 1( ; ) ( ) exp ' ( )

(2 ) 2n n nn

h T T

X Z Z (1.64)

Nga funksioni logaritëm i përgjasisë, i cili shkruhet në formën

11 1( ; ) log ( ; ) log 2 log ( ) ' ( )

2 2 2n n n n

nL h T T X X Z Z ne mund të marrim

derivatet e pjesshme në lidhje me parametrat që duam të vlerësojmë dhe duke

zgjidhur sistemin përkatës marrim vlerësuesin e përgjasisë maksimale ˆPM (si dhe

vlerësimin përkatës pas zëvendësimit). Normaliteti i ˆPM është studiuar nga Dahlhaus

(1988, 1989).

Kur funksioni i densitetit spektral i procesit plotëson disa kushte të rregullsisëjanë të

vërteta pohimet e mëposhtme (për hollësi shih Dahlhaus 1989)

Pohim 1.8. (Dahlhaus 1989, teorema 3.1)

Supozojmë se ̂ është një vlerësues konvergjent i 0 . Atëherë kemi

38

0ˆ p

PM (1.65)

Pohim 1.9. (Dahlhaus 1989, teorema 3.2)

Supozojmë se ̂ është një vlerësues i qëndrueshëm i rendit 01 ( )

2n

për 0 . Këtu,

00 ( ) 1 është një numër, i tillë që funksioni i densitetit spektral i procesit

supozohet se plotëson kushtin 0( )

0( , ) ( ), kur 0f x O x x

. Atëherë

1

0ˆ( ) (0, )d

PM nn N T (1.66)

Lieberman etj. (2012) zgjeroi rezultatet e Dahlhaus (1989) për një zonë më të gjerë të

stationaritetit si dhe për rastin e pakthyeshmërisë të modelit.

Edhe pse në këtë rast, vlerësuesi ˆPM është asimptotikisht normal, gjetja e tij ka

vështirësinë e kryerjes së një numri të madh njehsimesh, që nevojiten për

maksimizimin e një sistemi prej m ekuacionesh si dhe për gjetjen e matricës së

anasjelltë të matricës ( )nT , e cila është rendit n.

Për të ulur rendin e veprimeve, Haslett dhe Raftery (1989) propozuan një përafrim të

funksionit të përgjasisë maksimale. Metoda e tyre gjen përdorim tek paketa

statistikore fracdiff në programin R.

(ii) Vlerësimi i Whittle.

Fox dhe Taqqu (1986) kanë prezantuar një metodë të përgjasisë maksimale duke u

mbështetur në këndvështrimin spektral të serisë, ku vlerësuesi i përgjasisë gjendet

duke maksimizuar funksionin 1

2

1exp

2

nT

n

Z Z. Ata shtjelluan një sugjerim të

Whittle (1951), i cili propozoi përdorimin e një përafrimi të matricës së anasjelltë të

matricës Toeplitz ( )nT , nëpërmjet matricës ( )nA me element të përgjithshëm si më

poshtë

1

; , 2

1( ) exp ( ) ( , )

(2 )n j kA i j k x f x dx

(1.67)

Vlerësuesi i gjetur nga Fox dhe Taqqu (1986) zgjeron rezultatet e Hannan (1973), i

cili aplikoi metodën e Whittle për vlerësimin e parametrave të modeleve ARMA.

Rezultati i gjetur nga Fox dhe Taqqu (1986), i përgjithësuar më vonë nga Dahlhaus

(1989) për rastin e vlerësuesit të përpiktë të përgjasisë maksimale, është baza e një

prej metodave më të përdorura për vlerësimin e parametrave të memories së gjatë

(edhe të shkurtër, në se janë prezent të dy tipet e kujtesës) në seritë kohore të Gausit.

Në se përdoret përafrimi i Whittle për funksionin logaritëm të përgjasisë, atëherë

vlerësuesi ˆn i vektorit të parametrave

2

1 1( , , ,..., , ,..., )p qd vlerësohet duke

minimizuar në varësi të vlerësimin e dispersionit të procesit zhurmë e bardhë në

shqyrtim sipas barazimit:

1

22

1

( )1( )

2 ( , )

n

j

j j

I

f

(1.68)

39

ku ( , )jf tregon densitetin spektral të procesit ARFIMA (që po vlerësohet) në

frekuencat Furie ωj, dhe ( )jI periodogramën e vrojtuar të njehsuar sipas barazimit

(1.63). Fox dhe Taqqu (1986) treguan pohimet e mëposhtme.

Pohim 1.10. Në se ( , )jf plotëson disa kushte rregullsie, atëherë me probabilitet 1,

kemi

0ˆlim n

n

dhe

2 2

0ˆlim n

n

(Fox dhe Taqqu , 1986, teorema 1)

Pohim 1.11. Në se plotësohen disa kushte në lidhje me derivatet e densitetit spektral

(për hollësi shih Fox dhe Taqqu, 1986), atëherë vektori i rastit 0ˆnn

konvergjon sipas shpërndarjes tek një vektor rasti Normal me pritje matematike zero

dhe me matricë të autokovariancave 1

04 ( ) W me element të përgjithshëm të

matricës W :

21( ) ( , ) ( , )jk

j k

w f x f x dx

(Fox dhe Taqqu, 1986, teoremë 2).

Le të jetë tX një proces ARFIMA(0,d,0) me 0.5 0.5d . Atëherë, vlerësuesi i

Whittle për parametrin d mund të gjendet duke minimizuar funksionin ( )

2

2, 1

1( ) ( )( )

(2 ) ( ; )

i j k xn

n j k

j k

ed X X X X dx

n f x d

ku ( ; )f x d është densiteti spektral

i një procesi FI(d), që jepet nga barazimi (1.38). Për më tepër, sipas pohimit 1.11,

vlerësuesi i mësipërm i d-së është asimptotikisht normal me dispersion

22

4 60.6079

(log(2 2cos )) d

(1.69)

Vlerësuesi i përpiktë i përgjasisë maksimale ka të metën e kryerjes së një numri të

madh njehsimesh, si dhe mund të shkaktojë probleme në njehsime, kur llogariten

autokovariancat, që nevojiten për të vlerësuar funksionin e përgjasisë (Sowell,1992).

Këto vështirësi nuk janë të pranishme kur përdorim vlerësuesin e Whittle, i cili ka dhe

avantazhin tjetër se nuk kërkon vlerësimin e pritjes matematike të serisë (e cila në

përgjithësi nuk njihet). Për më tepër, kur plotësohen disa kushte (të rregullsisë) si tek

Dahlhaus (1989), të vërteta për rastin e proceseve ARFIMA(p,d,q), mund të

vërtetohet që vlerësuesi i Whittle ka shpërndarje asimptotike të njëjtë me vlerësuesin e

përpiktë të përgjasisë maksimale, dhe konvergjon në vlerat e vërteta të parametrave në

rendin e zakonshëm 1

2n

. Përfundimisht, për proceset e Gausit, vlerësuesi i Whittle

është asimptotikisht efikas në kuptimin e mosbarazimit Rao-Kramer (shih Naqo, 2005

për këtë kuptim të efikasitetit).

E meta e këtij vlerësuesi është se është e nevojshme të supozohet se forma

parametrike e densitetit spektral të njihet paraprakisht, domethënë të specifikohen

rendet e polinomeve të modelit ARMA, p dhe q, dhe të vendoset në se kemi sjellje të

memories së gjatë. Në se funksioni i densitetit spektral i specifikuar nuk është i saktë

(siç ndodh shpesh herë) vlerësimet e parametrave mund të jenë tepër të zhvendosur.

Nga ana tjetër, mund të jetë tepër e vështirë për te evidentuar memorien e gjatë së

bashku dhe me rendin e saktë të p dhe q të pjesës së memories së shkurtër. Zakonisht

40

memoria e shkurtër është e dominuar dhe e konfuzuar nga sjellja e kufizave të largëta

të serisë.

(iii) Vlerësimi lokal i Whittle.

Vlerësimi lokal i Whittle është një vlerësues gjysmë parametrik i parametrit të

memorjes d përpunuar nga Robinson (1995b), i cili ka ndjekur një sugjerim të

Kunsch (1987). Njihet edhe si vlerësuesi gjysmë parametrik gausian. Robinson

(1995b) demonstroi se vlerësuesi lokal i Whittle është asimptotikisht më efikas se

vlerësuesi GPH (do e shohim më poshtë) për rastin e serisë stacionar. Megjthëatë, ky

vlerësues nuk përcaktohet në formë të saktë dhe për pasojë nevojiten metoda të

optomizimit numerik për njehsimin e vlerës së tij (pra të gjetjes së vlerësimit).

Vlerësimi lokal i Whittle mund të gjendet duke minimizuar funksionin objektiv (e

qëllimit) të mëposhtëm:

1 1

1 1( ) log ( ) log

m md d

j j j

j j

R d I dm m

(1.70)

ku ( )jI është peridograma e serisë në frekuencat Furie, j për 1,2,...,j m , dhe m

është një numër i plotë më i vogël se 2

n. Në përgjithësi m zgjidhet i tillë që të

plotësojë kushtin

1lim 0n

m

m n

(1.71)

Për të marrë një vlerësues konvergjent dhe me shpërndarje afërsisht normale, është e

nevojshme të bëhen disa supozime lidhur me funksionin e densitetit spektral si dhe

disa supozime për momentet e inovacioneve t (shih Robinson, 1995b, kushtet e

konvergjencës A1-A4 dhe kushtet e normalitetit A1’-A4’). Gjithashtu supozohet se

lim dhe lim 0n n

mm

n , pra kur n shkon në infinit edhe m shkon në infinit por në

rend më të vogël se n. Atëherë, Robinson (1995b) tregoi se janë të vërteta pohimet e

mëposhtme.

Pohim 1.12. Në se plotësohen kushtet e konvergjencës, atëherë kemi

0ˆ kur pd d n (Robinson, 1995b, Teoerema 1)

Pohim 1.13. Në se plotësohen kushtet e normalitetit, atëherë kemi

1

20

1ˆ 0, kur n4

dm d d N

(Robinson, 1995b, Teoerema 2)

Shënojmë se shkalla e konvergjencës së vlerësuesit varet nga 1

2m , ku m është numri i

frekuencave që përdor vlerësuesi. Pra, vlerësuesi lokal i Whittle është më pak efikas

se vlerësuesit parametrik (siç është dhe vlerësuesi i Whittle) për rastin kur specifikimi

i modelit ku ata mbështeten është i saktë. Por, ky vlerësues është më efikas se

vlerësuesi GPH , të cilin po shohim më poshtë.

41

(iv) Vlerësimi Geweke dhe Porter-Hudak (GPH).

Vlerësuesi GPH është prezantuar nga Geweke dhe Porter-Hudak (1983) dhe është një

nga metodat më të njohura për vlerësimin në mënyrë gjysmë parametrike të parametrit

thyesor d të sjelljes së varësisë me amplitudë të gjatë.

Kjo metodë u prezantua fillimisht nga Geweke dhe Porter-Hudak (1983) për rastin e

procesit të Gaussit, kur 1

,02

d

dhe me tej u zgjerua nga Robinson (1995a).

Supozojmë se procesi , 1,2,...,tX t n është një model ARFIMA(p,d,q) siç është

përcaktuar nga ekuacioni (1.50). Atëherë, mund të tregohet se densiteti spektral i këtij

modeli, i dhënë sipas barazimit (1.51), është proporcional me 24sin2

d

afër

origjinës. Kështu që mund të shkruajmë

2( ) 4sin2

d

ff c

kur 0 (1.72)

Një vlerësues i natyrshëm i densitetit spektral është peiodograma e zgjedhjes, që jepet

nga barazimi (1.63) i rishkrojtur si më poshtë

1

0

1

1ˆ ˆ( ) 2 cos( )

2

n

j k j

k

I k

,

për frekuencat harmonike 2

j

j

n

, 1,2,...,

2

nj

(kujtojmë se me simbolin a

shënojmë pjesën e plotë të numrit a). Meqenëse periodograma ( )jI është një

vlerësues asimptotikisht i pazhvendosur i densitetit spektral, pra

0

lim ( )j jE I f

, atëherë është e mundur të vlerësohet parametri d duke

përdorur metodën e katrorëve më të vegjël për ekuacionin e regresit:

2 2log log 0 2 log 4sin , 1,2,...,2 2

j

j j

nI f d u j m

(1.73)

ku , 1,2,...,2

j

nu j m

janë kufizat e gabimit që supozohen me shpërndarje të

njëjtë dhe të pavarura (për më shumë hollësi shih Geweke dhe Porter-Hudak, 1983).

Robinson (1995b) tregoi se në vend të vlerave 2log 4sin2

j

mund të marrim

vlerat 2log j sepse rezultatet janë ekuivalente në rendin e parë.

Relacioni (1.60) është një lidhje asmptotike e vlefshme vetëm në një fqinjësi të

origjinës; pra po ta përdorim këtë lidhje për të gjitha koordinatat e periodogramës

, vlerësimi i gjetur për parametrin d do jetë mjaft i zhvendosur.

Geweke dhe Porter-Hudak (1983) propozuan që për vlerësimin të merren në

konsideratë vetëm m n frekuencat e para, përderisa d është parametri i memories

42

i cili ndikon më së shumti në frekuencat e ulëta (afër zeros). Ndërsa frekuencat e larta

ndikohen nga pjesa e kujtesës së shkurtër e modelit ARMA.

Kur plotësohen disa kushte të rregullsisë, Robinson (1995a) dhe Hurvich etj. (1998)

kanë treguar që vlerësuesi GPH është me shpërndarje asimptotike normale, duke

dhënë rezultatin e mëposhtëm:

4

0ˆ ~ 0,

24m d d N

(1.74)

Këtu, m është numri i frekuencave të përdorura, i cili duhet të plotësojë kushtet 4

5m o n

dhe 2log ( )n o m . Zakonisht përdoret m e tillë që

m dhe 0m

n , kur n (1.75)

E meta më e rëndësishme e këtij vlerësuesi është fakti që ky vlerësues ka një devijim

standard të lartë. Për më tepër, Agaikloglou etj. (1993) ka treguar se kur koeficientet e

modelit ARMA janë afër kufijve të jostacionaritetit, vlerësuesi GPH është i

zhvendosur.

(v) Vlerësimi i periodogramës së lëmuar (SP, Smoothed Periodogram).

Hassler (1993) dhe Reisin (1994), në mënyrë të pavarur nga njëri tjetri, propozuan një

vlerësues të parametrit d bazuar në procedurën e regresit të logaritmit të

periodogramës së lëmuar. Vlerësuesi i periodogramës së lëmuar i densitetit spektral

jepet sipas barazimit

0 0

1

1ˆ ˆ( ) 2 cos( )

2

M

SP j k k j

k

I k

(1.76)

Bashkësia 0 1{ , ,..., }M është bashkësia e peshave dhe quhet dritarja e vonesës,

ndërsa kufiri i sipërm M n , i shumës (1.76) quhet pika e cungimit e dritares. Mund

të përdoren variante të ndryshme të peshave të dritares së vonesës, por që të gjitha

vendosin pesha më të vogla për distancat më të mëdha. Vlerësuesi SP përftohet duke

zëvendësuar peridogramën me periodogramën e lëmuar tek ekuacioni i regresit (1.73).

Reisen (1994) propozoi përdorimin e dritares Parzen që jepet nga barazimet

2 3

3

1 6 6 , për 0,1,2,...,2

2 1 , për , 1,...,2 2

k

k k Mk

M M

k M Mk M

M

(1.77)

(është supozuar që M të merret numër çift; për 2

Mk të dyja formulat japin të

njëjtën vlerë).

Figura 1.11 tregon grafikun e dritares Parzen për 100M .

43

Figura 0.9 Peshat e dritares Parzen tek periodograma e lëmuar.

Për gjetjen e vlerësimit SP ne duhet të përcaktojmë dy parametra, pikën e cungimit m

të frekuencave tek regresi (1.73) dhe pikën e cungimit M të dritares së vonesës tek

vlerësimi i periodogramës së lëmuar (1.76). Në praktikë zakonisht m zgjidhet e njëjtë

si tek vlerësuesi GPH, ndërsa M zgjidhet e tillë që 1 1

20 2

M

n (për disa këshilla

praktike shih Hannan, 1973, paragrafi V.7).

Reisen (1994) tregoi se i kur m dhe M plotësojnë kushtet (1.75), vlerësuesi SP ka

shpërndarje asimptotike normale me pritje matematike vlerën e vërtetë d0 dhe

dispersion më të vogël se vlerësuesi GPH.

Përparësia e metodave gjysmë parametrike, si vlerësimi lokal i Whittle dhe GPH,

është fakti se nuk nevojitet specifikimi i plotë i modelit, sepse informacioni i vetëm që

na nevojitet është sjellja e densitetit spektral afër origjinës. Për më tepër, parametri i

memories së gjatë mund të vlerësohet i ndarë (më vete) nga pjesa e memories së

shkurtër.

Një avantazh interesant i vlerësuesve GPH dhe SP kundrejt vlerësuesit Whittle është

se të dy vlerësuesit, mund të zbatohen lehtë pa u shqetësuar (interesuar) për pjesën

ARMA të procesit.

44

Kapitulli 2

2 METODA BOOTSTRAP TEK MODELET E SERIVE

KOHORE

Metoda bootstrap është prezantuar nga Efron (1979) si metodë rizgjedhje për të

vlerësuar gabimin standard të një vlerësuesi parametrash. Shumë shpejt, ato u

përhapën me shpejtësi të madhe për përmirësimin e vlerësimit të zhvendosjes dhe të

dispersionit së vlerësuesve të ndryshëm. Metodat bootstrap mund të zbatohen në

procedura të ndryshme statistikore (Për monografi rreth metodave bootstrap shih p.sh.

Efron dhe Tibshirani, 1993, Davison dhe Hinkley, 1997, Chernick, 2008). Disa nga

përdorimet e tyre mund të përmendim.

• Vlerësimi bootstrap i gabimit standard të një vlerësuesi.

• Vlerësimi bootstrap i zhvendosjes të një vlerësuesi.

• Teknikat bootstrap për realizimin e verifikimit të hipotezave.

Mekanizmi i thjeshtë i zbatimit të tyre për vlerësimin e statistikave sado të

ndërlikuara, si dhe rritja e sigurisë së vlerësimeve të përftuara për shumicën e rasteve,

ishin arsyet që ndikuan në përdorimin e gjerë të tyre. Krahas kësaj zhvillimi i

shkencave kompjuterike bëri të mundur lejimin e përdorimit te tyre pa marrë parasysh

nevojën e numrit relativisht të madh të njehsimeve që kërkojnë metodat bootstrap.

Por, shpejt u vu re se metodat e dizenjuara me rizgjedhje (me kthim) të të dhënave të

përftuara nga ndryshore rasti me shpërndarje të njëjtë dhe të pavarura, nuk funksionin

kur ato zbatoheshin në të dhëna të korreluara dhe në veçanti në seritë kohore. Dhjetë

vjet më pas, Kunsch (1989) prezantoi metodën bootstrap me blloqe, e cila është një

përshtatje e metodës bootstrap të Efronit për rastin e proceseve stacionare, pra dhe për

seritë kohore stacionare. Tashmë dihet se përdorimi efikas i metodave bootstrap në

seritë kohore ndikon në përmirësimin e performancës së vlerësuesve, të probabilitetit

të mbulimit gjatë vlerësimeve intervalore ose të gabimit të refuzimit gjatë kontrollin e

hipotezave.

Megjithatë, për seritë kohore me memorie të gjatë shumë nga këto metoda japin

vlerësime që janë jo konvergjent ose që konvergjojnë në një shkallë të ulët kur vëllimi

i zgjedhjes rritet pambarimisht (Lahiri,1993). Kjo nënkupton mosmundësinë e

ndërtimit të intervaleve të besimit apo të kontrollit të hipotezave ose një performancë

të dobët të metodave bootstrap për zgjedhje me vëllim të fundmë. Përpjekje janë bërë

për të përshtatur metodat bootstrap gjysmë parametrike për rastin e proceseve me

memorie të gjatë si dhe për të zbatuar metodën botstrap me blloqe joparametrike në

fushën spektrale të një procesi.

Konceptet e përgjithshëm të metodologjisë bootstrap jepen në paragrafin 2.1. Më tej,

në paragrafet 2.2-2.4 ne do shohim metoda bootstrap që përdoren për seritë kohore.

Disa përdorime të metodologjisë bootstrap përshkruhen tek paragrafët 2.5 dhe 2.6.

2.1 Metodologjia bootstrap

Metodat bootstrap, të propozuara nga Efron (1979), u përdorën fillimisht për të

vlerësuar me një mënyrë më të thjeshtë shpërndarjen e një statistike për të cilën

45

shprehjet eksplicite (e sakta) ose nuk ekzistojnë ose janë tepër të vështira për të

vepruar me to. Metodologjia bootstrap mbështet në dy “parime”:

- Konsiderimi i zgjedhjes si të ishte popullsia.

- Parimi i lidhjes në prizë (i fishës; plug-in).

Le të jetë F shpërndarja e një popullsie. Supozojmë se jemi të interesuar për një

parametër , i cili vlerësohet me anë të vlerësuesit 1ˆ ( ,..., )nT X X , ku

është një zgjedhje me vëllim n dhe ( )T është një statistikë. Shënojmë me 0 vlerën e

vërtetë të parametrit . Supozojmë se është vrojtuar një zgjedhje 1 2( , ,..., )nx x xx

dhe kemi gjetur vlerësimin 1 2ˆ ( , , ..., )nT x x x x . Metoda bootstrap i zakonshëm

rizgjedh me kthim nga bashkësia 1, ..., nx x me probabilitet të njëtrajtshëm, n

elementë duke përftuar zgjedhjen bootstrap 1, ,, ..., b n bx x x , për 1, 2, ..., b Q , ku

Q është numri i zgjedhjeve bootstrap. Duke zbatuar parimin e “lidhjes në prizë”,

mund të njehsojmë vlerësimet bootstrap 1, ,ˆ ( , ..., )b b n bT x x për 1, 2, ..., b Q ,

duke përdorur të njëjtën statistikë. Atëherë bashkësia ˆ : 1, ..., b b Q , të cilën e

konsiderojmë si bashkësinë e vlerave të një ndryshore rasti (bootstrap) ̂ , mund të

përdoret si vlerësues i shpërndarjes së vlerësuesit në shqyrtim ̂ . Më tej ne mund të

nxjerrim përfundime statistikore për vlerësuesin ̂ . Duke u mbështetur tek metoda

Monte Carlo, vlerësimi (pikësor) bootstrap i parametrit θ është

1

1ˆ ˆQ

b

bQ

x (2.1)

Gjithashtu, vlerësimi bootstrap i zhvendosjes së vlerësuesit ̂ është

ˆˆ ˆ ˆ x x (2.2)

Ndërsa për gabimin standard përdorim vlerësimin

* 2

1

1 ˆ ˆˆ ( )1

Q

b

bQ

x x (2.3)

(përsëri kemi përdorur parimin e vendosjes në prizë).

Gjatë procedurës bootstrap ne bëjmë dy përafrime (pra kemi dy burime të gabimit).

1. Përafrimi i shpërndarjes së panjohur të zgjedhjes me anë të shpërndarjes empirike.

2. Përafrimi i vlerësimeve bootstrap me anë të përsëritjeve Monte Carlo.

Në përafrimin e parë, ne përdorim funksionin e shpërndarjes empirike të zgjedhjes, që

jepet sipas barazimit ] , ]

1

1ˆ ( ) ( )n

y i

i

F y I xn

, për të vlerësuar funksionin e

shpërndarjes të panjohur F. Këtu me AI është shënuar funksioni indikator (tregues) i

bashkësisë A

1, ( )

0, A

x AI x

x A

(2.4)

1( ,..., )nX X

46

Kujtojmë që shpërndarja empirike është vlerësuesi më i “mirë” për rastin kur nuk

kemi njohuri për funksionin e shpërndarjes të ndryshores. Gjithashtu, kur vëllimi i

zgjedhjes rritet pambarimisht, funksioni empirik i shpërndarjes konvergjon

uniformisht, pothuaj me siguri, tek shpërndarja e vërtetë F (për më tepër shih Naqo,

2005).

Përafrimi i dytë ndodh kur ne përdorim parimin e vendosjes në prizë, pra kur

përafrojmë shpërndarjen e statistikës 0̂ me shpërndarjen e statistikës ˆ ˆ x .

Praktikisht, bashkësia e vlerësimeve bootstrap, ˆ : 1, ..., b b Q , interpretohet si një

zgjedhje nga shpërndarja e panjohur e vlerësuesit ̂ . Ky përafrim përmirësohet me

rritjen e numrit të përsëritjeve bootstrap.

Mund të dallojmë dy tipe teknikash të procedurës bootstrap.

• Bootstrapi parametrik: Kjo procedurë përdoret në se ne dimë që shpërndarja F bën

pjesë në një familje parametrike shpërndarjesh. Atëherë ne vlerësojmë parametrat e

shpërndarjes duke u mbështetur tek zgjedhja e vrojtuar. Më tej kryejmë rizgjedhjet

bootstrap nga shpërndarja F duke përdorur parametrat e vlerësuar.

• Bootstrapi jo parametrik: Përdoret kur ne nuk e njohim formën e shpërndarjes F (siç

ndodh shpesh në zbatime praktike). Në këtë rast ne përdorim vlerësimin e

shpërndarjes empirike të zgjedhjes së vrojtuar.

Singh (1981) dhe Babu dhe Singh (1983) kanë treguar se kur zgjedhja është i.i.d.

metodat bootstrap japin vlerësime më të mira se vlerësimet klasike asimptotike, për

raste kur vëllimi i zgjedhjes është relativisht i vogël ose kur shpërndarja e ndryshores

së rastit është jo simetrike.

Për rastin kur të dhënat nuk janë i.i.d. procedura e zakonshme bootstrap nuk është e

vlefshme, pasi ajo nuk ruan strukturën e varësisë së të dhënave fillestare. Singh

(1981) vërejti se bootstrapi origjinal i Efronit nuk është i vlefshëm kur vrojtimet nuk

janë i.i.d. Pra për rastin e të dhënave të tipit seri kohore duhen gjetur të tjera teknika

për metodën bootstrap, të tilla që të struktura e varësisë midis të dhënave të

riprodhohet në mënyrë sa më të saktë, pra të tilla që seritë bootstrap të përftuara të

imitojnë sa më besnikërisht serinë e vrojtuar.

Metodat bootstrap për seritë kohore mund të kategorizohen në dy grupe:

a) Metoda që përdoren në këndvështrimin kohor të serisë, dhe

b) Metoda që përdoren në këndvështrimin spektral të saj.

Shumica e metodave bootstrap për seritë kohore zbatohen në fushën kohore të serisë,

pra në të dhënat e vrojtuara. Në paragrafin pasardhës do shohim disa prej tyre:

2.2 Metodat bootstrap me blloqe

Rizgjedhja me blloqe ose bootstrap me blloqe (BB, Block Bootstrap) është një

përgjithësim i skemës së rizgjedhjes për të dhëna njëjtë dhe të pavarura (i.i.d.). Seria

kohore ndahet në blloqe vrojtimesh të njëpasnjëshme, ku mënyra e formimit të

blloqeve do të diskutohet më tej. Seria e rizgjedhur ose e ashtuquajtura pseudoseria,

ose seria bootstrap, merret duke kryer rizgjedhje me kthim nga bashkësia e blloqeve të

formuar. Duke konsideruar vrojtimet e serisë që kanë një distancë midis tyre si të

pavarura, blloqet e përcaktuara më sipër mund të konsiderohen si vrojtime të pavarura

(ashtu si tek rasti i vrojtimeve i.i.d.). Por, duke i trajtuar blloqet si një vrojtim të vetëm

47

ruhet struktura e varësisë brenda secilit bllok. Kjo metodë mund të përdoret për seritë

kohore stacionare dhe është veçanërisht e përshtatshme kur seria shfaq një sjellje të

varësisë së shkurtër ose kur struktura e varësisë është jolineare dhe përafrimi linear

është shumë i "varfër" (jo i mirë).

Teknikat e përdorura gjatë metodave bootstrap me blloqe zakonisht janë teknika jo

parametrike dhe konsistojnë si më poshtë.

Seria e vrojtuar 1 2, , ..., nX X X (e cila konsiderohet si një zgjedhje e procesit

stacionar që duam të studiojmë) ndahet në k blloqe të përbërë nga vlera të

njëpasnjëshme, që shënohen 1 2, , ..., kB B B ku k është një numër i plotë pozitiv.

Kryejmë 1k rizgjedhje me kthim të blloqeve nga bashkësia 1 2, , ..., kB B B dhe

përftojmë blloqet 11 2, , ..., kB B B . Atëherë, seria bootstrap (quhet dhe pseudoseria)

përftohet duke vendosur njëri pas tjetrit blloqet e përftuara. Numri i plotë pozitiv 1k

është i tillë që numri i vrojtimeve të serisë bootstrap të jetë i njëjtë (ose afërsisht) me

n, sa numri i serisë së vrojtuar.

Performanca e metodave bootstrap me blloqe kushtëzohet nga dy faktorë: mënyra e

ndarjes së serisë në blloqe dhe gjatësia e blloqeve.

Bootstrapi me blloqe karakterizohet nga dy tipare kryesore: zgjedhja e gjatësisë së

bllokut (i njëjtë për çdo bllok ose jo) dhe nga fakti në se blloqet janë prerës (të

mbivendosur) apo të ndarë. Procedurat e propozuara kanë emërtime të ndryshme sipas

teknikave të ndryshme që përdoren për përcaktimin e blloqeve. Megjithatë ato kanë si

emërues të përbashkët faktin se ato rizgjedhin blloqe të vrojtimeve të njëpasnjëshme

(konsekutive). Disa nga teknikat për realizimin e procedurës BB janë përshkruar në

paragrafet në vazhdim, 2.2.1-2.2.3.

2.2.1 Bootstrap me blloqe të mbivendosur

Shpesh kjo metodë quhet dhe metoda bootstrap me blloqe të lëvizshme (MBB,

Moving Block Bootstrap).

Supozojmë se kemi zgjedhjen e vrojtuar 1 2, , ..., nX X X , nga një seri stacionare.

Kunsch (1989) shtjelloi një metodë bootstrap me blloqe të mbivendosur. Seria e

dhënë ndahet në 1n l blloqe me gjatësi të njëjtë të përbërë nga l vrojtime të

njëpasnjëshme. Pra kemi blloqet 1 1, ..., , ..., j n lB B B ku 1 ( 1), , ..., j j j j lB X X X

për 1, 2, ..., 1j n l . Numri l quhet gjatësi e bllokut. Më tej kryejmë rizgjedhje

me kthim nga bashkësia 1 2 1, , ..., n lB B B dhe vendosim njëri pas tjetrit blloqet e

zgjedhura deri sa të marrim serinë bootstrap me gjatësi n (blloku i fundit i rizgjedhur

mund të cungohet).

Kjo metodë karakterizohet nga fakti që 1l vlerat e para dhe 1l vlerat e fundit të

serisë kanë probabilitet më të vogël për të qenë në serinë bootstrap (zgjidhen më

rrallë) se sa vlerat e tjera të serisë (p.sh. vrojtimet 1X dhe nX ndodhen vetëm në një

bllok). Ky fenomen quhet efekti skajor i kësaj metode. Një alternativë për të mos

ndodhur kështu do ishte procedura e propozuar nga Carlstein (1986) për të marrë

blloqe të ndara (të pa mbivendosur) siç përshkruhet më poshtë (paragrafi 2.2.2). Një

teknikë tjetër për të eliminuar këtë “defekt” është propozuar nga Politis dhe Romano

(1992). Ata propozuan që seria të përsëritë vetveten duke krijuar një seri të formës

48

(mod ) 1 2 1 2, , ..., , , , ...t t n nY X X X X X X , për 1, 2, ...t . Më tej përdoret metoda

MBB. Kjo teknikë njihet si bootstrapi rrethor (me shkurtimin CB, Circular

Bootstrap).

2.2.2 Bootstrap me blloqe të ndarë

Ideja kryesore e kësaj teknike është dhënë nga Carlstein (1986), i cili propozoi një

teknikë për vlerësimin e dispersionit të një vlerësuesi duke përdorur blloqe të ndara.

Në këtë metodë, seria ndahet në k blloqe 1, ..., , ..., j kB B B , me gjatësi të njëjtë l , të

tillë që kl n , ku ( 1) 1 ( 1) 2 ( 1), , ..., j l j l j l j lB X X X , për 1, 2, ..., j k . Më tej,

procedura vazhdon si në rastin e përgjithshëm. Për këtë metodë përdoret shkurtimi

NBB (Non-overlapping Block Bootstrap).

Figura 2.1 Formimi i blloqeve tek metodat MBB dhe NBB.

Figura 2.1 tregon një ilustrim të mënyrës së formimit të blloqeve tek metodat MBB

dhe NBB.

2.2.3 Bootstrap stacionar

Dy teknikat e mësipërme mund të prodhojnë seri bootstrap që nuk janë stacionare dhe

kërkojnë ndonjë rregullim gjatë bashkimit të blloqeve. Për më tepër vlerësimi

bootstrap për mesataren është i zhvendosur, d.m.th. *( \ )tE X X X .

Politis dhe Romano (1994) përshkruan procedurën e bootstrapit stacionar (SB,

Stationary Bootstrap), e cila ka marrë emërtimin stacionar në saj të faktit që kjo

procedurë garanton që seria e rizgjedhur bootstrap të jetë stacionare kur seria fillestare

është e tillë. Teknika e bootstrapit stacionar mund të përshkruhet si më poshtë.

49

Për të ndërtuar bllokun jB , zgjidhet rastësisht një vlerë

jX dhe merren jl vlerat e

njëpasnjëshme 1 1, , ..., jj j j lX X X , ku

jl zgjidhet rastësisht nga një ndryshore rasti

me shpërndarje gjeometrike me parametër të fiksuar p. Për të zgjedhur çdo vlerë të

serisë së vrojtuar me të njëjtin probabilitet konsiderohet që të dhënat të jenë në një

rreth, pra njëra pas tjetrës (si te teknika CB). Më tej procedura vazhdon si në rastet e

mëparshme.

Metoda SB përdor blloqe me fillim të rastit dhe me gjatësi të rastit. Pra gjatësia

mesatare (e pritshme) e blloqeve të përdorur është 1

lp

. Tregohet se kjo procedurë

garanton që seria bootstrap të jetë gjithmonë stacionare. Gjithashtu në këtë rast

vlerësuesi i mesatares së zgjedhjes është i pazhvendosur. Por, nga ana tjetër, për shkak

të gjatësive të rastit, pritet që të rritet dispersioni i vlerësuesve.

Supozojmë se interesohemi për vlerësimin e një parametri të popullsisë që prodhon

serinë e vrojtuar. Gjatësia l e bllokut luan rol të rëndësishëm në shpërndarjen e

vlerësimit bootstrap të parmetrit , pra dhe në shpërndarjen e vlerësuesit të përftuar

(e quajmë vlerësuesi bootstrap). Një gjatësi e madhe e blloqeve zvogëlon dispersionn

e vlerësuesit por rrit zhvendosjen, sepse kemi më pak blloqe në dispozicion për

rizgjedhje. Pra, zgjedhja e gjatësisë së bllokut është një marrëveshje (kompromis;

trade-off) ndërmjet dispersionit dhe zhvendosjes. Për të imituar sa më besnikërisht

varësinë e serisë tentojmë të marrim blloqe sa më të gjatë; por për të pasur sa më

shumë efektin e rizgjedhjes bootstrap tentohet për gjatësi të vogla të blloqeve.

Struktura e varësisë luan gjithashtu një rol të rëndësishëm dhe ne presim që me rritjen

e varësisë të përdorim gjatësi të bllokut sa më të madh, për të ruajtur sa më shumë

varësinë brenda tyre.

Kunsch (1989), ashtu sikurse dhe Carlstein (1986), thekson se përcaktimi i gjatësisë l

është një çështje tepër delikate dhe tregon rëndësinë e faktit që kjo gjatësi duhet të

shkojë në infinit kur n shkon në infinit, por në një shkallë më të ngadaltë, d.m.th.

lim dhe lim 0n n

ll

n (2.5)

Zakonisht preferohet një gjatësi e bllokut e cila minimizon gabimin katror mesatar,

MSE (Mean Squared Error), që përcaktohet nga barazimi

22 2

0 0ˆ ˆ ˆ ˆ ˆ ˆ( ) ( ) ( ) ( ) ( ) [ ( )]

MSE E D E D (2.6)

ku me ( ) shënojmë zhvendosjen e vlerësuesit në shqyrtim. MSE merr në

konsideratë minimizimin e njëkohshëm të dispersionit dhe zhvendosjes së vlerësuesit.

Por jo gjithmonë është e mundur gjetja e vlerës optimale të gjatësisë së bllokut, që

minimizon MSE e vlerësuesit në shqyrtim. Përcaktimi i gjatësisë së bllokut është një

problem shumë delikat, që varet nga rasti në rast.

Nga simulime të kryera rezulton se përcaktimi i gjatësisë së pritshme p tek metoda

SB është më pak problematik se sa përcaktimi i gjatësisë së fiksuar l në metodat MBB

dhe NBB, në kuptimin që një vlerë e “gabuar” e saj ka më pak efekt në rezultatet

përfundimtare. Një arsye për këtë është se gjatësia e pritshme e bllokut tek metoda SB

mund të konsiderohet si një mesatare e gjatësive të ndryshme (por të fiksuara) të

metodave të tjera. Pra dhe vlerësimi i gjetur me metodën SB mund të shikohet si një

mesatare e disa vlerësimeve të mara nga ndonjë metodë me gjatësi të fiksuar të

50

bllokut, por e zbatuar për një varg vlerash të gjatësisë së bllokut l (shih Politis dhe

Romano, 1994).

Për një krahasim teorik të metodave bootstrap me blloqe të mësipërme shih Lahiri

(1999)

2.3 Bootstrap parametrik

Në se paraprakisht dimë që seria është gjeneruar nga një proces linear, p.sh. nga një

proces ARMA(p,q), atëherë është e mundur që të vlerësojmë mbetjet e këtij procesi

në bazë të serisë së vrojtuar. Në se supozojmë se modeli është specifikuar në mënyrë

të saktë dhe kur vlerësimet e parametrave të modelit janë konvergjentë dhe të pa

zhvendosur, atëherë mbetjet e përftuara janë me shpërndarje (ose shpërndarje

asimptotiket) të njëjtë dhe të pavarur. Ky rast është mjedisi perfekt për të zbatuar

bootstrapin standard. Atëherë seritë bootstrap mund të përftohen në mënyrë rekursive

duke përdorur mbetjet e rizgjedhura bootstrap. Megjithëse procedura duket e thjeshtë

janë treguar mënyra të ndryshme për realizimin e saj dhe duhet treguar kujdes i

veçantë kur seria nuk është stacionare. Një sugjerim (shih Lahiri, 1992) është që

mbetjet e vlerësuar të qendërzohen para se të rizgjidhen (pra në vend të mbetjeve ̂ të

marrim mbetjet ˆj j ). Një procedurë e përgjithshme e bootstrapit parametrik

jepet si më poshtë.

Hapi 1. Nga të dhënat që kemi vrojtuar, zgjedhim një model sa më të përshtatshëm

(p.sh. një model AR(p) ) duke përdorur kriteret e përcaktimit të modelit më të mirë

(p.sh. AIC, BIC, etj.)

Hapi 2. Bazuar në modelin e përcaktuar, vlerësojmë parametrat e modelit (p.sh. me

metodën e përgjasisë maksimale) si dhe mbetjet e tij.

Hapi 3. Kryejmë rizgjedhje bootstrap nga bashkësia e mbetjeve të vlerësuara.

Hapi 4. Përdorim vlerësimet e hapit 2 për të ndërtuar (përftuar) pseudoserinë

bootstrap e kërkuar.

Edhe pse procedura e mësipërme duket mjaft e thjeshtë, në fakt ka mjaft mënyra për

të realizuar atë. Në mënyrë të veçantë duhet pasur kujdes në rastin kur të dhënat janë

jostacionare. Ne do japim disa detaje të bootstrapit parametrik për rastin e proceseve

autoregresive, AR(p), dhe autoregresive me mesatare rrëshqitëse, ARMA(p,q). Por,

megjithatë, është e mundur të përdoret bootstrapi parametrik edhe për proceset

autoregresive të paqëndrueshëm (unstable) dhe shpërthyese (explosive) (për më

shumë detaje shih Lahiri, 1992).

Ka shumë punime për bootstrapin e bazuar tek modeli (pra bootstrapin parametrik).

Një punim interesant është ai i Bose (1988). Ai tregoi se shpërndarja bootsrtap e

parametrave të autoregresit është më efikase se sa përafrimi normal. Datta dhe Sriram

(1997) përafruan shpërndarjen e vlerësuesit të katrorëvë më të vegjël të parametrit 1

të një procesi AR(1), përafrim i cili është i vlefshëm për çdo vlerë të 1 edhe pse

procedurat bootstrap zakonisht dështojnë për proceset jo stacionare, d.m.th. kur

1 1 . Për rastin e modeleve AR(p), bootstrapi parametrik konsiston si më poshtë.

Kujtojmë se modeli AR(p) ka formën e përgjithshme sipas barazimit

( ) t tB X (2.7)

51

ku ( )B është përcaktuar nga polinomomi i rendit p, 2

1 2( ) 1 ... p

pz z z z ,

dhe t është një varg ndryshoresh rasti të pavarura me shpërndarje të njëjtë me

mesatare zero dhe dispersion 2 . Pa humbur përgjithësimin mund të supozojmë që

0 dhe 2 1 . Me këto supozime inovacionet e serisë mund të vlerësohen

nëpërmjet barazimeve rekursive:

1 1ˆˆ ...t t t p t pX X X , për 1, 2, ..., t p p n (2.8)

ku ˆ , 1, 2,...,i i p janë vlerësues të qëndrueshëm të parametrave , 1, 2,...,i i p

(p.sh. vlerësuesit e katrorëve më të vegjël). Lahiri (1992) sugjeri që të qëndërzohen

këto mbetje: ˆt t për 1, 2, ...,t p p n , ku

1

1ˆ

n

t

t pn p

. Duke

supozuar se mbetjet e qendërzuara janë i.i.d., është e mundur që të gjenerojmë mbetjet

(inovacionet) bootstrap t duke rizgjedhur njëtrajtësisht, me kthim, nga bashkësia

1...,p n . Atëherë, seria bootstrap përftohet nga barazimet rekursive:

1 1ˆ ˆ...t t p t p tX X X

, për 1,...,t p n (2.9)

Shpesh është e zakonshme të kemi një reduktim të barazimit të mësipërm për p vlerat

e para (p.sh. 1 1X , vetë vlera e parë bootstrap e zgjedhur, 2 1 1 2ˆX X ,...,

1 1 1 1ˆ ˆ...p p pX X X

). Në se mbetjet janë (ose supozohet se janë) me shpërndarje

normale, atëherë është e mundur të gjenerojmë inovacionet bootstrap nga një

shpërndarje normale me pritje zero dhe dispersion sa vlerësimi i dispersionit së

inovacioneve të vlerësuara 2 ˆˆtD .

Performanca e bootstrapit për proceset ARMA, që shprehen nga barazimi

t tB X B , është shumë i ngjashëm si bootstrapi i një procesi thjesht

autoregresiv. Formula që jep mbetjet në këtë rast jepet nga barazimi

1 1

1 0

ˆˆpt

t j k t j k

j k

X

(2.8a)

ku 0ˆ 1 , ˆ , për 1,...,k k p dhe ˆ , për 1,...,j j q janë vlerësime konvergjentë të

parametrave përkatës të autoregresit dhe të mesatares së lëvizshme, ndërsa

keoficientët j janë të tillë që 1

0

ˆj j

j

z z

(pra është e anasjella e B , ose

seria polinomiale e zbërthimit të 1

B).

Kjo metodë është e përshtatshme për një klasë të ngushtë procesesh, pra për proceset

lineare, dhe jep rezultate shumë të mira kur modeli është përcaktuar në mënyrë të

drejtë, përndryshe seria e përftuar nga rizgjedhjet bootstrap nuk ka të njëjta veti si

seria e vrojtuar (Davison dhe Hinkley, 1997).

52

2.4 Bootstrap sitë

Një kompromis midis bootstrapit parametrik dhe atij jo parametrik është përdorimi i

të ashtuquajturit bootstrapi sitë (sieve bootstrap). Edhe metoda bootstrap sitë simulon

nga modele të përcaktuar (që shpesh janë modele AR(p) ), por ne realisht nuk i

“besojmë” atyre. Ne thjesht kërkojmë prej modeleve të përdorur që të jenë relativisht

të thjeshtë për tu vlerësuar dhe për tu simuluar dhe njëkohësisht të jenë mjaftueshëm

fleksibël në mënyrë që të mbulojnë një gamë të gjerë proceses duke përdorur një

“sitë” vlerash të parametrave të tyre.

Çdo proces linear i kthyeshëm ka një paraqitje të formës AR(∞).

Kreiss (1992) shfrytëzoi këtë veti për të ndërtuar një metodë bootstrap që rizgjedh

(kopjon) proceset lineare të trajtës

0

t X j t j

j

X

(2.10)

ku 0 1 , t Z , vargu i koeficientave 0{ }j j

zvogëlohet në mënyrë eksponenciale

dhe { }t t Z është një varg ndryshoresh rasti i.i.d. me pritje matematike zero.

Ideja e kësaj metode është përafrimi i procesit të vrojtuar tX me një proces AR me

parametër të fundmë dhe, mbështetur në këtë model, zbatimi i një procedure të

ngjashme me bootstrapin parametrik si tek paragrafi i mësipërm 2.3. Në një punim të

mëvonshëm, Buhlmann (1997) shkroi se, duke e parë përafrimin autoregresiv si një

sitë për procesin me parametër të pafundëm (prej nga kemi vrojtuar tX ), procedura

bootstrap e sugjeruar nga Kreiss është e çliruar nga përcaktimi apriori i modelit dhe

mund të shihet si një procedurë joparametrike. Bootstrapi sitë është teknikisht i

thjeshtë dhe jep zgjedhje bootstrap që janë asimptotikisht stacionare dhe pa efekte në

strukturën e varësisë. Buhlmann (1997) tregoi se dispersioni i pritjes matematike

paraqet një shkallë të lartë konvergjence në rastin kur varësia ndërmjet vrojtimeve të

largëta zvogëlohet mjaftueshëm shpejt. Kjo metodë zbatohet për proceset lineare të

formës (2.10) dhe konsiston si më poshtë.

Le të jetë { , }tX t Z një proces stacionar me vlera reale me pritje matematike

( ) t XE X , i cili mund të paraqitet në trajtën AR(∞) sipas barazimit

0

( )j t j X t

j

X

(2.11)

me 0 1 dhe 2

0

j

j

(konvergjente).

Kur kemi vrojtuar zgjedhjen 1 2, , ..., nX X X algoritmi ndjek hapat e mëposhtme.

Hapi 1. Nga zgjedhja e vrojtuar 1{ , ..., }nX X përcaktojmë rendin ( )p p n të një

procesi AR(p), që modelon të dhënat (p.sh. duke përdorur kriterin e informacionit

BIC, AIC ose AICC, shih Brockwell dhe Davis, 1991, paragrafi 9.3). Rendi ( )p p n

duhet të plotësojë kushtet

( )p n dhe ( )

0p n

n , kur n (2.12)

53

Hapi 2. Vlerësojmë koeficientët 1 2ˆ ˆ ˆ, , ..., p , që i korespondojnë modelit AR(p)

të përzgjedhur. Zakonisht (por jo detyrimisht) ky vlerësim kryhet me anë të

ekuacioneve Yule–Walker (shih Brockwell dhe Davis, 1991). Theksojmë se në këtë

hap ne duhet që së pari të qendërzojmë serinë duke zbritur mesataren e zgjedhjes X .

Hapi 3. Njehsojmë mbetjet e modelit:

0

ˆˆ ( )p

t j t j

j

X X

, ku 0ˆ 1 , për { 1,,..., }t p n (2.13)

Hapi 4. Njehsojmë mbetjet e qendërzuara ˆ ˆt t t , ku

1

1ˆ ˆ

n

t t

t pn p

.

Hapi 5. Njehsojmë funksionin e shpërndarjes empirike të mbetjeve të qendërzuara

[ , ]

1

1ˆ ( ) ( )t

n

t p

F x I xn p

(2.14)

ku ( )AI është funksioni tregues i bashkësisë A.

Hapi 6. Kryejmë rizgjedhje bootstrap me kthim duke iu përshtatur funksionit të

shpërndarjes së mbetjeve (2.14) dhe përftojmë zgjedhjen bootstrap *{ , 1,2,..., }t t n

me vrojtime i.i.d. nga shpërndarja empirike F̂ .

Hapi 7. Përcaktojmë serinë bootstrap, *

tX , nëpërmjet formulave rekursive

* * *

1

ˆ ( )p

t j t j t

j

X X X

(2.15)

për 1,...,t p n , ndërsa p vlerat e para i marrim të barabarta me zero (ose me

mesataren X në se nuk do kishim qendërzuar serinë paraprakisht).

Hapi 8. Njehsojmë statistikën bootstrap * *ˆ ( )b tT X për rizgjedhjen bootstrap.

Hapi 9. Përsëritim hapat 5−8, Q herë dhe, më tej kryejmë vlerësimet bootstrap.të

dëshiruara.

Në rastin kur qëllimi i studimit statistikor është parashikimi i serisë kohore, rizgjedhja

bootstrap e mësipërme nuk është efektive, sepse ajo nuk e përsërit (kopjon)

shpërndarjen me kusht të parashikimit T hX kur njohim të dhënat. Por, në se fiksojmë

p vrojtimet e fundit, ne mund të përftojmë rizgjedhje të vlerave të ardhshme bootstrap *

T hX me kusht kur jepen vlerat

* *

1 1,...,T p T p T TX X X X (Cao etj., 1997). Atëherë,

në rastin e parashikimit hapi 8 do kryhet si më poshtë.

Hapi 8.a. Duke pasur serinë bootstrap *

tX , rivlerësojmë koeficientët* * *

1 2( , ,..., )T

p

si tek hapi 2.

Hapi 8.b. Njehsojmë vrojtimet e ardhshme bootstrap sipas formulave rekursive

* * * *

1

ˆ ( )p

T h j T h j t

j

X X X X

, ku 0h dhe *

t tX X , për t T .

54

Hapi 8.c. Së fundmi, shpërndarja bootstrap *

*

T hXF

e *

T hX do të përdoret për të

përafruar shpërndarjen e panjohur *

*

T hXF

të T hX me kusht kur jepen vrojtimet

1{ ,..., }nX X . Intervali i besimit për parashikimin T hX me nivel besimi 1 është

* *( / 2), (1 / 2)Q Q , ku *( )Q tregon kuantilet e shpërndarjes bootstrap *

*

T hXF

(shih intervalin PB në paragrafin pasardhës).

Për disa veti asimptotike të bootstrapit sitë shih Bickel dhe Buhlmann (1999).

2.5 Vlerësimi intervalor bootstrap

Vlerësimi intervalor i parametrave është një nga analizat statistikore më të përdorura

në statistikë. Ai kombinon vlerësimin pikësor dhe kontrollin e hipotezave në një

analizë statistikore të vetme (të përbashkët) duke na dhënë një vlerësim të

“besueshëm” të pasigurisë së vlerësimeve (pikësore) të parametrave. Shpesh

vlerësimet intervalore mbështeten në shpërndarjet asimptotike të ndonjë vlerësuesi

(mbështetës) ose tek përafrimi normal i tyre (nga teorema qendrore limite). Por, kur

vlerësuesi i përdorur konvergjon “ngadalë” tek shpërndarja asimptotike e tij ose kur

përafrimi normal nuk është i vlefshëm, vlerësimet e përftuara nuk janë të vlefshëm.

Ky është pikërisht rasti i “ideal” për të përdorur metodat bootstrap.

Gjetja e intervaleve të besimit për parametrin e memories të gjatë është një problem i

rëndësishëm ende i hapur në analizën e serive me memorie të gjatë. Në literaturë

përdorimi i metodave bootstrap për vlerësimin parametrit të memories së gjatë po

bëhet gjithnjë dhe më i pranishëm. Mund të përmendim Hesterberg (1997),

Kapetanios dhe Psaradakis (2006), Silva etj. (2006), Arteche dhe Orbe (2009), Kim

dhe Nordman (2011), Kapetanios dhe Papailias (2011), Arteche dhe Orbe (2014).

Një metodë e përgjithshme për ndërtimin e një interval besimi të parametrit θ për të

cilin interesohemi është gjetja e një funksioni të një vlerësuesi dhe të parametrit,

funksioni i shpërndarjes të të cilit është i njohur dhe i pavarur nga vlera e vërtetë e

parametrit. Një funksion i tillë quhet shpesh funksion mbështetës (pivot). Atëherë,

duke përdorur kuantilet e kësaj shpërndarje të njohur ne gjejmë intervalin e besimit

për parametrin e interesuar. Megjithatë, në mungesë të njohjes së shpërndarjes

( ; )XF x , nga e cila janë vrojtuar të dhënat e zgjedhjes, shpesh nuk është e lehtë

përcaktimi i funksionit mbështetës. Megjithatë shumë vlerësuesa janë me shpërndarje

asimptoikisht normale rreth pritjes matematike të tyre. Kështu që intuitivisht,

statistika ˆW zgjidhet si funksion mbështetës. Problemi është se në praktikë

ndodh që shpërndarja e statistikës W është e panjohur. Parimi i bootstrapit na lejon që

ne të vlerësojmë shpërndarjen e statistikës W me anë të shpërndarjes bootstrap të

statistikës * ˆ ˆW x (siç arsyetuam tek paragrafi 2.1) shpërndarjen e së cilës e

vlerësojmë me metodën Monte Carlo.

Në vazhdim ne po paraqitim shkurtimisht intervalet e besimit bootstrap që përdoren

më shpesh. Le të supozojmë se duke kryer procedurën bootstrap me një nga teknikat

bootstrap të përshkruar në paragrafet 2.2-2.5, ne kemi gjetur vlerësimin e zgjedhjes ̂x

si dhe vlerësimet bootstrap ˆ : 1, ..., b b Q , të cilat i renditim duke marrë

bashkësinë e vlerësimeve të renditura, që i shënojmë (1) (2) ( )ˆ ˆ ˆ... Q . Me

55

simbolin ˆ , për (0,1) shënojmë 100α kuantilin (percentile) e shpërndarjes

bootstrap ˆ : 1, ..., b b Q , të cilin e njehsojmë sipas barazimit ( )ˆ ˆ

Q me

supozimin se αQ është numër i plotë (në se jo, mund të përdorim një përafrim).

Atëherë intervalet e besimit bootstrap me nivel 1 jepen si më poshtë.

a) Intervali bootstrap i zakonshëm.

Inervali bootstrap i zakonshëm, që quhet shpesh dhe intervali bazë bootstrap (Basic

Bootstrap), është një nga intervalet e parë të përdorur nga metodat bootstrap. Duke

interpretuar shpërndarjen e statistikës bootstrap * ˆ ˆW x si vlerësues për

shpërndarjen e ˆX , ne mund të gjejmë një interval simetrik besimi me nivel α për

parametrin θ nëpërmjet barazimit të mëposhtëm.

1 /2 /2ˆ ˆ ˆ ˆ(1 ) 2 , 2

BB x x (2.16)

Davidson dhe Hinkley (1997) treguan se ky interval besimi jep vlerësime të mira për

mesoren (Davidson dhe Hinkley, 1997, tabela 2.4)

b) Intervali bootstrap i përqindjes.

Intervali bootstrap i përqindjes (PB, Percentile Bootstrap) është shumë i përdorshëm

në literaturë sepse ai është i thjeshtë në ndërtim dhe mund të përdoret për çdo

statistikë, si dhe jep vlerësime të vlefshme kur shpërndarja bootstrap është simetrike.

Për të ndërtuar intervalin e besimit të përqindjes ne thjesht marrim kuantitet e vlerave

bootstrap të statistikës për të cilën interesohemi.

/2 1 /2ˆ ˆ(1 ) ,

PB (2.17)

Ky interval është shumë i thjeshtë në ndërtim dhe ka vetinë (e preferuar) për të qenë

invariant gjatë transformimeve monotonë të parametrit. Kjo nënkupton që nëse ( )g

është një funksion monoton atëherë intervali i besimit për parametrin ( )g është

transformimi g i intervalit të besimit i parametrit θ, pikërisht intervali

/2 1 /2ˆ ˆ( ), ( )

g g . Megjithatë, Efron dhe Tibshirani (1993) kanë treguar se gabimi i

mbulimit të intervalit PB mund të jetë esencial (thelbësor) në se shpërndarja e ̂ nuk

është afërsisht simetrike.

c) Intervali bootsrap-t.

Ky interval njihet dhe si intervali i percentilit-t, ose intervali bootstrap i studentizuar.

Për të përdorur këtë interval duhet që krahas vlerësimit ˆb të gjejmë dhe një vlerësim

të gabimit standard të tij ˆˆ

b

, për çdo seri bootstrap. Kjo është e mundur në se ne

njohim një vlerësues 2

ˆˆ

të dispersionit të vlerësuesit ̂ ose duke përdorur përsëri

metodën bootstrap për të gjetur një vlerësim bootstrap të dispersionit të ˆb (teknika

në këtë rast quhet dhe bootstrap i dyfishtë (double bootstrap), shih Davidson dhe

Hinkley, 1997, kapitulli 2 dhe 3, ose Efron dhe Tibshirani, 1993, paragrafi 12.5).

56

Në se shënojmë ˆˆ ˆˆ ˆ( ) /

bb bt

x për çdo përsëritje bootstrap ne përftojmë statistikat

e renditura (1) (2) ( )ˆ ˆ ˆ... Qt t t . Atëherë, intervali bootsrap-t jepet nga barazimi

ˆ ˆ1 /2 /2ˆ ˆˆ ˆˆ ˆ(1 ) ,

Bt t tx x (2.18)

ku ˆˆ

është një vlerësim i gabimit standard për vlerësuesin ̂ (ndoshta i gjetur dhe

me teknikën bootstrap), ndërsa t̂ tregon α-percentilin e shpërndarjes

(1) (2) ( )ˆ ˆ ˆ... Qt t t .

Ky interval mund të japë rezultate të “këqija” në qoftë se vlerësimet e gabimit

standard janë të pasakta. Gjithashtu ky interval nuk është invariant kundrejt

transformimeve monotonë.

d) Intervali bootstrap i korrigjuar për zhvendosjen (BC, Bias Corrected)

Ky interval është propozuar nga Efron (Efron, 1982, paragraf 10.7) me qëllim

përmirësimin e performancës së intervalit PB për rastet e shpërndarjeve jo simetrike.

Në literaturë përdoret shënimi intervali BC. Ndërtimi i intervalit BC realizohet si më

poshtë.

Përcaktojmë numrin e vlerësimeve bootstrap ˆ{ , 1, 2, ..., }b b Q , që janë më të

vegjël ose baras me vlerësimin e zgjedhjes, ̂X . Në se shënojmë këtë numër me p,

njehsojmë koeficientin e korrigjimit të zhvendosjes sipas barazimit 1( / )b p Q , ku

është funksioni i shpërndarjes së ndryshores normale standarde. Atëherë, intervali

BC është i formës

ˆ ˆˆ ˆ(1 ) ,

m dBC (2.19)

ku /2ˆ (2 )m b z dhe 1 /2

ˆ (2 )d b z (2.20)

Intervali PB është rast i veçantë i intervalit BC, që merret kur 0b .

e) Intervali bootstrap i korrigjuar për zhvendosjen dhe i përshpejtuar (BCa, Bias

Corrected and accelerated).

Problemet e shfaqura me intervalet BC ndikuan që Efron (1987) të zhvillonte metodën

e intervaleve BCa. Ideja e këtij intervali është që të merret parasysh jo vetëm mungesa

e simetrisë së shpërndarjes (siç ndodh me intervalet BC) por gjithashtu edhe fakti që

forma ose asimetria mund të ndryshojë për vlera të ndryshme të parametrit θ.

Ndërtimi i intervaleve BCa kërkon vlerësimin e dy parametrave:

-të parametrit të korrigjimit të zhvendosjes b, i cili vlerësohet njësoj si tek intervalet

BC, dhe

-të parametrit të përshpejtimit, që shpesh shënohet me a.

Njehsimi i parametrit të përshpejtimit është më i ndërlikuar dhe varet në se simulimet

bootstrap janë joparametrike apo parametrike dhe, për rastin e fundit, në se ekzistojnë

apo jo parametra pengues. Më poshtë po japim një vlerësim me metodën jackknife të

parametrit të përshpejtimit, a, që përdoret shpesh në simulimet joparametrike (për më

tepër shih Efron dhe Tibshirani, 1993 ose Davison dhe Hinkley, 1997).

57

Për çdo 1,2,...,i n largojmë nga zgjedhja 1 2( , ,..., )nx x xx vrojtimin ix (e i-të

) dhe

me vrojtimet e ngelura gjejmë vlerësimin 1 1 1ˆ ( ,..., , ,..., )i

i i nT x x x x x Shënojme

1

1 ˆn

i

Jack

in

x mesataren e vlerësimeve të mësipërme. Atëherë parametri i

përshpejtimit vlerësohet nëpërmjepet barazimit

3

1

3/22

1

ˆ

ˆ6

ni

jack

i

ni

jack

i

a

x

x

(2.21)

Atëherë, me shënimet e mësipërme intervali BCa jepet sipas barazimit

ˆ ˆ(1 ) , m d

BCa (2.22)

ku /2

/21 ( )m

b zb

a b z

dhe 1 /2

1 /21 ( )d

b zb

a b z

(2.23)

Intervali BC është rast i veçantë i intervalit BCa që merret për 0a .

Përzgjedhja e metodës më të përshtatshme për gjetjen e intervalit të besimit bootstrap

varet nga parametri që duam të vlerësojmë si dhe nga metoda bootstrap e përdorur. Në

praktikë, më të preferuar janë intervalet PB dhe BCa; i pari për thjeshtësinë në

përdorim dhe i dyti për rendin e ulët të probabilitetit të gabimit të mbulimit (i cili

është i rendit 1( )O n ).

Për udhëzime praktike rreth përzgjedhjes së llojit të intervalit shih Carpenter dhe

Bithell (2000), figura 4 dhe figura 5.

Në kapitullin 3 ne do përdorim pikërisht intervalet PB dhe BCa për të bërë një

krahasim të performancave të metodave bootstrap me blloqe në vlerësimin intervalor

të parametrit të memories së gjatë.

2.6 Metoda bootstrap dhe kontrolli i hipotezave

Metodat boostrap janë bërë gjithnjë e më të përdorshme për kryerjen e verifikimit të

hipotezave statistikore. Hall dhe Horowitz (1996) treguan se përdorimi i metodave

bootstrap për kontrollin e hipotezave shpesh shfaqin gabime më të vogla se sa

metodat që mbështeten tek analiza asimptotike. Ky fakt është më i dukshëm për

zgjedhje me vëllim relativisht të vogël. Ekzistojnë disa mënyra të ndryshme të

kryerjes së procedurave bootstrap të kontrollit të hipotezave, por më shpesh përdoret

metoda e probabilitetit kritik (p-vlerës) bootstrap.

Supozojmë se për të kryer një verifikim të hipotezave ne përdorim statistikën ̂ dhe

një zonë kritike të njëanshme të djathtë (pra hipoteza bazë refuzohet për vlera të

mëdha të statistikës së përdorur). Në se kemi zgjedhjen 1 2, , ..., nx x x , atëherë, duke

përdorur një nga teknikat bootstrap, gjejmë pseudoserinë bootstrap * * *

1 2, , ..., nx x x dhe,

duke përdorur të njëjtën statistikë, gjejmë vlerësimin bootstrap përkatës. Përsërisim

procedurën e rizgjedhjeve bootstrap Q herë dhe përftojmë vlerat bootstrap,

58

* * *

1 2ˆ ˆ ˆ, , ..., Q , të statistikës së përdorur. Atëherë, probabiliteti kritik bootstrap

vlerësohet nga barazimi

* *

ˆ] , [1

1( )

Q

j

j

p IQ

(2.24)

ku ( )AI është funksioni tregues i bashkësisë A.

Për të përftuar kritere të vlefshme kërkohet që rizgjedhjet bootstrap të kryhen nën

supozimin kur hipoteza bazë është e vërtetë. Gjithashtu sugjerohet që statistika e

përdorur të jetë një funksion mbështetës (pivot).

Për konkretizim le të shohim një shembull të thjeshtë.

Shembull 2.1

Supozojmë se duam të kontrollojmë hipotezat për barazimin e dy pritjeve matematike

të dy ndryshoreve të rastit X dhe Y sipas formulimit

0 1: kundrejt :X Y X YH H (2.25)

Atëherë, procedura bootstrap për vlerësimin e probabilitetit kritik, konsiston si më

poshtë:

Hapi 1. Kryejmë një zgjedhje rasti 1 2( , , ..., )nx x xx nga ndryshorja X dhe një

zgjedhje 1 2( , , ..., )my y yy nga ndryshorja Y.

Hapi 2. Njehsojmë statistikën t̂ x y , ku x dhe y janë mesataret e zgjedhjes

përkatëse.

Hapi 3. Bashkojmë dy zgjedhjet e mësipërme në një zgjedhje të vetme me vëllim

n m ; le ta shënojmë 1 2( , , ..., )n mz z z z ku renditja nuk ka rëndësi.

Hapi 4. Kryejmë n rizgjedhje me kthim nga zgjedhja e bashkuar z duke përftuar një

zgjedhje me vëllim n, të cilën e konsiderojmë si zgjedhje bootstrap nga zgjedhja x.

Pra përftojmë zgjedhjen bootstrap * * *

1 2( , , ..., )nx x x*x (ku mund të ketë vlera nga

zgjedhja x ose y) Njehsojmë mesataren e kësaj zgjedhje * *

1

1 n

j

j

x xn

. Njësoj

veprojmë për të përftuar zgjedhjen bootstrap y* dhe mesataren përkatëse bootstrap

* *

1

1 m

j

j

y ym

. Së fundmi njehsojmë statistikën bootstrap

* * *t x y (2.26)

Hapi 5. Përsëritim hapin 4, Q herë dhe përftojmë Q vlera * * *

1 2, , ..., Qt t t të statistikës

së kontrollit.

Hapi 6. Atëherë, p-vlera e kërkuar merret (vlerësohet) nga barazimi

*

ˆ] , [1

1* ( )

Q

jtj

p I tQ

(2.27)

Pra p-vlera bootstrap është raporti i numrit të herëve kur statistika bootstrap është më

e madhe se statistika e zgjedhjes mbi përsëritjet totale bootstrap.

59

Hapi 7. Së fundmi, për një nivel të përcaktuar , hipoteza zero refuzohet në se

*p , ose pranohet në se *p .

Për më tepër informacion rreth përdorimit të metodave bootstrap në verifikimin e

hipotezave mund të referohemi tek Davison dhe Hinkley (1997), Efron dhe Tibshirani

(1993), Hall dhe Wilson (1991), MacKinnon, (2007), Davidson dhe MacKinnon

(2000), ndër të tjerë.

Kapitulli 3

3 METODA BOOTSTRAP ME BLLOQE ME CIKLE

Lahiri (1993) ka treguar se, në përgjithësi, procedura bootstrap me blloqe të lëvizshme

(MBB), e përdorur në rastin kur seria kohore përmban memorie të gjatë, nuk jep një

përafrim të vlefshëm të shpërndarjes së mesatares së normalizuar të serisë. Një nga

arsyet që kjo ndodh është fakti se bashkimi i blloqeve të pavarura gjatë formimit të

rizgjedhjes bootstrap e prish (shkatërron) varësinë e fortë përgjatë vrojtimeve.

Megjithëse blloqet e të dhënave janë të varura në serinë kohore origjinale, ato janë të

pavarura në serinë bootstrap. Kjo shkakton zhvendosje të vlerësimeve bootstrap, e cila

mund të jetë e madhe në se varësia e të dhënave është e fortë.

Metoda të ndryshme bootstrap me blloqe janë përdorur për vlerësimin e parametrave

të modeleve ARFIMA(p,d,q) (shiko për shembull Hesterberg, 1997, Carlstein etj.,

1998, Franco dhe Reisen 2004, Silva etj. 2006, Arteche dhe Orbe, 2009, 2014).

Carlstein etj. (1998) kreu rizgjedhje të blloqeve bootstrap duke synuar që çdo bllok i

rizgjedhur të ndiqej nga ndonjë bllok bootstrap me kufiza të para (fillimit) sa më të

“ngjashme” për të qenë tek blloku ndjekës i tij në serinë e vrojtuar. Nëpërmjet kësaj

procedure bootstrap, të quajtur bootstrap me blloqe të përshtatshëm (M-BB, Matched-

Block Bootstrap), synohet që struktura e varësisë së serisë së vrojtuar të ngjasojë (të

shkojë, të përshtatet) sa të mundet me strukturën e varësisë së serisë bootstrap të

përftuar. Hesterberg (1997) e përdori këtë metodë bootstrap për proceset me memorie

të gjatë dhe shqyrtoi rregulla të bashkimit të blloqeve, që mbështeten në kombinime

lineare të vrojtimeve në secilin bllok.

Në këtë kapitull ne prezantojmë një teknikë bootstrap me blloqe për të kryer

rizgjedhje të serive kohore stacionare. Blloku është i përbërë nga cikle. Një cikël

quhet një çift vargjesh vrojtimesh që formohet nga vrojtime të njëpasnjëshme më të

mëdha se mesatarja të ndjekur nga vrojtime të njëpasnjëshme më të vegjël se

mesatarja (ose anasjellas).

Paragrafi 3.1 përshkruan metodën bootstrap me blloqe të përbërë nga cikle dhe tregon

disa veti të saj. Disa konkluzione teorike dhe empirike rreth gjatësisë së ciklit jepen në

paragrafin 3.2. Paragrafi 3.3 përshkruan një eksperiment Monte Carlo për të verifikuar

empirikisht vlefshmërinë e teknikës bootstrap me blloqe me cikle për replikimin e

proceseve me memorie të gjatë.

60

3.1 Përcaktimi i blloqeve të përbërë nga cikle

Në këtë material, ne do konsiderojmë metodën bootstrap me blloqe të formuar nga një

ose më shumë cikle të njëpasnjëshme. Ideja e formimit të blloqeve me cikle është

marrë nga Park dhe Willemain (1999) dhe është përdorur për herë të parë (në dijeninë

tonë) për të imituar seritë me memorie të gjatë nga Ekonomi dhe Butka (2011).

Vlefshmëria e metodës bootstrap me blloqe të përbërë nga cikle në rastin e serive

stacionare me memorie të shkurtër është treguar nga Ekonomi dhe Butka (2014).

Le të jetë { , 1, 2, ..., }tX t n një seri kohore e vrojtuar, e gjeneruar nga një proces

stacionar. Përcaktojmë ciklin si një çift vargjesh të alternuar me vrojtime të

njëpasnjëshme “të larta” dhe “të ulëta” (sipër dhe poshtë), të cilat formohen kur

vrojtimet kapërcejnë (kalojnë) mesataren e zgjedhjes. Pa humbur përgjithësimin,

mund të supozojmë se mesatarja e zgjedhjes është zero dhe se kufiza e parë e serisë

është pozitive. Atëherë, cikli formohet nga një varg kufizash pozitivë i ndjekur nga

vargu pasardhës i kufizave negative.

Le t’i shënojmë me 1 2, , ..., kC C C ciklet e formuara dhe me 1 2, , ..., kn n n numrin e

kufizave për çdo cikël, përkatësisht. Pra kemi supozuar se janë formuar k cikle. Është

e qartë se 1

k

i

i

n n

. Atëherë, ne mund të shkruajmë ciklet në mënyrë më të shtjelluar

sipas barazimeve

11 1 2{ , , ..., }nC X X X , për ciklin e parë,

1 2 1 1 2 1 1 2 1... 1 ... 2 ...{ , , ..., }i i i ii n n n n n n n n n nC X X X , për 2,3, ..., 1i k , dhe

1 2 1 1 2 1... 1 ... 2{ , , ..., }k kk n n n n n n nC X X X për ciklin e fundit.

Kemi 1 2 ... 0

in n nX dhe 1 2 ... 1 0

in n nX për çdo 1, 2, ..., 1i k . Pra kur ne

vrojtojmë një kufizë negative të ndjekur nga një kufizë pozitive, atëherë kemi gjetur

mbarimin e një cikli dhe fillimin e ciklit pasardhës.

Pas përcaktimit të ciklit, ne përcaktojmë bllokun si tërësinë e një numri të fiksuar dhe

të paracaktuar ciklesh të njëpasnjëshme. Më tej, në mënyrë të njëjtë si tek metodat e

tjera bootstrap me blloqe (paragrafi 2.2), ne kryejmë rizgjedhje me kthim nga

bashkësia e blloqeve të krijuar dhe duke vendosur ato njëri pas tjetrit, përftojmë serinë

bootstrap. Blloqet mund të merren të ndarë, si tek metoda NBB, ose të lëvizshëm, si

tek metoda MBB. Gjithashtu, ne mund të konsiderojmë serinë të vendosur në një rreth

para përcaktimit të blloqeve dhe të kryejmë një teknikë të ngjashme si tek bootstrapi

rrethor, CB (shih paragrafi 2.2.1). Në të gjitha rastet cikli trajtohet si një vrojtim i

pandashëm.

Më tej, kur i referohemi kësaj metode, do të përdorim inicialet BBC (Bootstrap me

Blloqe me Cikle).

Me që ciklet, dhe rrjedhimisht dhe blloqet, janë krijuar në mënyrë automatike

nëpërmjet “kalimeve“ të serisë mbi dhe nën mesataren, ne presim që natyra

(struktura) e bashkimit ndërmjet blloqeve në pseudoserinë bootstrap të jetë më realiste

në kuptimin që imiton strukturën e serisë origjinale.

Në figurën 3.1 është ilustruar formimi i cikleve. Figura 3.1(a) tregon grafikun e një

serie kohore që e konsiderojmë si seri të vrojtuar (seria është simuluar nga një proces

ARFIMA(0, 0.3, 0) me mbetje normale N(0, 1.5) ). Në figurën 3.1(b) tregohen ciklet e

61

formuara, që janë veçuar njëra nga tjetra nëpërmjet drejtëzave vertikale me pika. Në

rastin e treguar në figurë, seria fillon dhe mbaron me kufizë në vlerë më të vogël se

mesatarja e zgjedhjes.

Figura 3.1 Ilustrim i formimit të cikleve.

Është e nevojshme të bëjmë shënimet e mëposhtme.

1. Në se kufiza e parë e serisë është negative, atëherë cikli do të përcaktohet si një çift

vargjesh me kufiza negative të ndjekur nga një varg kufizash pozitive.

2. Në se mesatarja e zgjedhjes nuk është zero, siç realisht ndodh, atëherë si kufi për

përcaktimin e ciklit do të përdoret mesatarja e zgjedhjes. Në këtë rast tek shënimet e

mësipërme fjala “zero” zëvendësohet me “mesatare” dhe fjalët “pozitive” dhe

“negative” zëvendësohen me “mbi mesataren” dhe “nën mesataren”, respektivisht.

3. Cikli i fundit i serisë mund të jetë i cunguar, në kuptimin që ai mund të përbëhet

vetëm nga kufiza me të njëjtën shenjë (ose nivel). Kjo ndodh në rastin kur kufiza e

parë e serisë dhe kufiza e fundit e serisë kanë shenjë (nivel) të njëjtë.

4. Numri i cikleve si dhe gjatësia e çdo cikli janë ndryshore të rastit, përderisa ata

përcaktohen automatikisht nga të dhënat.

62

5. Nga mënyra e përcaktimit të ciklit është evidente që, numri minimal i kufizave të

një cikli është 2 (me përjashtim të rastit kur cikli i fundit ka vetëm një kufizë), ndërsa

numri maksimal n. Prej këtej rrjedh se numri minimal i cikleve të serisë është 1 dhe

numri maksimal është 2

n

, ku me x shënojmë minimumin e numrave të plotë jo

më të vegjël se x (quhet edhe funksioni “tavan”). Pra kemi 1

12

nk

.

6. Numri i cikleve të një blloku përcakton gjatësinë e një blloku. Pra numri i cikleve të

një blloku është një parametër analog me gjatësinë e bllokut në metodat bootstrap me

blloqe të lëvizshme ose të ndara, apo me gjatësinë e pritshme të bllokut në metodën

bootstrap stacionar. Përcaktimi i tij është i rëndësishëm në performancës e metodës.

Megjithatë, me që gjatësia e ciklit është e rastit, në analogji me metodën e bootstrapit

stacionar, ne presim që performanca e bootstrap me blloqe me cikle të jetë relativisht

më pak e ndjeshme ndaj përcaktimit të numrit të cikleve për bllok se sa metodat

bootsrap me blloqe të lëvizshme ose të ndara janë të ndjeshme ndaj përcaktimit të

gjatësisë së bllokut.

Figura 3.2 Ilustrim i metodës bootstrap me blloqe me cikle.

63

Figura 3.2 ilustron metodën BBC. Ne e zbatuam këtë metodë për serinë e treguar në

figurën 3.1. Për qartësi të figurës ne përdorëm një cikël për bllok.

Në këtë rast blloku është i njëjtë me ciklin (gjithashtu metodat MBB dhe NBB janë të

njëjta). Në figurën 3.2(a) është paraqitur një rizgjedhje bootstrap, ndërsa blloqet e

rizgjedhur janë paraqitur në figurën 3.2(b). Duke vrojtuar figurat 3.1(b) dhe 3.2(b) ne

shohim se pikat e bashkimit të blloqeve në zgjedhjen bootstrap kanë strukturë të

ngjashme me pikat e bashkimit të blloqeve në serinë origjinale. Në të dy seritë pikat e

bashkimit kanë afërsisht të njëjta nivele kundrejt mesatares së zgjedhjes.

Siç përmendëm më sipër, ne presim që natyra e bashkimit ndërmjet blloqeve në

pseudoserinë bootstrap të jetë më realiste (në kuptimin që imiton strukturën e serisë

origjinale). Në figurën 3.3 kemi paraqitur një seri kohore të simuluar nga modeli

ARFIMA(1,d,0) me parametra 1 0.6 dhe d = 0.3, dhe nga një rizgjedhje bootstrap

me blloqe duke përdorur metodën BBC dhe metodat e përshkruara në paragrafin 2.2.

Mund të themi se rizgjedhja BBC e “imiton” më mirë, ose të paktën jo më keq,

strukturën e varësisë së serisë origjinale.

Figura 3.3 Grafikët e një serie të simuluar dhe e replikimeve të saj duke përdorur

metoda të ndryshme boostrap me blloqe.

64

3.2 Gjatësia e ciklit

Në këtë paragraf ne do trajtojmë disa rezultate teorike dhe empirike për gjatësinë e

ciklit të përcaktuar më sipër.

3.2.1 Disa konsiderata teorike

Shqyrtojmë fillimisht rastin kur seria është një zhurmë e bardhë.

Le të jetë { , 0, 1, 2, ...}t t një proces i zhurmës së bardhë me shpërndarje

normale me dispersion të çfardoshëm.

Njësoj si në paragrafin e mësipërm, përcaktojmë ciklin si bashkësinë e kufizave të

alternuara me shenjë pozitive me negative. Shënojmë me tL ndryshoren e rastit që

tregon gjatësinë e ciklit me fillim në momentin t Z . Atëherë, vlerat e mundshme të

ndryshores së rastit tL janë numrat e plotë pozitivë më të mëdhenj ose baras me 2.

Ligji i shpërndarjes së kësaj ndryshoreje rasti jepet sipas tabelës së mëposhtme (shih

Shtojca 1).

Tabela 3.1 Densiteti probabilitar i gjatësisë së ciklit të formuar nga një zhurme e

bardhë gausiane.

k 2 3 4 5 ...... k ......

( )tP L k 3

12

2

4

14

2

5

16

2

6

18

2 ......

1

2k

k ......

Pra shpërndarja e gjatësisë së një cikli nuk varet nga koha e fillimit të tij. Më tej do

flasim vetëm për kohë pozitive dhe shënojmë thjesht , = 1, 2, ...tL t , për të lehtësuar

indeksimin.

Duke shfrytëzuar barazimet

1

11

2kk

, 1

22k

k

k

, 2

1

62k

k

k

dhe 3

1

262k

k

k

(3.1)

(shih Shtojca 2) mund të bindemi që plotësohet kushti i densiteti probabilitar

2 2 2

1 1 1 12 1 1

2 2 2 2 2k k kk k k

k k

(3.2)

Për të gjetur pritjen matematike kryejmë njehsimet e mëposhtme.

2

2 2 2

1 1 1( ) 6 2

2 2 2 2 2

t k k kk k k

k k kE L k , dhe gjejmë

( ) 4 tE L (3.3)

Për dispersionin veprojmë në mënyrë të ngjashme.

3 22 2

2 2 2

1 1 1( ) 26 6 20

2 2 2 2 2

t k k kk k k

k k kE L k , dhe gjejmë

65

2 2( ) 20 4 4 tD L (3.4)

Me që 1

( 2) ( 3)4

t tP L P L dhe me që vargu i probabiliteteve është varg zbritës,

atëherë vlerat 2 dhe 3 janë moda. Ndërkohë çdo vlerë e intervalit 3,4 shërben si

mesore.

Gjithashtu mund të gjenden koeficienti i asimetrisë i Pirsonit

33

2

tLE (3.5)

dhe koeficienti i sheshtësisë i Pirsonit

4

4

133

4

tE L (3.6)

(shih Shtojca 2)

Figura 3.4 Densiteti dhe funksioni i shpërndarjes për gjatësinë e ciklit të një procesi

zhurmë e bardhë.

66

Pra, për rastin e zhurmës së bardhë gausiane, gjatësia e një cikli ka pritje matematike

dhe dispersion të njëjtë të barabartë me vlerën 4, si dhe me shpërndarje të pavarur nga

momenti i fillimit t, i saj. Asimetria dhe sheshtësia janë pozitive.

Në figurën 3.4 paraqitet grafiku i densitetit dhe funksionit të shpërndarjes për

ndryshoren Lt. Vëmë re se vlerat e gjatësisë së ciklit mbi 10 kanë probabilitet shumë

të vogël.

Shënim 3.1. Rezultatet e treguara për zhurmën e bardhë gausiane janë të vlefshëm

edhe për ndonjë shpërndarje tjetër me densitet simetrik, me kushtin që ndryshoret

{ , 0, 1, 2, ...}t t të jenë të pavarura (në vend të pakorreluara; tek shpërndarja

normale moskorrelimi sjell pavarësi).

Shënim 3.2. Në se tek përcaktimi i ciklit pritja matematike do të zëvendësohej me

mesoren, atëherë pohimet e mësipërm ngelen të vërtetë për çdo zhurmë të bardhë të

pavarur.

Shënim 3.3. Në se { , 0, 1, 2, ... }t t është një proces i zhurmës së bardhë të

pavarur me shpërndarje të çfarëdoshme, atëherë

21 1 1

1

( ) ( 2 )k

k k j k j

i

j

P L k pq p q p q

,

ku ( )ip P dhe q =1− p.

Shënim 3.4. Në se seria { , 1, 2, ... }tX t në shqyrtim është një proces satcionar

gausian ne mund të përdorim teoremën e Ramsey (Ramsey (1974) e cila tregon

shpërndarjen e tX kur kemi vrojtuar vlerat e mëparshme 0 1 1, , ..., tX X X të procesit.

Ramsey, 1974 tregoi se shpërndarja e tX me kusht 0 1 1, , ..., tX X X është një

shpërndarje normale me pritje matematike

0 1 1

1

( \ , ,..., )t

t t t tk t k

k

m E X X X X X

(3.7)

dhe dispersion

2

0 1 1 0

1

( \ , ,..., ) (1 )t

t t t kk

k

D X X X X

(3.8)

ku kk është autokorrelacioni i pjesshëm i rendit k dhe tk është koeficienti i k-të

në

modelin AR të rendit t. Koeficientët tek barazimet (3.7) dhe (3.8) mund të njehsohen

nëpërmjet algoritmit Durbin-Levin (shih p.sh. Brockwell dhe Davis, 1991, faqe 70).

Pra për rastin e proceseve stacionare gausiane gjatësia e ciklit varet nga funksioni i

autokorrelacionit.

3.2.2 Cikli i serisë së vrojtuar

Shqyrtojmë përsëri rastin e zhurmës së bardhë gausiane.

Le të jetë 1 2, , ..., nx x xx një vrojtim i rastit nga zhurma e bardhë gausiane

{ , 1, 2, ...}t t . Për thjeshtësi, supozojmë se 0x , përndryshe përdorim serinë

ndihmëse t ty x x . Më tej supozojmë se 1 0x (ose 1 0y ), përndryshe përdorim

67

serinë ndihmëse t tz x (ose t tz y ). Atëherë, cikli përcaktohet nga një varg

vrojtimesh të njëpasnjëshme me shenjë pozitive të ndjekura nga një varg vrojtimesh

negative. Në rastet kur janë përdorur seritë ndihmëse ty ose tz , cikli përbëhet nga

kufizat respektive të serisë së vrojtuar, tx . Me marrëveshje, në se pas ciklit të fundit të

serisë ka kufiza të tjera (të cilat do kenë shenjë të njëjtë, pozitive), atëherë ato do

konsiderohen si “cikël”.

Le të jenë 1 2, , ..., sL L L gjatësitë e cikleve të vrojtuara. Është e qartë se numri total i

cikleve, s, është një ndryshore rasti me vlera të plota në bashkësinë

{ 1, 2, ..., }2

nS , në se n është numër çift, ose

1{ 1, 2, ..., }

2

nS

kur n është

numër tek.

Gjatësia mesatare e cikleve të formuara në zgjedhjen 1 2, ,..., nx x x do jetë e barabartë

me shumën

1

1 s

i

i

nL L

s s

(3.9)

ku s është numri i cikleve të serisë (është ndryshore rasti) dhe iL është gjatësia e

ciklit të i-të

për 1, 2, ..., i s . Le të gjejmë shpërndarjen e ndryshores s dhe më pas

shpërndarjen e ndryshores së rastit L .

Nga sa thamë më sipër, vlerat e mundshme të ndryshores s janë 1, 2, ..., 2

nm

, ku

me simbolin x shënojmë minimumin e numrave të plotë jo më të vegjël se x.

Është e qartë se 1s vetëm kur 1L n . Nga mënyra e përcaktimit të ciklit, dhe nga

marrëveshjet e mësipërme, rrjedh se kusht i nevojshëm dhe i mjaftueshëm që zgjedhja

të përmbajë vetëm një cikël, është që zgjedhja të përbëhet nga l kufizat e para pozitive

të ndjekura nga n = m−l kufiza negative. Këtu, l merr vlerat l = 1, 2, ..., n. (kujtojmë

seria fillon me kufizë pozitive dhe se rasti me të gjitha kufizat pozitive quhet cikël).

Atëherë, kemi

1 11

2n

nP s P L n

(3.10a)

Për të gjetur probabilitetin 2P s , duhen shqyrtuar gjithë rastet e mundshme të

gjatësive të dy cikleve shuma e të cilave jep vlerën n, pra çiftet 1 2L dhe 2 2L n ,

1 3L dhe 2 3L n , ... , 1 2L n dhe 2 2L , si dhe rasti 1 1L n dhe 2 1L

(pra mund të ndodhë që cikli i fundit të ketë një kufizë).

Kemi 1

1 2

2

2 ;n

k

P s P L k L n k

. Prej nga gjejmë

68

2

1 2 1 1 2 1

2

2 \ 1 1\ 1n

k

P s P L k P L n k L k P L n P L L n

dhe

pas veprimesh si dhe duke marrë parasysh se 2L është cikli i fundit, gjejmë

2

1 1 02

1 2 1{ 2}

2 2 2 2

n

k n k nk

k n k nP s

, ose

2

12

12 2 ( 1)( )

2

n

nk

P s n k n k

(3.10b)

Në përgjithësi, mund të tregohet se për çdo 22

nm

është i vërtetë barazimi

1 2 1

1 2

1 2 3 11

, 1,2,...,, 1; ,..., 2

... 1

1( 1)( 1)....( 1)

2i

m m

m

m mn

k Z i mk k k kk k k n

P s m k k k k k

(3.11)

Shuma kryhet sipas të gjitha përkëmbimeve (pa përsëritje) të numrave të plotë

pozitivë 1, ..., mk k , që plotësojnë kushtin 1 2 ... 1mk k k n . Në fakt, mund të

tregohet që 1, 2 2 mk k n m dhe 2 3ik n m , për 2,3,..., 1i m .

Gjetja e një forme eksplicite e shumës (3.11) është një problem kombinatorike dhe

nuk është në objektin e kësaj teme. Megjithatë mund të tregohet se pritja matematike

e numrit të cikleve të zgjedhjes është

2( )

4

nE s

(3.12)

Për më tepër, në se n është çift, shpërndarja e numrit të cikleve është një shpërndarje

simetrike (shih tabelën 3.2).

Nga barazimet (3.9) dhe (3.12) gjejmë

1 1 2

( )4

nE E s

L n n

(3.13)

Nga ana tjetër, me ndihmën e tabelës së shpërndarjes së ndryshores së rastit s, ne

mund të gjejmë pritjen matematike të ndryshores 1

s nëpërmjet barazimit

/2

1

1 1( )

n

m

E P s ms m

(3.14)

më tej gjejmë ( )E L nga barazimi

1( )E L n E

s

(3.15)

Intuitivisht, ne presim që gjatësia mesatare e cikleve të zgjedhjes ka pritje matematike

( ) 42

nE L

n. Pra, L pritet të jetë një vlerësues asimptotikisht i pazhvendosur për

pritjen matematike të gjatësisë së ciklit të procesit.

69

Ne kemi njehsuar shpërndarjen e ndryshores së rastit s për disa vlera të vëllimit të

zgjedhjes n. Rezultatet janë treguar në tabelën 3.2. Gjithashtu janë njehsuar pritja

matematike /2

1

( ) { }n

m

E s mP s m

dhe pritja matematike ( )E L , e njehsuar sipas

barazimeve (3.15) dhe (3.14). Për të parën veprimet janë të sakta ndërsa për të dytën

veprimet janë të përafruara deri në tre shifra pas presjes.

Vihet re se ( ) 41

nE L

n edhe për n relativisht jo të mëdha. Pra ( ) 4E L për n të

mëdha. Ky fakt mbështet arsyetimin induktiv se L është një vlerësues asimptotikisht

i pazhvendosur për pritjen matematike të gjatësisë së ciklit.

Tabela 3.2 Rastet e mundshme për vlerat e numrit të cikleve të një zgjedhje me

vëllim n nga një zhurmë e bardhë gausiane. Raste gjithsej janë 2n-1

.

n

m 10 11 12 13 14 15 16 17 20

1 10 11 12 13 14 15 16 17 20

2 120 165 220 286 364 455 560 680 1140

3 252 462 792 1287 2002 3003 4368 6188 15504

4 120 330 792 1716 3432 6435 11440 19448 77520

5 10 55 220 715 2002 5005 11440 24310 167960

6 - 1 12 78 364 1365 4368 12376 167960

7 - - - 1 14 105 560 2380 77520

8 - - - - - 1 16 136 15504

9 - - - - - - - 1 1140

10 - - - - - - - - 20

( )E s 3 3.25 3.5 3.75 4 4.25 4.5 4.75 5.5

( )E L 3.633 3.665 3.691 3.714 3.733 3.750 3.764 3.778 3.810

Tabela 3.3 Gjatësia mesatare e ciklit të një serie kohore me vëllim n e gjeneruar nga

një proces ARFIMA(0,d,0).

n

d 100 200 500 700 1000 2000 3000

-0.45 3.2985 3.3145 3.3258 3.3307 3.3264 3.3287 3.3288

-0.4 3.3409 3.3552 3.3680 3.3711 3.3713 3.3742 3.3749

-0.3 3.4646 3.4625 3.4810 3.4754 3.4875 3.4821 3.4834

-0.2 3.5885 3.5947 3.6102 3.6164 3.6171 3.6087 3.6149

-0.1 3.7168 3.7651 3.7714 3.7732 3.7756 3.7819 3.7811

0.0 3.9451 3.9761 3.9878 3.9978 3.9926 3.9923 3.9985

0.1 4.1920 4.2517 4.2737 4.2875 4.2839 4.3015 4.2980

0.2 4.5677 4.6245 4.7016 4.7079 4.7266 4.7404 4.7496

0.3 5.0297 5.2269 5.3228 5.3846 5.3943 5.4387 5.4520

0.4 5.8314 6.0154 6.3344 6.4161 6.5109 6.6334 6.6901

0.45 6.3509 6.6055 7.0454 7.2004 7.3483 7.5866 7.6597

Kur seria e vrojtuar është gjeneruar nga një seri stacionare e çfardoshme gjatësia e

ciklit varet nga natyra e funksionit të autokorrelacionit të serisë. Ne simuluam seri nga

70

procese ARFIMA(0,d,0) për vlerat d = −0.45, 0.45 dhe vlerat nga −0.4 në 0.4 me hap

0.1 të parametrit të memories, si dhe për vëllim n = 100, 200, 500, 700, 1000, 2000

dhe 3000. Për çdo model të konsideruar ne simuluam 1000 seri me vëllimin e

përcaktuar. Për çdo seri të simuluar ne njehsuam gjatësinë mesatare të cikleve të

formuar. Pas përfundimeve Monte Carlo ne gjetëm mesataren e rezultateve Monte

Carlo. Rezultatet paraqiten në tabelën 3.3.

Vihet re se gjatësia e ciklit varet nga shenja e autokorrelacionit të procesit dhe kjo

gjatësi rritet kur vlerat e parametrit d rriten nga −0.45 në 0.45. Gjithashtu për një vlerë

të fiksuar të parametrit d, gjatësia e ciklit rritet me rritjen e vëllimit të zgjedhjes.

Megjithatë, gjatësia e ciklit varet shumë pak nga vëllimi i zgjedhjes.

Në figurën 3.5 paraqitet grafiku i varësisë së gjatësisë së ciklit nga vlera e parametrit

d, për vëllimin 700n . Rritja e gjatësisë së ciklit duket të jetë e formës

eksponenciale. Gjithashtu, vëmë re se kur 0d , pra kur kemi zhurmë të bardhë,

vlera e gjatësisë së ciklit është shumë afër vlerës teorike, 4.

Figura 3.5 Varësia e gjatësisë mesatare të ciklit nga parametri i memories, d për një

seri kohore e modelit ARFIMA(p,d,q).

71

Gjithashtu ne kryem simulime nga tre procese rasti me funksion të autokorrelacioneve

të ndryshëm dhe njehsuam mesataren e gjatësive të cikleve të formuara në serinë

kohore të simuluar. Ne simuluam seri kohore të modelit zhurmë e bardhë gausiane, që

karakterizohet nga mungesa e memories, të modelit AR(1) me memorie të shkurtër,

me koeficient autoregresiv 1 0.3 , dhe seri të modelit ARFIMA(0,d,0) me memorie

të gjatë, me parametër d = 0.2. Për secilin model ne simuluam një seri me gjatësi

1000n kufiza dhe njehsuam gjatësinë mesatare të ciklit sipas barazimit (3.9).

Eksperimenti Monte Carlo u përsërit 1000 herë dhe histogramat e vlerave të gjatësisë

mesatare paraqiten në figurën 3.6. Për të pasur një krahasim më të qartë, parametrat e

boshteve janë vendosur të njëjtë për secilin rast.

Figura 3.6 Mesatarja e gjatësive të ciklit të një zgjedhje rasti të modeleve zhurmë e

bardhë, AR(1) dhe ARFIMA(0,d,0).

Nga figura 3.6, mund të themi se për rastin e zhurmës së bardhë, gjatësia mesatare e

ciklit të zgjedhjes është afërsisht 4. Kjo mbështet arsyetimin se gjatësia mesatare e

ciklit të zgjedhjes është vlerësues asimptotikisht i pazhvendosur për pritjen

matematike të gjatësisë së ciklit, me densitet shpërndarjeje sipas tabelës 3.1.

Gjithashtu, vëmë re se gjatësia e ciklit varet më tepër nga funksioni i autokorrelacionit

të rendit të parë të procesit dhe jo nga shuma e autokorrelacioneve. Kështu,

72

pavarësisht se procesi ARFIMA(0,d,0) është me memorie të gjatë, ai ka gjatësi

mesatare të ciklit më të vogël se gjatësia mesatare e ciklit për procesin AR(1), që ka

memorie të shkurtër. Kjo rrjedh nga fakti se funksioni i autokorrelacioni të rendit të

parë ka vlerat (teorike) 1 0.25 për procesin ARFIMA(0,d,0) me parametër 0.2d

(shih barazimin (1.42) ) dhe 1 0.3 për procesin AR(1) me parametër 1 0.3 .

Vemë re se në të tre rastet shpërndarja e ndryshores L është afër shpërndarjes

normale.

3.3 Simulime Monte Carlo

Në këtë paragraf përshkruhet një studim (eksperiment) Monte Carlo me të dhëna të

simuluara për të krahasuar metodën bootstrap me cikle, BBC, me metodat e njohura

MBB dhe SB. Ne do zbatojmë metodën bootstrap të propozuar në paragrafin e

mësipërm, për vlerësimin e parametrave të serive me memorie të gjatë. Butka dhe

Beta (2014) kanë përdorur metodën bootstrap me blloqe të përbërë nga cikle për të

vlerësuar memorien e gjatë. Ata kanë gjetur se metoda BBC jep në përgjithësi

vlerësime me devijim standard më të vogël se metodat klasike. Butka dhe Capollari

(2013a) treguan se metoda BBC mund të përdoret me sukses për testimin e hipotezës

0 : 0H d kundrejt hipotezës alternative 1 : 0H d , pra për zbulimin e pranisë së

memories së gjatë në një seri të vrojtuar.

Të gjitha eksperimentet e kryera janë ekzekutuar në programin R duke përdorur disa

paketa si dhe komanda të përshtatura kur ka qenë e nevojshme.

3.3.1 Vlerësimi pikësor

Fillimisht, ne do shohim vlerësimin pikësor të parametrit d, të memories së gjatë të

një modeli ARFIMA duke përdorur vlerësuesit GPH, SP dhe vlerësuesin e përgjasisë

maksimale (VPM) (shih paragrafin 1.5.2). Dy të parat e vlerësojnë parametrin d

nëpërmjet periodogramës së serisë kohore të vrojtuar. Për të pasur një krahasim ne do

përdorim gjithashtu edhe vlerësuesin e përgjasisë maksimale, i cili është vlerësues

parametrik dhe, me që është përdorur në modelin e duhur (pra nuk kemi gabim në

identifikimin e modelit) ai është vlerësuesi më efikas. Meqenëse njehsimet për gjetjen

e VPM kërkojnë tepër kohë kompjuterike, ne do përdorim një përafrim të saj të

propozuar nga Haslett dhe Raftery (1989), e cila është e implementuar në komandën

fracdiff të paketës fracdiff të programit R.

Duke përdorur formulën (2.1), vlerësuesi bootstrap GPH mund të shkruhet në formën

,

1

1ˆ ˆQ

GPH GPH j

j

d dQ

,

ku ,ˆ

GPH jd është vlerësimi përkatës i gjetur në pseudoserinë e j-të bootstrap. Njësoj

veprohet edhe për vlerësuesit e tjerë.

Në eksperimentin Monte Carlo ne do përdorim seri kohore të gjeneruara nga modelet

FI(d) për vlerat 0.1, 0.2, 0.3, 0.4, 0.45d të parametrit të memories d dhe me

gjatësi 100, 200, 500, 1000n . Këto vlera mbulojnë një diapason të arsyeshëm për

zbatime praktike. Rezultatet Monte Carlo janë mbështetur në 1000P realizime për

çdo model të shqyrtuar. Rezultatet bootstrap janë mbështetur në 1000Q përsëritje

bootstrap. Në çdo model të simuluar, është përdorur një periudhë “djegie” prej 300

73

kufizash të para për të eliminuar efektin e vlerave fillestare. Pra, janë gjeneruar

300n vlera dhe 300 vlerat e para janë larguar nga seria.

Seritë kohore janë simuluar me ndihmën e komandës fracdif.sim në paketën “fracdiff“

të programit R. Për përcaktimin e gjatësisë së bllokut do përdorim metodën e

propozuar nga Politis dhe Romano (2003), i aplikueshëm në funksionin “b.star” të

paketës “np” në programin R. Shënojmë një korrigjim që duhet bërë tek komanda

“b.star” (shih shtojca 3). Për hollësi të metodës shih Politis dhe White (2004) si dhe

Patton etj. (2008) për një korrigjim.

Tek vlerësuesi GPH ne kemi përdorur pikën e cungimit 0.8m n të frekuencave tek

regresi (1.73) (siç përcaktohet tek komanda “fdGPH” tek paketa “fracdiff”, në R).

Tek vlerësuesi SP ne kemi përdorur pikën e cungimit 0.5m n të frekuencave tek

regresi (1.73) dhe pikën e cungimit 0.9M n tek dritarja Parzen (këto vlera janë të

përcaktuara tek komanda “fdSperio” tek paketa “fracdiff”, në R).

Për çdo vlerësues dhe çdo metodë bootstrap të përdorur, do njehsojmë vlerësimin

pikësor Monte Carlo sipas barazimeve

1

1ˆ ˆ

P

MC j

j

d dP

dhe *

1

1ˆ ˆ

P

MC j

j

d dP

(3.16)

ku ˆjd është vlerësimi pikësor i d-së sipas vlerësuesit të përdorur dhe ˆ

jd është

vlerësimi bootstrap me metodën përkatëse, të vrojtuara për serinë e simuluar në

përsëritjen Monte Carlo të j-të

. Për të krahasuar performancën e secilit vlerësues dhe të

vlerësuesit bootstrap përkatës, për çdo model të studiuar, do të njehsojmë zhvendosjen

(empirike)

0ˆ ˆ( ) MCd d d (3.17)

ku me 0d kemi shënuar vlerën e vërtetë të parametrit. Gjithashtu do njehsojmë

devijimin standard (empirik)

2

1

1ˆ ˆ ˆ( ) ( )1

P

j MC

j

SD d d dP

(3.18)

Më tej ne mund të gjejmë dhe gabimin katror mesatar (empirik) sipas barazimit

2 2 2

0

1

1 1ˆ ˆ ˆ ˆ( ) ( ) [ ( )] [ ( )]

P

j

j

PMSE d d d SD d d

P P (3.19)

si dhe rrënjën katrore të tij

ˆ ˆ( ) ( )RMSE d MSE d (3.20)

Për të vlerësuar “dobinë” (efikasitetin) e përdorimit të metodave bootstrap të përdorur

ne do të njehsojmë statistikën

ˆ ˆ( ) ( )x100

ˆ( )

RMSE d RMSE dEF

RMSE d (3.21)

Kjo statistikë tregon se sa është, në përqindje, përfitimi i përdorimit të metodës

bootstrap përkatëse e krahasuar me metodën klasike (e thjeshtë).

74

Statistikat e mësipërme do të njehsohen për të dy vlerësuesit GPH dhe SP, të përdorur,

si dhe për vlerësuesit bootstrap përkatës.

Rezultatet e përftuara paraqiten tek tabelat 3.4-3.7 si dhe në figurën 3.7.

Figura 3.7 Efikasiteti relativ (në përqindje) i vlerësimeve GPH me metodat bootstrap

MBB, SB dhe BBC kundrejt vlerësimeve të zakonshme GPH, referuar rrënjës katrore

të gabimit mesatar katror.

Në tabelat 3.4-3.6 paraqiten përkatësisht zhvendosja empirike, devijimi standard dhe

rrënja e gabimit katror mesatar për vlerësuesit e përdorur. Në formatin “bold” janë

printuar vlerat më të vogla (vlerat absolute, për rastin e zhvendosjes) të secilit model,

ndërsa në formatin “bold italic” vlerat e dyta më të vogla.

Në tabelën 3.7 tregohet efikasiteti, në përqindje, i përdorimit të metodave bootstrap

(shih barazimin (3.21) më sipër). Në formatin “bold” është printuar vlera më e madhe

e secilit model, ndërsa në formatin “bold italic” vlerat e dytë më e madhe.

Nga rezultatet e përftuara mund të themi se, ashtu siç pritej, vlerësuesi VPM jep

vlerësime me RMSE empirik më të vogël. Ne e kemi përdorur metodën parametrike

VPM në rastin ideal, kur modeli i supozuar është modeli i vërtetë. Ndërkohë,

75

vlerësuesi GPH i zbatuar nëpërmjet metodës bootstrap BBC jep rezultatet më të mira

ndër metodat e tjera bootstrap të përdorura, duke iu referuar vlerave të RMSE.

Për t’u theksuar është fakti se përdorimi i vlerësuesit GPH nëpërmjet metodës BBC

është i dobishëm për të gjitha rastet e simuluara. Efikasiteti relativ i tij kundrejt

metodës e zakonshme përkatëse, i përkufizuar sipas barazimit (3.21), është gjithmonë

pozitiv, dhe merr vlerën maksimale pothuajse në të gjitha rastet (shih tabelën 3.7).

Në figurën 3.7 jepen grafikët e efikasitetit të vlerësuesit GPH i zbatuar nëpërmjet

metodave MBB, SB dhe BBC kundrejt vlerave e parametrit të memories, d. Dallohet

lehtësisht se metoda BBC ka efikasitetin më të lartë dhe është gjithmonë me efikasitet

pozitiv. Siç edhe pritet, efikasiteti i metodave bootstrap zvogëlohet me rritjen e

gjatësisë së serisë. Ndërkohë metodat MBB dhe SB kanë efikasitet negativ (pra

përdorimi i tyre nuk sjell përmirësim të vlerësimit) për disa vlera të parametrave n dhe

d.

3.3.2 Vlerësimi intervalor

Një problem shumë i rëndësishëm i analizës së serive kohore me memorie të gjatë

është gjetja e intervaleve të besimit për parametrin e memories d. Ky është një

problem i trajtuar gjerësisht në literaturë për faktin se ai është i lidhur drejtpërdrejt me

me problemin e testimit të ekzistencës së memories së gjatë. Mund të përmendim

Silva etj. (2006), Franco dhe Reisen (2007), Arteche dhe Obre (2009, 2014), Kim dhe

Nordman (2011) ndër të tjerë. Butka dhe Capollari (2013b) përdorën metodën BBC

për të përmirësuar probabilitetin e mbulimit të intervaleve të besimit për parametrin e

memories së gjatë në modelet ARFIMA(0,d,0).

Në eksperimentin Monte Carlo të zhvilluar më sipër, ne gjithashtu gjetëm intervalet e

besimit për parametrin e memories d, me nivel rëndësie1 0.95 . Intervalet e

besimit janë ndërtuar duke përdorur vlerësuesit gjysmë parametrikë GPH dhe SP. Për

secilin model të simuluar ne gjetëm intervalin e besimit duke përdorur shpërndarjen

asimptotike të vlerësuesit përkatës, si dhe intervalet e besimit bootstrap PB dhe BCa

(shih paragrafin 2.5), duke përdorur metodat MBB, SB dhe BBC. Për secilin interval

ne njehsuam probabilitetin empirik të mbulimit si dhe gjatësinë mesatare të intervalit,

duke përdorur 1000 përsëritje Monte Carlo.

Rezultatet për vlerësuesin GPH jepen në tabelat 3.8-3.9, ndërsa për vlerësuesin SP në

tabelat 3.10-3.11. Për secilin rast, me bold janë printuar vlerat më të larta të

probabilitetit (empirik) të mbulimit ose vlerat më të ulta të gjatësisë mesatare të

intervalit.

Rezultatet më të mira, referuar probabilitetit të mbulimit, janë përftuar nga intervali

PB nëpërmjet vlerësuesit GPH i zbatuar me metodën BBC. Në tabelën 3.8 ne shohim

se intervali PB i përftuar nga BBC ka pothuajse gjithmonë probabilitetin më të lartë të

mbulimit. Vlerat e probabilitetit të mbulimit të intervalit PB me metodën BBC janë

gjithmonë, përveç një rasti, më të mëdha ose baraz me nivelin e përcaktuar të

intervalit. Gjithashtu, metoda BBC jep probabilitetin më të mirë të mbulimit të

intervaleve BCa krahasuar me metodat MBB dhe SB. Intervalet e përftuara nga

vlerësuesi SP nëpërmjet metodave bootstrap japin gjithmonë probabilitet mbulimi më

të madh se intervalet asimptotik përkatës. Edhe në këtë rast, metoda BBC performon

përgjithësisht më mirë se metodat MBB dhe SB, referuar probabilitetit të mbulimit.

76

Megjithatë, kompensimi që duhet “paguar” për të pasur probabilitetin e mbulimit më

të madh, është një gjatësi më e madhe e intervaleve të besimit të përftuara me

metodën BBC se sa ajo e intervaleve të tjerë.

Në përgjithësi, mund të konkludojmë se metoda BBC përmirëson performancën e

vlerësimit intervalor të parametrit të memories nëpërmjet vlerësuesve gjysmë

parametrik GPH dhe SP.

3.3.3 Kontrolli i hipotezës për praninë e memories së gjatë

Siç u theksua përgjatë kapitullit të parë evidentimi i prezencës së memories së gjatë në

një seri kohore të vrojtuar, është një problem sa i rëndësishëm aq dhe i vështirë për t’u

realizuar. Shpesh memoria e gjatë është e ndërthurur me memorien e shkurtër dhe

statistikat e përdorura në literaturë japin rezultate të ndryshme dhe përmbajnë

parametra që duhen përcaktuar në mënyrë empirike.

Në eksperimentet Monte Carlo ne kemi përdorur bootstrapin jo parametrik dhe

bootstrapin gjysmë parametrik për të kontrolluar hipotezat:

H0 : Seria nuk është me memorie të gjatë, kundrejt hipotezës

H1 : Seria është me memorie të gjatë.

(i) Bootstrapi jo parametrik

Në këtë eksperiment ne do ndjekim skemën e rizgjedhjeve bootstrap jo parametrik

duke përdorur teknikën e propozuar BBC. Në literaturë, sugjerohet se gjatë kontrollit

të hipotezave me metodat bootstrap, përdorimi i një statistike në formë metrike jep

kritere të vlefshme përkundrejt gjithë hipotezave alternative (Romano, 1988, Hinkley,

1988).

Verifikimi i hipotezave të mësipërme do mbështetet në faktin se një seri me memorie

të gjatë mund të paraqitet nga modeli ARFIMA(p,d,q) për vlera d ≠ 0. Për të testuar

në se në një seri shfaq apo jo memorie të gjatë, ne do kontrollojmë hipotezën bazë

0 : 0H d , kundrejt hipotezës alternative

1 : 0H d , duke përdorur statistikën

ˆW d d , ku d̂ është një vlerësues konvergjent i parametrit të memories, d.

Si vlerësues të parametrit d do të përdorim vlerësuesin e periodogramës së lëmuar, SP

(shih paragrafin 1.5.2 (v)) të propozuar nga Hassler (1993) dhe Reisin (1994). Butka

dhe Capollari (2013a), bazuar në simulime Monte Carlo, propozojnë përdorimin e

vlerësuesit SP kundrejt vlerësuesit GPH për të kryer testimin e prezencës së memories

së gjatë. Si dritare të vonesës do përdorim dritaren Parzen, që jepet nga barazimet

(1.77). Pikat e cungimit i zgjedhim të rendeve 0.5m n për numrin e kufizave tek

regresi i periodogramës (1.73) dhe 0.7M n për dritaren Parzen (Chen etj., 1993 dhe

Reisen, 1994, në studimet e tyre Monte Carlo, kanë treguar që këto vlera të pikave të

cungimit japin vlerësime të mira të parametrit d).

Ne realizuam simulime nga procese me memorie të shkurtër dhe nga procese me

memorie të gjatë për të vlerësuar gabimin e llojit të parë dhe fuqinë e kriterit të

përdorur. Proceset me memorie të shkurtër u simuluan nga modelet AR(1) me

77

inovacione me shpërndarje normale dhe me koeficientë 1 {0, 0.1, 0.3, 0.5} (rasti

1 0 i korrespondon zhurmës së bardhë). Proceset me memorie të gjatë u simuluan

nga modeli ARFIMA(1,d,0) për {0.1, 0.2, 0.3, 0.4}d , dhe parametrat e tjerë të

njëjtë si tek rasti i modeleve AR(1). Gjatësitë e serive u përzgjodhën të ishin në vlerat

n =100, 300, 500. Si nivel domethënie janë përdorur vlerat 0.05, 0.10 .

Për të njehsuar p-vlerat bootstrap ne përdorëm 999 përsëritje bootstrap, ndërsa për të

vlerësuar (empirikisht) gabimin e llojit të parë dhe fuqinë e kriterit u përdorën 1000

eksperimente Monte Carlo për çdo rast të simuluar.

Ne përdorëm vlera të ndryshme për numrin e cikleve për bllok. Nga rezultatet e

gjetura, rezultoi që numri i cikleve për bllok nuk duhet të jetë shumë i vogël, por as

shumë i madh. Disa nga rezultatet e gjetura paraqiten në tabelat 3.12 - 3.16.

Tabela 3.12 tregon gabimin e llojit të parë, në përqindje, i vlerësuar si raport i numrit

të refuzimeve të hipotezës bazë me numrin total të përsëritjeve Monte Carlo, për çdo

seri të simuluar. Vemë re se ky gabim varet nga numri i cikleve për bllok (pra nga

gjatësia e bllokut), nga gjatësia e serisë si dhe nga koeficienti i autoregresit të modelit

AR(1). Në praktikë, modeli që gjeneron të dhënat është i panjohur. Kështu që gjatësia

e bllokut bootstrap duhet përcaktuar empirikisht nga seria e vrojtuar. Nga rezultatet e

tabelës 3.12, mund të themi se numri optimal i cikleve për bllok duket të jetë 6-8, për

100n , 8-10 për 300n , dhe 10-12 kur 500n .

Në tabelat 3.13-3.16 jepet fuqia e kriterit të përdorur për çdo model ARFIMA(1,d,0)

të simuluar. Ashtu siç pritej, fuqia rritet me rritjen e parametrit të memories d, si dhe

me rritjen e koeficientit të autoregresionit dhe po ashtu me rritjen e vëllimit të serisë.

Vlerësimet e fuqisë janë më të larmishme, por në përgjithësi vlerat më të mira merren

për numrin e cikleve për bllok të njëjtë me atë të gjetur tek vlerësimi i gabimit të llojit

të parë. Në përgjithësi vihet re një tendencë për të pranuar hipotezën bazë, veçanërisht

kur 1 0 .

(ii) Bootstrapi gjysmë parametrik.

Butka etj. (2014) kanë përdorur metodën bootstrap gjysmë parametrik, ose bootstrapin

sitë, të shpjeguar në paragrafin 2.4, për të kryer kontroll hipotezash për praninë e

memories së gjatë duke përdorur statistikën e propozuar nga Lo (1991). Shih dhe

paragrafin 1.5.1, pika (i). Si tek rasti i mësipërm, janë gjeneruar seri me memorie të

shkurtër dhe seri me memorie të gjatë për të vlerësuar empirikisht gabimin e llojit të

parë dhe fuqinë e kritereve të përdorur. Si pikë e cungimit të statistikës Lo, e

përcaktuar nga barazimi (1.57), janë marrë tre vlerat e mëposhtme, të përdorura në

literaturë (shih Butka etj., 2014).

2/31/3

2

ˆ3 2

ˆ2 1L

Nq

(3.22a)

propozuar nga Lo (1991),

2/31/4

2

ˆ2

ˆ10 1W

Nq

(3.22b)

propozuar nga Wang etj. (2007), dhe

78

1/4

8100

M

Nq

(3.22c)

propozuar nga Murphy dhe Izzeldin (2009).

Niveli i rëndësisë është përcaktuar 0.05 . Numri i cikleve për bllok është

përzgjedhur në mënyrë që gjatësia mesatare e një blloku të jetë e rendit 0.5n .

Disa nga rezultatet e përftuara janë paraqitur në tabelat 3.17-3.18. Nga rezultatet e

përftuara mund të konkludojmë se përdorimi i metodës bootstrap BBC sjell

përmirësimin e performancës së statistikës R/S të modifikuar nga Lo (1991) duke

rritur fuqinë e saj në kontrollin e hipotezës mbi ekzistencën e memories së gjatë në një

seri të vrojtuar. Përdorimi i kësaj metode jep teste me gabim të llojit të parë më të

vogël se sa testi përkatës asimptotik pa zvogëluar fuqinë e kriterit të përdorur. Ky

përmirësim është më i dukshëm për seritë me gjatësi të vogël, si tek rasti 100n .

79

Tabela 3.4 Zhvendosja (β) për vlerësimet e d-së në proceset ARFIMA(0,d,0).

d n Monte Carlo MBB SB BBC

VPM GPH SP GPH SP GPH SP GPH SP

0.1

100 -.0313 -.0025 -.0710 -.0593 -.1521 -.0571 -.1481 -.0297 -.1379

200 -.0215 -.0012 -.0571 -.0578 -.1401 -.0531 -.1342 -.0270 -.1265

500 -.0104 .0003 -.0369 -.0572 -.1285 -.0502 -.1235 -.0254 -.1213

1000 -.0050 -.0006 -.0243 -.0497 -.1210 -.0446 -.1156 -.0264 -.1163

0.2

100 -.0425 .0138 -.0628 -.0861 -.2240 -.0828 -.2081 -.0352 -.1816

200 -.0258 .0005 -.0644 -.0755 -.2098 -.0722 -.1938 -.0314 -.1779

500 -.0135 -.0030 -.0380 -.0515 -.1861 -.0505 -.1666 -.0287 -.1659

1000 -.0056 -.0006 -.0302 -.0314 -.1673 -.0311 -.1446 -.0173 -.1509

0.3

100 -.0599 .0073 -.0760 -.0953 -.2676 -.0969 -.2518 -.0388 -.2095

200 -.0265 .0035 -.0549 -.0625 -.2334 -.0645 -.2153 -.0253 -.1819

500 -.0136 .0019 -.0360 -.0315 -.1808 -.0333 -.1658 -.0136 -.1426

1000 -.0056 .0047 -.0253 -.0107 -.1490 -.0122 -.1370 -.0014 -.1136

0.4

100 -.0694 .0084 -.0879 -.0911 -.2935 -.0967 -.2814 -.0340 -.2168

200 -.0347 .0097 -.0606 -.0410 -.2370 -.0456 -.2272 -.0107 -.1670

500 -.0139 .0064 -.0367 -.0148 -.1778 -.0175 -.1720 -.0031 -.1214

1000 -.0062 .0022 -.0180 -.0046 -.1398 -.0064 -.1355 .0006 -.0895

0.45

100 -.0777 .0160 -.0756 -.0812 -.2952 -.0885 -.2865 -.0266 -.2011

200 -.0440 .0097 -.0481 -.0383 -.2359 -.0435 -.2291 -.0112 -.1558

500 -.0196 .0102 -.0277 -.0101 -.1777 -.0134 -.1741 -.0007 -.1084

1000 -.0099 .0058 -.0162 .0035 -.1441 .0014 -.1418 .0053 -.0796

Vlerat me vlerë absolute më të vogël janë printuar në formatin bold. Vlerat me vlerë absolute të

dytë më të vogël janë printuar në formatin bold italic.

Tabela 3.5 Devijimi standard (SD) për vlerësimet e d-së në proceset ARFIMA(0,d,0).



0.1

100 .0653 .1406 .2556 .0533 .0249 .0561 .0380 .0898 .0954

200 .0542 .0962 .1993 .0376 .0182 .0398 .0247 .0627 .0546

500 .0362 .0614 .1445 .0319 .0145 .0313 .0182 .0405 .0252

1000 .0248 .0454 .1182 .0330 .0080 .0306 .0136 .0307 .0132

0.2

100 .0853 .1409 .2612 .0798 .0672 .0776 .0738 .1006 .1264

200 .0605 .0977 .2122 .0689 .0608 .0650 .0668 .0690 .0897

500 .0359 .0659 .1478 .0531 .0587 .0512 .0626 .0509 .0703

1000 .0241 .0450 .1234 .0398 .0574 .0388 .0605 .0374 .0629

0.3

100 .0857 .1429 .2652 .0987 .1087 .0946 .1095 .1027 .1576

200 .0584 .0971 .2032 .0811 .1105 .0787 .1075 .0759 .1322

500 .0356 .0635 .1537 .0553 .1045 .0546 .0989 .0516 .1130

1000 .0248 .0460 .1249 .0404 .0937 .0402 .0883 .0380 .0993

0.4

100 .0787 .1395 .2699 .1086 .1411 .1058 .1365 .1026 .1821

200 .0534 .0984 .2089 .0832 .1332 .0824 .1269 .0757 .1519

500 .0347 .0649 .1551 .0562 .1116 .0558 .1072 .0518 .1248

1000 .0254 .0460 .1320 .0398 .0967 .0396 .0943 .0365 .1099

0.45

100 .0731 .1481 .2770 .1168 .1499 .1147 .1451 .1063 .1874

200 .0498 .1028 .2087 .0850 .1363 .0842 .1301 .0772 .1594

500 .0316 .0649 .1587 .0573 .1111 .0568 .1076 .0501 .1298

1000 .0230 .0456 .1252 .0414 .0928 .0412 .0897 .0367 .1071

Vlerat më të vogla janë printuar në formatin bold. Vlerat e dyta më të vogla janë printuar në formatin bold italic.

80

Tabela 3.6 Rrënja e gabimit katror mesatar (RMSE) për vlerësimet e d-së në proceset

ARFIMA(0,d,0).



0.1

100 .0724 .1406 .2653 .0797 .1541 .0800 .1529 .0945 .1677

200 .0583 .0963 .2073 .0689 .1413 .0663 .1365 .0682 .1378

500 .0376 .0614 .1492 .0655 .1293 .0592 .1248 .0478 .1239

1000 .0253 .0454 .1206 .0596 .1213 .0541 .1164 .0405 .1170

0.2

100 .0953 .1416 .2687 .1174 .2339 .1135 .2208 .1065 .2212

200 .0657 .0977 .2217 .1022 .2184 .0971 .2050 .0758 .1992

500 .0383 .0660 .1526 .0740 .1951 .0719 .1780 .0584 .1802

1000 .0247 .0450 .1271 .0507 .1769 .0497 .1567 .0412 .1635

0.3

100 .1045 .1431 .2759 .1372 .2888 .1354 .2746 .1097 .2621

200 .0641 .0972 .2105 .1024 .2582 .1017 .2406 .0800 .2248

500 .0381 .0635 .1578 .0636 .2088 .0639 .1930 .0533 .1819

1000 .0254 .0462 .1274 .0418 .1760 .0420 .1630 .0380 .1508

0.4

100 .1049 .1397 .2838 .1417 .3256 .1433 .3127 .1080 .2831

200 .0637 .0989 .2175 .0927 .2718 .0941 .2602 .0764 .2257

500 .0374 .0653 .1594 .0581 .2099 .0585 .2026 .0519 .1741

1000 .0261 .0460 .1333 .0400 .1700 .0401 .1651 .0365 .1417

0.45

100 .1067 .1489 .2871 .1422 .3310 .1448 .3211 .1095 .2748

200 .0664 .1032 .2142 .0932 .2724 .0947 .2634 .0780 .2228

500 .0372 .0657 .1611 .0582 .2095 .0583 .2046 .0501 .1691

1000 .0250 .0459 .1263 .0415 .1714 .0412 .1678 .0371 .1334

Vlerat më të vogla janë printuar në formatin bold. Vlerat e dyta më të vogla janë printuar në

formatin bold italic.

Tabela 3.7 Efikasiteti (në përqindje) i përdorimit të metodave bootstrap kundrejt

metodës përkatse të zakonshme.

d n MBB SB BBC

GPH SP GPH SP GPH SP

0.1

100 43.30 41.90 43.08 42.36 32.74 36.79

200 28.33 31.85 31.02 34.18 29.04 33.54

500 -6.67 13.29 3.65 16.30 22.14 16.93

1000 -31.39 -0.49 -19.13 3.54 10.82 3.00

0.2

100 17.08 12.95 19.84 17.81 24.72 17.64

200 -4.62 1.50 0.57 7.56 22.41 10.16

500 -12.13 -27.87 -9.01 -16.62 11.42 -18.07

1000 -12.65 -39.22 -10.49 -23.38 8.44 -28.69

0.3

100 4.11 -4.70 5.36 0.47 23.27 4.97

200 -5.38 -22.69 -4.73 -14.33 17.66 -6.83

500 -0.18 -32.29 -0.67 -22.30 16.00 -15.26

1000 9.62 -38.12 9.15 -27.90 17.76 -18.40

0.4

100 -1.43 -14.73 -2.56 -10.18 22.66 0.25

200 6.19 -24.99 4.75 -19.64 22.68 -3.79

500 10.89 -31.71 10.33 -27.16 20.43 -9.24

1000 13.00 -27.60 12.90 -23.92 20.73 -6.39

0.45

100 4.50 -15.31 2.74 -11.85 26.44 4.27

200 9.71 -27.21 8.22 -23.02 24.45 -4.07

500 11.44 -30.09 11.17 -27.04 23.73 -4.97

1000 9.61 -35.77 10.32 -32.91 19.33 -5.70

Vlerat më të mëdha janë printuar në formatin bold.

81


GPH, me nivel 1 0.95 , për parametrin d, tek modelet ARFIMA(0,d,0).

d n Asimp MBB SB BBC

PB BCa PB BCa PB BCa

0.1

100 95.5 97.9 69.4 97.9 70.6 97.4 75.5

200 94.2 98.8 66.7 98.7 68.0 98.5 73.0

500 96.3 98.2 65.0 99.4 68.1 96.9 74.2

1000 96.5 89.9 63.4 96.1 65.7 97.2 72.2

0.2

100 94.2 96.1 71.0 96.6 70.8 95.8 78.2

200 93.6 95.0 71.2 95.3 72.2 95.7 79.3

500 92.5 86.4 69.8 87.9 71.4 93.4 74.1

1000 95.4 89.5 74.6 90.3 74.2 95.7 79.1

0.3

100 93.8 93.2 68.6 93.6 68.4 95.1 75.5

200 94.1 89.1 73.4 88.9 73.3 95.5 78.9

500 94.2 91.1 76.7 90.3 75.8 96.0 80.4

1000 94.7 93.2 82.4 93.2 80.6 96.4 83.6

0.4

100 94.5 88.3 68.5 88.1 68.0 95.8 77.3

200 93.8 90.0 74.6 89.2 73.4 95.7 80.5

500 94.0 94.1 77.4 93.4 76.0 96.1 80.3

1000 94.6 94.7 79.8 94.4 79.6 96.9 80.9

0.5

100 93.9 89.8 68.9 89.0 68.5 95.7 78.9

200 94.3 90.6 74.4 89.3 73.9 95.7 78.7

500 94.2 93.7 77.1 93.2 75.9 96.6 79.8

1000 95.8 95.2 81.3 95.2 80.6 97.3 79.8

BP intervali bootstrap i përqindjes. BCa intervali me zhvendosje të korrigjuar dhe i përshpejtuar.

Asimp përdor shpërndarjen asimptotike. Vlerat më të mëdha janë printuar në formatin bold.


GPH, me nivel 1 0.95 , për parametrin d, tek modelet ARFIMA(0,d,0).



0.1

100 .5045 .5044 .4060 .5023 .4107 .4933 .4328

200 .3538 .3553 .2674 .3538 .2756 .3494 .3008

500 .2307 .2309 .1581 .2309 .1706 .2301 .1922

1000 .1690 .1700 .0985 .1700 .1075 .1705 .1332

0.2

100 .4850 .5036 .3703 .5005 .3717 .4935 .4311

200 .3484 .3525 .2490 .3526 .2549 .3494 .3056

500 .2288 .2299 .1629 .2297 .1656 .2308 .1945

1000 .1690 .1686 .1283 .1688 .1285 .1699 .1464

0.3

100 .4920 .4995 .3504 .4988 .3468 .4956 .4286

200 .3485 .3504 .2593 .3499 .2533 .3491 .3091

500 .2284 .2272 .1821 .2261 .1782 .2266 .2040

1000 .1690 .1684 .1461 .1678 .1438 .1681 .1552

0.4

100 .4887 .4951 .3467 .4962 .3356 .4976 .4399

200 .3474 .3463 .2679 .3478 .2605 .3476 .3127

500 .2289 .2276 .1947 .2270 .1910 .2269 .2099

1000 .1689 .1673 .1523 .1669 .1502 .1667 .1573

0.5

100 .4933 .4943 .3541 .4940 .3390 .4996 .4516

200 .3472 .3458 .2777 .3456 .2687 .3462 .3161

500 .2292 .2278 .1960 .2269 .1913 .2271 .2099

1000 .1693 .1683 .1529 .1676 .1509 .1661 .1560

PB intervali bootstrap i përqindjes. BCa intervali me zhvendosje të korrigjuar dhe i përshpejtuar.


82


SP, me nivel 1 0.95 , për parametrin d, tek modelet ARFIMA(0,d,0).



0.1

100 59.1 99.5 68.4 99.5 71.0 99.3 71.7

200 60.6 99.7 68.0 99.6 68.9 99.9 68.1

500 66.0 99.4 64.4 99.3 65.6 99.3 64.4

1000 63.4 100.0 65.2 100.0 65.6 100.0 65.0

0.2

100 58.7 99.8 63.8 99.7 66.9 96.9 68.5

200 59.5 99.9 63.4 99.9 64.6 98.2 65.9

500 61.8 98.9 64.5 98.4 67.8 94.9 66.4

1000 61.2 69.9 60.0 84.0 66.6 78.9 63.5

0.3

100 58.0 99.8 65.5 98.8 68.7 87.8 72.5

200 59.8 83.2 69.7 86.1 71.7 83.7 73.0

500 63.2 64.4 69.6 72.2 73.0 75.2 76.7

1000 60.7 65.7 71.1 72.4 75.1 75.3 77.0

0.4

100 57.2 72.5 68.8 74.8 71.6 77.0 75.7

200 59.3 63.1 71.9 69.6 72.8 76.7 80.0

500 60.0 68.3 70.8 69.5 72.6 78.3 80.3

1000 59.6 72.8 64.4 72.8 64.3 81.1 78.7

0.5

100 57.6 64.7 70.9 67.5 73.2 75.4 74.7

200 59.0 67.1 70.5 69.0 70.8 77.9 76.0

500 61.4 72.0 67.0 71.4 67.4 80.5 78.9

1000 62.0 73.4 69.2 73.3 68.5 81.3 79.6




SP, me nivel 1 0.95 , për parametrin d, tek modelet ARFIMA(0,d,0).



0.1

100 .3551 .8300 .6427 .8270 .6678 .8139 .6670

200 .2963 .6755 .4978 .6744 .5121 .6686 .5120

500 .2280 .5140 .3590 .5136 .3679 .5148 .3694

1000 .1890 .4214 .2774 .4206 .2857 .4213 .2824

0.2

100 .3581 .8309 .5830 .8270 .6121 .8122 .6250

200 .2962 .6748 .4393 .6735 .4662 .6636 .4772

500 .2318 .5143 .2994 .5125 .3298 .5116 .3263

1000 .1873 .4212 .2213 .4181 .2556 .4188 .2444

0.3

100 .3662 .8285 .5533 .8247 .5715 .8077 .6025

200 .2998 .6730 .4158 .6694 .4435 .6645 .4842

500 .2305 .5081 .3026 .5069 .3239 .5042 .3609

1000 .1886 .4143 .2404 .4169 .2585 .4158 .2901

0.4

100 .3634 .8251 .5309 .8244 .5452 .8168 .6183

200 .3060 .6674 .4010 .6705 .4160 .6640 .5041

500 .2312 .5031 .3044 .5086 .3101 .5054 .3968

1000 .1907 .4093 .2343 .4172 .2424 .4134 .3243

0.5

100 .3667 .8219 .4955 .8255 .5079 .8223 .6123

200 .3049 .6611 .3928 .6687 .3981 .6668 .5104

500 .2356 .4981 .2818 .5073 .2838 .5043 .3979

1000 .2215 .4156 .2301 .3985 .2512 .3887 .2925



83

Tabela 3.12 Gabimi (empirik) i llojit të parë, në përqindje, i kriterit bootstrap SP për

verifikimin e hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti AR(1).

n Cikle për

bllok

Niveli

(%)

Koeficienti i autoregresit, φ1

0 0.1 0.3 0.5

100

2 10 6.4 12.0 15.6 17.9

5 1.9 5.9 10.4 10.8

4 10 6.4 9.9 13.9 17.1

5 2.5 5.5 8.1 10.4

6 10 6.8 12.2 14.1 17.4

5 2.0 6.1 7.9 11.4

8 10 7.6 12.5 20.7 23.0

5 2.7 6.3 12.1 16.0

10 10 21.0 21.1 18.9 27.9

5 13.3 14.8 12.4 18.4

300

2 10 0.2 0.4 0.9 1.5

5 0.0 0.0 0.0 0.4

4 10 11.4 11.3 13.7 12.7

5 5.7 5.7 7.4 6.3

6 10 10.4 12.3 13.9 13.3

5 5.6 7.0 7.4 5.7

8 10 11.4 11.3 13.7 12.7

5 5.7 5.7 7.4 6.3

10 10 10.4 12.3 13.9 13.3

5 5.6 7.0 7.4 5.7

500

2 10 0.0 0.0 0.5 1.1

5 0.0 0.0 0.0 0.0

4 10 0.6 2.0 2.4 3.8

5 0.1 0.1 0.3 1.2

6 10 4.4 6.6 5.1 6.9

5 2.3 2.1 2.8 3.4

8 10 8.8 8.4 9.1 12.3

5 4.4 3.5 4.9 6.7

10 10 10.3 10.8 9.7 11.8

5 4.8 5.3 5.2 5.6

12 10 9.4 10.1 9.4 11.1

5 5.1 5.9 4.5 5.3

84


hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti ARFIMA(1,d,0), 0.1d .

n Cikle për

bllok

Niveli

(%)


0 0.1 0.3 0.5

100

2 10 4.5 6.5 11.6 13.7

5 0.7 3.1 5.8 8.0

4 10 3.4 8.9 11.1 14.8

5 1.1 3.9 5.3 7.5

6 10 8.0 11.5 16.5 19.7

5 3.2 5.0 8.6 10.7

8 10 16.6 22.0 27.0 29.9

5 7.0 11.0 18.2 19.4

10 10 15.6 23.9 11.4 15.8

5 8.4 15.9 5.0 8.5

300

2 10 0.0 2.6 6.3 8.0

5 0.0 0.6 1.6 2.9

4 10 0.4 3.6 7.4 10.2

5 0.0 0.7 2.5 4.4

6 10 1.6 6.9 11.0 15.6

5 0.2 2.0 4.9 6.5

8 10 6.9 13.4 17.6 19.2

5 2.0 5.5 8.9 9.8

10 10 18.6 37.6 11.9 21.0

5 10.8 27.7 5.0 12.5

500

2 10 0.0 0.0 0.2 4.4

5 0.0 0.0 0.0 0.8

4 10 0.4 1.3 3.4 11.0

5 0.1 0.1 1.4 4.3

6 10 3.8 6.0 9.2 17.7

5 0.7 1.5 3.5 9.0

8 10 8.1 8.4 11.3 19.3

5 2.0 2.7 4.8 9.0

10 10 9.0 10.2 11.2 21.7

5 3.8 5.0 5.9 11.2

12 10 9.3 12.0 12.5 19.8

5 5.3 6.8 8.9 17.8

85



n Cikle për

bllok

Niveli

(%)


0 0.1 0.3 0.5

100

2 10 6.4 11.7 15.9 20.2

5 1.4 5.5 7.6 10.7

4 10 8.5 15.1 18.2 18.8

5 1.9 7.8 8.2 11.0

6 10 15.3 16.5 26.5 30.4

5 5.7 7.5 15.0 21.6

8 10 30.6 35.2 43.4 48.8

5 16.3 22.8 30.2 37.3

10 10 25.4 28.8 34.4 58.2

5 14.8 18.6 25.6 47.2

300

2 10 3.4 11.8 20.6 24.0

5 0.4 3.8 8.3 12.0

4 10 5.2 15.7 20.4 23.6

5 1.1 4.7 8.1 11.8

6 10 13.9 22.7 28.4 29.6

5 5.0 9.8 15.8 15.9

8 10 31.1 36.3 39.9 40.6

5 15.8 21.8 25.6 26.7

10 10 25.6 28.2 32.9 41.3

5 13.9 14.9 19.8 26.6

500

2 10 0.8 2.7 9.4 26.3

5 0.1 0.3 2.3 12.7

4 10 12.7 16.6 24.9 37.7

5 3.8 6.2 10.8 23.5

6 10 22.3 25.1 32.2 44.5

5 11.3 11.5 17.5 27.9

8 10 26.4 28.9 36.6 46.1

5 14.3 14.9 23.0 28.2

10 10 31.2 36.7 35.5 42.8

5 16.5 22.8 22.4 27.8

12 10 36.1 38.3 41.2 52.5

5 22.4 23.7 29.4 35.2

86



n Cikle për

bllok

Niveli

(%)


0 0.1 0.3 0.5

100

2 10 15.2 26.0 30.8 34.0

5 5.7 11.1 18.4 20.0

4 10 21.6 27.7 33.5 40.1

5 9.3 14.9 20.6 26.0

6 10 30.5 34.5 40.0 47.6

5 15.7 20.1 27.3 36.2

8 10 46.5 51.4 59.2 68.6

5 30.7 36.3 48.0 57.6

10 10 38.9 43.9 55.3 74.0

5 25.7 29.9 42.7 64.7

300

2 10 22.2 42.4 46.6 51.2

5 9.4 22.3 29.5 33.0

4 10 27.9 44.3 49.2 22.2

5 12.8 26.0 31.7 9.4

6 10 42.4 50.6 55.9 27.9

5 25.6 32.7 38.1 12.8

8 10 57.8 63.6 68.6 42.4

5 41.1 45.6 50.5 25.6

10 10 51.3 54.5 58.1 68.5

5 34.9 38.2 42.6 54.5

500

2 10 19.9 28.9 46.7 65.5

5 6.9 14.4 25.9 50.0

4 10 49.9 51.3 62.7 70.0

5 28.6 32.9 45.7 54.8

6 10 58.1 60.5 64.8 71.7

5 42.1 42.9 48.9 56.2

8 10 61.3 65.2 67.4 72.3

5 45.7 48.4 52.1 56.5

10 10 61.3 65.8 68.4 73.0

5 46.9 49.5 52.7 59.3

12 10 65.8 65.5 72.8 75.3

5 49.2 45.6 55.1 58.4

87



n Cikle për

bllok

Niveli

(%)


0 0.1 0.3 0.5

100

2 10 36.8 43.0 59.0 80.3

5 20.9 26.7 45.5 70.9

4 10 37.5 53.8 72.8 56.2

5 22.2 37.0 62.2 44.8

6 10 49.4 68.6 50.7 62.0

5 32.7 56.2 36.9 48.4

8 10 64.1 46.0 57.7 73.4

5 46.0 30.8 42.5 64.8

10 10 43.1 46.2 65.9 86.8

5 24.8 31.6 54.6 79.6

300

2 10 59.7 65.1 74.1 81.1

5 38.4 45.4 58.2 68.3

4 10 66.6 72.0 76.9 80.8

5 49.9 58.2 62.7 67.8

6 10 75.1 75.8 78.0 82.8

5 60.1 59.1 63.1 68.9

8 10 75.2 80.2 73.8 80.5

5 60.3 66.7 58.4 66.0

10 10 73.5 83.9 76.3 81.3

5 58.6 72.9 62.5 72.0

500

2 10 69.5 71.1 82.3 89.8

5 46.6 55.4 67.9 80.5

4 10 83.6 83.5 86.8 89.0

5 70.0 72.9 75.2 80.5

6 10 86.3 86.7 88.1 89.8

5 72.7 75.3 76.7 81.1

8 10 85.2 88.0 87.1 91.5

5 75.9 77.4 78.6 84.6

10 10 87.3 86.3 87.7 91.3

5 76.2 76.2 79.3 82.7

12 10 86.8 85.4 90.2 92.6

5 77.2 75.4 79.5 81.9

88

Tabela 3.17 Gabimi (empirik) i llojit të parë, në përqindje, i kriterit R/S i modifikuar

për verifikimin e hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti AR(1).

φ1 n Cungimi qL, (3.22a) Cungimi qW, (3.22b) Cungimi qM, (3.22b)

Asimp Boot Asimp Boot Asimp Boot

0.1

100 5.8 7.4 0.9 4.8 5.3 8.3

200 5.4 7.5 1.4 6.3 6.1 9.1

300 5.4 6.9 2.6 5.7 5.7 7.9

500 5.3 6.4 2.6 5.0 5.3 7.2

1000 6.1 6.2 4.0 5.8 6.2 6.9

0.4

100 3.4 6.9 2.0 5.8 5.7 8.4

200 4.9 6.6 2.5 6.7 6.8 8.6

300 3.4 5.4 2.6 4.9 5.8 5.5

500 3.9 4.9 2.6 4.3 5.6 5.9

1000 5.3 5.5 4.6 5.3 6.6 5.6

0.5

100 2.7 5.8 1.9 4.5 4.1 8.4

200 2.9 6.0 2.3 5.5 6.8 7.5

300 2.6 4.5 2.7 4.9 5.9 5.5

500 3.5 5.6 3.3 5.8 7.1 6.5

1000 3.7 4.5 3.8 4.3 5.1 5.3

0.9

100 1.0 2.9 0.5 7.2 0.5 5.6

200 1.4 4.1 4.5 10.4 1.7 8.9

300 2.0 4.0 9.8 8.2 3.4 5.8

500 2.1 4.8 15.8 7.9 6.2 7.0

1000 2.3 4.3 12.6 6.0 6.5 5.7

Asimp përdor shpërndarjen asimptotike. Boot përdor shpërndarjen bootstrap.

Tabela 3.18 Fuqia (empirike), në përqindje, e kriterit R/S i modifikuar për verifikimin

e hipotezave 0 : 0H d kundrejt 1 : 0H d . Rasti ARFIMA(0,d,0).

d n Cungimi qL, (3.22a) Cungimi qW, (3.22b) Cungimi qM, (3.22b)

Asimp Boot Asimp Boot Asimp Boot

0.05

100 4.0 9.9 0.3 5.9 6.2 10.5

200 5.8 11.4 1.1 5.6 7.0 12.4

300 6.0 10.6 1.6 6.1 7.8 12.6

500 7.5 11.7 3.4 6.3 9.1 14.2

1000 10.4 12.6 5.3 8.5 11.7 13.5

0.25

100 3.8 17.2 0.8 6.3 19.5 26.5

200 17.1 26.6 3.2 16.0 40.3 35.0

300 24.6 29.4 8.4 20.5 48.4 39.0

500 38.0 37.9 22.7 30.3 64.4 48.2

1000 54.9 51.8 39.0 41.8 79.9 60.2

0.30

100 3.5 17.6 0.8 6.7 23.9 28.2

200 13.3 23.4 3.5 16.9 43.3 33.6

300 27.6 33.4 14.3 25.4 61.0 45.0

500 42.1 41.4 30.6 35.4 71.3 51.1

1000 58.5 53.4 47.7 48.4 84.3 63.7

0.45

100 1.0 11.9 0.7 10.9 32.3 28.2

200 6.4 23.6 9.3 25.3 56.3 38.0

300 18.6 30.8 28.8 34.9 68.3 45.5

500 39.4 41.3 52.6 48.6 81.8 57.2

1000 65.1 61.5 75.9 65.2 92.9 72.6

Asimp përdor shpërndarjen asimptotike. Boot përdor shpërndarjen bootstrap.

89

PËRFUNDIME

Në këtë tezë u prezantua koncepti i memories së gjatë ose varësisë afatgjatë, i një

serie kohore stacionare. Ky koncept është i lidhur ngushtë me strukturën e rendit të

dytë të një serie kohore stacionare dhe ndikon drejtpërdrejt në konkluzionet

statistikore. Ekzistenca e memories së gjatë sjell ndryshimin e rendit të konvergjencës

së autokorrelacioneve të serisë si dhe të dispersionit të mesatares së zgjedhjes.

Gjithashtu ne prezantuam metodat e rizgjedhjes bootstrap për seritë kohore duke

propozuar një metodë bootstrap me blloqe të përbërë nga cikle.

Në kapitullin e parë të tezës u qartësua se ekzistojnë modele të ndryshme për

përshkrimin e memories së gjatë dhe jepet një përshkrim i tyre. Ndër to mund të

veçojmë modelet ARFIMA(p,d,q), të cilat janë një përgjithësim i modeleve me

memorie të shkurtër ARIMA(p,d,q). Në literaturë ekzistojnë metoda të shumta për

evidentimin dhe vlerësimin e memories së gjatë. Në kapitullin e parë përshkruhen disa

prej tyre. Do të veçonim vlerësuesit gjysmë parametrikë të periodogramës GPH

(Geweke dhe Porter-Hudak, 1981) dhe SP (Reisen, 1994). Përdorimi i tyre kërkon

vetëm përcaktimin e densitetit spektral të një serie kohore rreth origjinës pa qenë

nevoja e përcaktimit të parametrave të pjesë ARMA të modelit.

Metodat bootstrap, të prezantuara nga Efron (1979), janë metoda me rizgjedhje shumë

të përhapura në kohët e sotme. Kjo kryesisht për faktin se ato janë të thjeshta në

përdorim dhe mund të përdoren për statistika sado të ndërlikuara, duke dhënë shpesh

herë rezultate të përmirësuara në lidhje me metodat klasike (veçanërisht kur vëllimi i

zgjedhjes është relativisht i vogël). Në kapitullin e dytë jepet një përmbledhje të

metodave bootstrap për rizgjedhje nga vrojtime të tipit seri kohore, që përdoren më

shpesh në literaturë. Mund të veçojmë metodat bootstrap me blloqe, që përdoren për

të përsëritur në mënyrë joparametrike një seri kohore stacionare. Karakteristika e

përbashkët e metodave bootstrap me blloqe është fakti se ato kryejnë rizgjedhje me

blloqe vrojtimesh të njëpasnjëshme. Metoadat e ndryshme ndryshojnë nga mënyra e

përcaktimit të blloqeve.

Në kapitullin e tretë ne propozuam një metodë bootstrap për seritë kohore, bootstrapin

me blloqe të formuar nga cikle. Cikli është përcaktuar si një çift vargjesh me vrojtime

të njëpasnjëshme që ndodhen nën dhe mbi vlerën mesatare (ose anasjelltas). Ekonomi

dhe Butka (2011) kanë treguar se kjo metodë mund të jetë e dobishme në vlerësimin

pikësor të parametrit d të proceseve ARFIMA(0,d,0). Butka dhe Capollari (2013a,b),

Butka dhe Beta (2014), Butka etj. (2014), kanë treguan efikasitetin e kësaj metode për

vlerësimin pikësor dhe intervalor të parametrit të memories, si dhe për realizimin e

kontrollit të hipotezave rreth memories së gjatë. Nga eksperimentet Monte Carlo të

zhvilluara në vazhdim të kapitullit të tretë, arrijmë në konkluzionin se metoda

bootstrap me blloqe me cikle përmirëson vlerësimet pikësore dhe intervalore të

parametrit të memories. Krahasuar me metoda të tjera bootstrap me blloqe, si MBB

(Kunsch, 1989) dhe SB (Politis dhe Romano, 1994), metoda e propozuar në këtë tezë

performon më mirë në kuptimin e një gabimi katror mesatar më të vogël të

vlerësimeve pikësore dhe një probabilitet mbulimi më të madh të intervaleve të

besimit. Gjithashtu përdorimi i kësaj metode jep teste për kontrollin e ekzistencës së

memories së gjatë me gabim të llojit të dytë më të vogël se sa testi përkatës asimptotik

duke ruajtur gabimin e llojit të parë afër vlerave të përcaktuara.

Rezultatet e përftuara varen, ndër të tjera, nga numri i cikleve për bllok. Ky numër

përcakton gjatësinë mesatare të një blloku. Përcaktimi i numrit optimal të cikleve për

90

bllok varet nga disa faktorë, si natyra e autokorrelacioneve të serisë, ekzistenca ose jo

e pjesës ARMA të modelit, gjatësia e serisë, etj.

Gjetja e ndonjë algoritmi për përcaktimin empirik të numrit të cikleve për bllok është

objekt i studimeve të ardhshme. Gjithashtu mendojmë se, idea e kryerjes së

rizgjedhjeve të cikleve brenda çdo blloku të rizgjedhur do të ishte me interes për të

ardhmen.

Një tjetër aspekt i synimeve të ardhshme do të jetë marrja në konsideratë e aplikimit

të metodave bootstrap në ndonjë seri kohore, mundësisht me të dhëna nga vendi ynë,

që mund të shfaqë karakteristika të një procesi me memorie të gjatë.

SHTOJCA

1. Shpërndarja e gjatësisë së ciklit

Në këtë shtojcë tregohet vërtetësia e tabelës së densitetit probabilitar të gjatësisë së

ciklit të formuar nga procesi zhurmë e bardhë gausiane, { }t (shih tabelën 3.1).

Duke pasur parasysh përcaktimin e ciklit i dhënë në paragrafin 3.1, mund të themi që,

një cikël me fillim në kohën t, ka gjatësi tL k , atëherë dhe vetëm atëherë kur 0t ,

1 0t k , 0t k (ose anasjellas 0t , 1 0t k , 0t k ) dhe ndryshoret

ndërmjet t dhe 1t k , (gjithsej 2k të tilla) të jenë një kombinim i një numri

vlerash pozitive (mund të jenë dhe zero vlera) të ndjekur nga një varg vlerash negative

(ose anasjellas). Probabiliteti i çdo kombinimi është i njëjtë dhe nga pavarësia e

procesit kemi që ky probabilitet është 1

1

2k. Me që gjithsej janë 1k kombinime për

çdo alternim të shenjës se termit të parë të ciklit, atëherë marrim formulën e

përgjithshme të shpërndarjes probabilitare, sipas barazimit të mëposhtëm

1

1 1( ) 2( 1)

2 2t k k

kP L k k

Për shembull, për të pasur barazimin 1 5L , pra 5k , duhet dhe mjafton që të

ndodhë një prej këtyre rasteve që përjashtojnë njëri tjetrin (në këtë rast 1t ).

r.1: 1 0 , 2 0 , 3 0 , 4 0 , 5 0 dhe 6 0 ; (3 pozitive + 0 negative)




si dhe rastet r.5, r.6, r.7 dhe r.8, që merren si më sipër duke ndërruar shenjen e

mosbarazimeve.

Pra gjithsej janë 8=2(5-2+1) kombinime (raste). Probabiliteti i secilit rast është

6 5 1

1 1

2 2 . Pra kemi

1 5 1 5

1 5 1( 5) 2(5 1)

2 2P L

).

91

2. Karakteristikat e shpërndarjes së gjatësisë së ciklit

Në këtë shtojcë ne tregojmë disa karakteristika numerike si, asimetria dhe sheshtësia e

ndryshores së rastit së gjatësisë së ciklit nga një zhurmë e bardhë gausiane.

Së pari tregojmë barazimet (3.1) që përdorëm tek paragrafi 3.2.1.

Shqyrtojmë serinë funksionale1

1( )

k

k

f xx

, e cila konvergjon uniformisht për x>1,

pra dhe në një fqinjësi të 2, për të cilin ne interesohemi. Nga formula e progresionit

gjeometrik është i vërtetë barazimi

1

1 1

1

k

k x x

(Sh.1)

Barazimi i parë i barazimeve (3.1) rrjedh menjëherë nga zëvendësimi i x me 2 tek

barazimi (Sh.1) duke përftuar

1

1 1

2 2kk

(Sh.2)

Nga derivimi anë për anë i brazimit (Sh.1) marrim

1

21

1 1

1

k

k

kx x

(Sh.3)

(ne interesohemi për x = 2, pra shqyrtojmë funksionin f në një fqinjësi të 2). Atëherë,

zëvendësojmë përsëri x=2 dhe pas veprimesh gjejmë barazimin

1

1 11

2 2kk

k

, prej nga 1

12

2kk

k

(Sh.4)

Më tej derivojmë barazimin (Sh.3) dhe gjejmë

2

31

1 2( 1)

1

k

k

k kx x

(Sh.5)

Përsëri, zëvendësojmë x=2, kryejmë veprime dhe gjejmë

2

1 1

12

4 2 2k kk k

k k

prej nga

2

1

62k

k

k

(Sh.6)

Duke vepruar si më sipër, hap pas hapi gjejmë barazimet

3

1

262k

k

k

(Sh.7)

4

1

1502k

k

k

(Sh.8)

5

1

10822k

k

k

(Sh.9)

92

Duke përdorur barazimet e mësipërme ne mund të gjejmë lehtësisht parametrat e

shpërndarjes së gjatësisë Lt të ciklit.

a) Pritja matematike dhe dispersioni janë të dyja të barabarta me 4, siç është treguar

tek paragrafi 3.2.1.

b) Për të gjetur asimetrinë, nisemi nga përkufizimi i Pirsonit

3X

E

, ku ( )E X dhe ( )D X . Atëherë, zëvendësojmë, dhe pas

veprimesh gjejmë

33 3

3

( ) ( ) 3 ( ) ( ) [ ( )]

( ) ( )

t t t t t t

tt

L E L E L E L D L E LE

D L D L

(Sh.10)

Për të gjetur momentin fillestar të rendit të tretë kryejmë veprimet

4 3 4 33 3

2 2 2 1 1

1( )

2 2 2 2 2t k k k k k

k k k k k

k k k k kE L k

dhe, duke shfrytëzuar barazimet

(Sh.7) dhe (SH.8), gjejmë

3( ) 124tE L (Sh.11)

Përfundimisht, zëvendësojmë tek barazimi (Sh.10) dhe, pas veprimesh, gjejmë

3

3

124 3 4 4 4 3

2 2

(Sh.12)

c) Në mënyrë të ngjashme veprohet për të gjetur koeficienti e sheshtësisë

4 4

4 4

( 43 3

2( )

t t t

t

E L E L E L

D L

, dhe pasi gjejmë, nga barazimet (Sh.8)

dhe (Sh.9), momentin e rendit të katërt

4( ) 932tE L (Sh.13)

vazhdojmë me veprimet dhe marrim rezultatin e treguar tek barazimi (3.6)

4 3 2

4

( ) 16 ( ) 96 ( ) 256 ( ) 256 100 133 3

2 16 4

t t t tE L E L E L E L

(Sh.14)

3. Një shënim për komandën “b.star”

Shënim: Tek komanda 'b.star', në se përdoret argumenti "round=TRUE" dhe

argumenti x është matricë me disa shtylla, atëherë vlerat e gjetura të gjatësisë së

bllokut për metodën CB kanë (gabimisht) të njëjtën vlerë për çdo shtyllë, dhe

pikërisht maksimumin e gjatësive të të gjithë shtyllave.

93

Vërejmë se duhet bërë një korrigjim tek rreshti i katërt nga fundi:

Është:

“BstarCB <− ifelse(BstarCB > Bmax, Bmax, ifelse(BstarCB < 1, 1, max(1,

round(BstarCB))))”

Duhet:

“BstarCB <− ifelse(BstarCB > Bmax, Bmax, ifelse(BstarCB < 1, 1,

round(BstarCB))))”

94

LITERATURA

Abramowitz, M., Stegun, I. (1964): Handbook of Mathematical Functions with

Formulas, Graphs, and Mathematical Tables. Dover, New York.

Agiakloglou, C., Newbold, P., Wohar, M. (1993): Bias in an estimator of the

fractional difference parameter. Journal of Time Series Analysis, Vol. 14, No. 3, 235-

246.

Anderson, T.W., Walker, A.M. (1964): On the asymptotic distribution of the

autocorrelations of a sample from a linear stochastic processes. Annals of

Mathematical Statistics, Vol. 35, No. 3, 1296-1303.

Andrews, D., Lieberman, O., Marmer, V. (2006): Higher-order improvements of the

parametric bootstrap for long memory Gaussian processes. Journal of Econometrics,

Vol. 133, 673-702.

Arteche, J., Orbe, J. (2009): Using the bootstrap for finite sample confidence intervals

of the log periodogram regression. Computational Statistics and Data Analysis, Vol.

53, No. 6, 1940-1953.

Arteche, J., Orbe, J. (2014): A bootstrap approximation for the distribution of the

local Whittle estimator. IVt Workshop in Time Series Econometrics, Universidad de

Zaragoza, Spain.

Babu, G. J., Singh, K. (1983): Inference on means using the bootstrap. The Annals of

Statistics, Vol. 11, No. 3, 999-1003.

Baillie, R.T. (1996): Long memory processes and fractional integration in

econometrics. Journal of Econometrics, Vol. 73, 5-59.

Beran, J. (1994): Statistics for Long Memory Processes. Chapman & Hall, New York.

Bhattacharya, R., Gupta, V., Waymire, W. (1983): The Hurst effect under trends.

Journal of Applied Probability, Vol. 20, 649-662.

Bickel, P.J., Buhlmann, P. (1999): A new mixing notion and functional central limit

theorems for a sieve bootstrap in time series. Bernoulli, Vol. 5, No. 3, 413-446.

Bose, A. (1988): Edgeworth correction by bootstrap in autoregressions. The Annals of


Box, G.E.P., Jenkins, G.M. (1976): Time Series Analysis Forecasting and Control, 2nd

edition. Holden-Day, San Francisco.

Brockwell, P.J., Davis, R.A. (1991): Time Series: Theory and Methods, 2nd

edition.

Springer-Verlag, New York (paperback in 2009).

Buhlmann, P. (1997): Sieve bootstrap for time series. Bernoulli, Vol. 3, No. 2, 123-

148.

Burlaga, L., Klein, L. (1986): Fractal structure of the interplanetary magnetic field.

Journal of Geophysical Research, Vol. 91, No. A1, 347-350.

Butka, A., Beta, Dh. (2014): Bootstrap estimation of long-range dependence in

ARFIMA processes. Journal of Advances in Mathematics, Vol. 7, No. 2, 1266-1276.

Butka, A., Capollari, Gj. (2013a): A bootstrap approach for detection of long range

dependence. Proceedings Papers V1 of the first international scientific conference on

95

"research and education – challenges towards the future "(ICRAE 2013), University

of Shkodra Luigj Gurakuqi”, Shkodra, Albania.

Butka, A., Capollari, Gj. (2013b): Bootstrap confidence intervals for the fractional

difference parameter in ARFIMA model. Proceedings of the Fifth International

Scientific Conference – FMNS2013, South-West University “Neofit Rilski”,

Blagoevgrad, Vol. 1, 60-66.

Butka, A., Puka, Ll., Palla, I. (2014): Bootstrap testing for long range dependence.

International Journal of Mathematics Trends and Technology, Vol. 8, No. 3, 164-172.

Cao, R., Febrero-Bande, M., Gonzalez-Manteiga, W., Prada-Sanchez, J. M., Garda-

Jurado, I. (1997): Saving computer time in constructing consistent bootstrap

prediction intervals for autoregressive processes. Communications in Statistics -

Simulation and Computation, Vol. 26, No. 3, 961-978.

Carlstein, E. (1986): The use of subseries methods for estimating the variance of a

general statistic from a stationary time series. The Annals of Statistics, Vol. 14, No. 3,

1171-1179.

Carlstein, E., Do, K-A., Hall, P., Hesterberg, T., Kunsch, H. R. (1998): Matched-

block bootstrap for dependent data. Bernoulli, Vol. 4, No. 3, 305-328.

Carpenter, J., Bithell, J. (2000): Bootstrap confidence intervals: when, which, what? A

practical guide for medical statisticians.

Cavazos-Cadena, R. (1994): The asymptotic distribution of the sample

autocorrelations for a class of linear filters. Journal of Multivariate Analysis, Vol. 48,

249-274.

Chatfield, C. (1980): Inverse Autocorrclations, Journal of the Royal Statistical Society

A, Vol. 142, 363-377.

Chen, G., Abraham, B. and Peiris, S. (1993): Lag window estimation of the degree of

differencing in fractionally integrated time series model. Journal of Time Series

Analysis, Vol. 15, No. 5, 473-487.

Chernick, M.R. (2008): Bootstrap Methods: A Guide for Practitioners and

Researchers, 2nd

Edition. John Wiley & Sons, New Jersey.

Cleveland, W.P. (1972): The Inverse Autocorrelations of a Time Series and their

Applications. Technometrics, Vol. 14, 277-298.

Cox, D. R. (1984): Long-range dependence: a review. Statistics: an appraisal, H.A.

David and H.T. David eds., Iowa State University Press, 1984, 55-74.

Dahlhaus, R. (1989): Efficient parameter estimation for self-similar processes. Annals

of Statistics, Vol. 17, No. 4, 1749-1766.

Datta, S., Sriram, T. N. (1997): Bootstrap inference for a first-order autoregression

with positive innovations. Journal of the American Statistical Association, Vol. 90,

No. 432, 1289–1300.

Davidson, J. (1997): Stochastic Limit Theory. Oxford University Press.

Davidson, R., MacKinnon, J. G. (2000). Bootstrap Tests: How Many Bootstraps?

Econometric Reviews, Vol. 19, No. 1, 55-68.

Davison, A. C., Hinkley, D. V. (1997). Bootstrap methods and their application.

Cambridge University Press, USA.

96

Devaney, R. (1999). The Mandelbrot set, the farey tree, and the fibonaçi sequence.

The American Mathematical Monthly, Vol. 106, No.4, 289-302.

DiCiccio, T. J., Efron, B. (1996): Bootstrap confidence intervals. Statistical Science,

Vol. 11, No. 3, 189-212.

Efron, B. (1979): Bootstrap methods: another look at the jackknife. The Annals of


Efron, B. (1982): The Jackknife, Bootstrap, and Other Resampling Plans. Siam

monograph, No. 38, CBMS-NSF, Regional conference series in applied mathematics,

Philadelphia.

Efron, B. (1987): Better bootstrap confidence intervals, Journal of the American

Statistical Association, Vol. 82, No. 397, 171-185.

Efron, B., Tibshirani, R.J. (1993): An Introduction to the Bootstrap. Chapman & Hall.

Ekonomi, L., Butka, A. (2011): Jackknife and bootstrap with cycling blocks for the

estimation of fractional parameter in ARFIMA model. Turkish Journal of

Mathematics, Vol. 35, No. 1, 151-158.

Ekonomi, L., Butka, A. (2014): The validity of the bootstrap with cycling blocks in

stationary time series. Pensee Journal, Vol. 76, No. 3, 285-303.

Fox, R., Taqqu, M.S. (1986): Large-sample properties of parameter estimates for

strongly dependent stationary Gaussian time series. The Annals of Statistics, Vol. 14,

No. 2, 517-532.

Franco, G.C., Reisen, V.A. (2004): Bootstrap techniques in semiparametric estimation

methods for ARFIMA models: a comparison study. Computational Statistics & Data

Analysis, Vol. 19, 243–259.

Franco, G.C., Reisen, V. A. (2007): Bootstrap approaches and confidence intervals for

stationary and non-stationary long-range dependence. Physica A, Vol. 375, No. 2,

546-562.

Geweke, J., Porter-Hudak, S. (1983): The estimation and application of long memory

time series model. Journal of Time Series Analysis, Vol. 4, No. 4, 221-238.

Giriatis, L., Robinson, P., Surgailis, D. (1999): Variance-type estimation of long

memory. Stochastic Processes and their Applications, Vol. 80, 1-24.

Granger, C.J., Joyex, R. (1980): An introduction to long-memory time series and

fractional differencing. Journal of Time Series Analysis, Vol. 1, No. 1, 15-29.

Guegan, D. (2005): How can we define the concept of long memory? An Econometric

Survey. Econometric Reviews, Vol. 24, No. 2, 113-149.

Hall, P. (1988): Theoretical comparison of bootstrap confidence intervals. The Annals


Hall, P. (1992): Effect of bias estimation on coverage açuracy of bootstrap confidence

intervals for a probability density. The Annals of Statistics, Vol. 20, No. 2, 675-694.

Hall, P., Horowitz, J. L. (1996): Bootstrap critical values for tests based on

generalized-method-of-moments estimators. Econometrica, Vol. 64, No. 4, 891-916.

Hall, P., Horowitz, J. L., Jing, B. (1995): On blocking rules for the bootstrap with

dependent data. Biometrika, Vol 82, No. 3, 561-574.

97

Hall, P., Wilson, S. R. (1991): Two guidelines for bootstrap hypothesis testing.

Biometrics, Vol. 47, No. 2, 757-762.

Hannan, E. (1973): The asymptotic theory of linear time series models. Journal of

Applied Probability, Vol. 10, 130-145.

Haslett, J., Raftery, A.E. (1989): Space-time modeling with long-memory

dependence: assessing Ireland’s wind power resource. Applied Statistics, Vol. 38, No.

1, 1-50.

Hesterberg, T. (1997): Matched-Block Bootstrap for long Memory Processes.

Technical Report No. 66, Research Department, MathSoft, Inc. 1700 Westlake Ave.

N., Suite 500, Seattle, WA 98109.

Higuchi, T. (1988): Approach to an irregular time series on the basis of the fractal

theory. Physica D: Nonlinear Phenomena, Vol. 31, No. 2, 277-283.

Hinkley, D. V. (1988): Bootstrap methods. Journal of the Royal Statistical Society.

Series B (Methodological), Vol. 50, No. 3, 321-337.

Hosking, J.R.M. (1981): Fractional differencing. Biometrica, Vol 68, No. 1, 165-176.

Hosking, J.R.M. (1996): Asymptotic distributions of the sample mean,

autocovariances, and autocorrelations of long-memory time series. Journal of

Econometrics, Vol. 73, 261-284

Hurst, H. (1951): Long-term storage capacity of reservoirs. Transactions of the

American Society of Civil Engineers, vol. 116, 770-799.

Hurvich, C., Deo, R., Brodsky,J. (1998): The mean squared error of Geweke and

Porter-Hudak’s estimator of the memory parameter of a long-memory time series.

Journal of Time Series Analysis, Vol. 19, No. 1, 19-46.

Kapetanios, G., Papailias, F. (2011): Block bootstrap and long memory. Working

Papers No. 679, Queen Mary, University of London.

Kapetanios, G., Psaradakis, Z. (2006): Sieve bootstrap for strongly dependent

stationary processes. Working Papers No. 552, Queen Mary, University of London.

Kim, Y. M., Nordman, D. J. (2011): Properties of block bootstrap under long-range

dependence. Sankhya A., Vol. 73, No. 1, 79-109.

Kolmogorov, A.N. (1941): Local structure on turbulence in incompressible fluid for

very large Reynolds numbers. C.R. Acad. Sci. U.R.S.S., Vol. 30, 299-303. (translated

in English by Levin, V. (1991): Turbulence and Stochastic Process: Kolmogorov's

Ideas 50 Years On (Jul. 8, 1991), Proceedings: Mathematical and Physical Sciences,

Vol. 434, No. 1890, 9-13, Published by: The Royal Society).

Kreiss, J. (1992): Bootstrap procedures for AR(∞)-processes. In: Jockel, K.H., Rothe,

G., Sendler, W. (Eds.), Bootstrapping and Related Techniques. Springer, Heidelberg,

107-113.

Kreiss, J. and Paparoditis, E. (2003): Autoregressive-aided periodogram bootstrap for

time series. The Annals of Statistics, Vol. 31, No. 6, 1923-1955.

Kunsch, H. R. (1987): Statistical aspects of self-similar processes. Proceedings of the

First World Congress of the Bernoulli Society, VNU Science Press, Utrecht, 1, 67-74.

Kunsch, H. R. (1989): The jackknife and the bootstrap for general stationary

observations. The Annals of Statistics, Vol. 17, No. 3, 1217-1241.

98

Lahiri, S. N. (1992): Edgeworth correction by ‘moving block’ bootstrap for stationary

and nonstationary data. Exploring the Limits of Bootstrap, John Wiley, New York,

183-214.

Lahiri, S. N. (1993): On the moving block bootstrap under long range dependence.

Statistics & Probability Letters, Vol. 18, No. 5, 405-413.

Lahiri, S. N. (1999): Theoretical comparisons of block bootstrap methods. The Annals


Lamperti, J. (1962): Semi-stable stochastic processes. Transactions of the American

Mathematical Society, Vol. 104, No. 1, 62-78.

Leland, W., Taqqu, M., Willinger, W., Wilson, D. (1994): On the self-similar nature

of Ethernet traffic. IEEE/ACM Transactions on Network, Vol. 2, No. 1, 1-15.

Lieberman, O., Rosemarin, R., Rousseau, J. (2012): Asymptotic theory for maximum

likelihood estimation of the memory parameter in stationary Gaussian processess.

Econometric Theory, Vol. 28, No. 2, 457-470.

Lo, A. W. (1991): Long-Term Memory on Stock Market Prices. Econometrica, Vol.

59, No. 5, 1279-1313.

MacKinnon, J. G. (2007): Bootstrap Hypothesis Testing. Working Paper, No. 1127,

Department of Economics, Queen’s University, Canada.

Mandelbrot, B.B. (1975): Limit theorems of the self-normalized range for weakly and

strongly dependent processes. Zeitschrift für Wahrscheinlichkeitstheorie und

Verwandte Gebiete, Vol. 31, No. 4, 271-285.

Mandelbrot, B.B. (1983): The fractal geometry of nature. Freeman, San Francisco.

Mandelbrot, B.B., Van Ness, J.W. (1968): Fractional Brownian motions, fractional

noises and applications. SIAM Review, Vol. 10, No. 4, 422-437.

Mandelbrot, B.B., Wallis, J.R. (1968): Noah, Joseph, and operational hydrology.

Water Resources Research, Vol. 4, No. 5, 909-918.

Mandelbrot, B.B., Wallis, J.R. (1969 a): Computer experiments with fractional

Gaussian noises, Part 1-3. Water Resources Research: 5, 228-267.

Mandelbrot, B.B., Wallis, J.R. (1969 b): Some long-run properties of geophysical

records (Global dependence in geophysical records). Water Resources Research: 5,

321-340.

Mandelbrot, B.B., Wallis, J.R. (1969 c): Robustness of the rescaled range R/S and the

measurement of the non-cycling long-run statistical dependence. Water Resources

Research, Vol. 5, 967-988.

McLeod, A. I., Hipel, K. W. (1978): Preservation of the rescaled adjusted range part

1. a reassessment of the Hurst phenomenon. Water Resources Research, Vol. 14, No.

3, 491-508.

Murphy, A., Izzeldin, M. (2009): Bootstrapping long memory tests: some Monte

Carlo results. Computational Statistics and Data Analysis, Vol. 53, No. 6, 2325-2334.

Naqo, M. (2005): Statistika Matematike. Tiranë, Shtëpia Botuese e Librit Universitar.

Newbold, P., Agiakloglou, C. (1993): Bias in the sample autocorrelations of fractional

noise. Biometrika, Vol. 80, No.3, 698-702.

99

Palma, W. (2007): Long-Memory Time Series: Theory and Methods. Wiley Series in

Probability and Statistics, Wiley, New Jersey.

Paparoditis, E., Politis, D.N. (1999): The Local Bootstrap for Periodogram Statistics.

Journal of Time Series Analysis, Vol. 20, No. 2, 193-222.

Paparoditis, E., Politis, D.N. (2002): Local block bootstrap. C. R. Acad. Sci. Paris,

Vol. 355, No. 11, 959-962.

Park, D., Willemain, T.R. (1999): The threshold bootstrap and threshold jackknife.

Computational Statistics & Data Analysis, Vol. 31, 187-202.

Patton, A., Politis, D.N., Whittle, H. (2009): CORRECTION TO `Automatic Block-

Length Selection for the Dependent Bootstrap' by D.N. Politis and H. White.

Econometric Reviews, Vol. 28, No. 4, 372-375.

Politis, D.N., Romano, J.P. (1991): A circular block-resampling procedure for

stationary data. Technical Report No. 370, National Science Foundation Grant

DMS89-57217.

Politis, D.N., Romano, J.P. (1994): The stationary bootstrap. Journal of the American

Statistical Association, Vol. 89, No. 428, 1303-1313.

Politis, D.N., White, H. (2004): Automatic block-length selection for the dependent

bootstrap. Econometric Reviews, Vol. 23, No.1, 53-70.

Puka, LL. (2010): Hyrje në proceset e rastit. Mediaprint, Tiranë.

Ramsey, F. L. (1974): Characterization of the partial autocorrelation function. Annals

of Statistics, Vol. 2, No.6, 1291-1301.

Reisen, V. A. (1994): Estimation of the fractional differencing parameter in the

ARIMA(p,d,q) model using the smoothed periodogram. Journal of Time Series

Analysis, Vol. 15, No. 3, 335-350.

Robinson, P. (1995a): Log-periodogram regression of time series with long range

dependence. The Annals of Statistics, Vol. 23, No. 3, 1048-1072.

Robinson, P. (1995b): Gaussian semiparametric estimation of long range dependence.

The Annals of Statistics, Vol. 23, No. 5, 1630-1661.

Romano, J. (1988): A bootstrap revival and some nonparametric distance tests.

Journal of the American Statistical Association, Vol. 83, No. 403, 698-708.

Samorodnitsky, G. (2006): Long Range Dependence. Foundation and Trends in

Stochastic Systems, Vol. 1, No 3, pp 163–257.

Samorodnitsky, G. and Taqqu, M. (1994). Stable non-Gaussian random processes.

Chapman & Hall.

Silva, E.M., Franco, G.C., Reisen, V.A., Cruz, F.R.B. (2006): Local bootstrap

approaches for fractional differential parameter estimation in ARFIMA models.

Computational Statistics & Data Analysis, Vol. 51, 1002-1011.

Singh, K. (1981): On the Asymptotic Açuracy of Efron’s Bootstrap, Annals of

Statistics. Vol. 9, No. 6, 1187-1195.

Sowell, F. (1992): Maximum likelihood estimation of stationary univariate

fractionally integrated time series models. Journal of Econometrics, Vol. 53, 165-188.

100

Taqqu, M., Teverovsky, V., Willinger, W. (1995): Estimators for long-range

dependence: an empirical study. Fractals, Vol. 3, 785-798.

Teverovsky, V., Taqqu, M. S. (1997): Testing for long-range dependence in the

presence of shifting means or the slowly declining trend, using a variance-type

estimator. Journal of Time Series Analysis, Vol. 18, No. 3, 279-304.

Teverovsky, V., Taqqu, M. S., Willinger, W. (1999): A critical look at Lo’s modified

R/S statistic. Journal of Statistical Planning and Inference, Vol. 80, 211-227.

Wang, W., Van Gelder, P. H. A., Vrijling, J. K., Chen, X. (2007): Detecting long-

memory: Monte Carlo simulations and application to daily streamflow processes.

Hydrology and Earth System Sciences, Vol. 11, 851-862.

Whittle, P. (1951): Hypothesis testing in time series analysis. Hafner, New York.

101

Përmbledhje

Gjatë viteve të fundit, një literaturë e bollshme i është kushtuar studimit të serive kohore me memorie

të gjatë. Për matjen e intesitetit të memories së gjatë të një procesi rasti përdoren dy madhësi të

ndryshme.

1. Madhësia (0, 1)H , që quhet eksponenti Hurst ose parametri i vetëngjashmërisë, dhe përdoret

gjerësisht në literaturën e proceseve me vetëngjashmëri dhe të lëvizjes brouniane thyesore.

2. Parametri ( 0.5, 0.5)d , që quhet parametri i memories dhe përdoret në literaturën rreth proceseve

autoregressive të integruar në mënyrë thyesore me mesatare të lëvizshme, ARFIMA(p,d,q), të

prezantuara nga Granger dhe Joyeux (1980) dhe Hosking (1981), pavarësisht nga njëri tjetri.

Këto madhësi lidhen nëpërmjet barazimit 0.5H d .

Metodat bootstrap janë teknika rizgjedhjeje të prezantuara fillimisht nga Efron (1979). Prej atëherë ato

kanë marrë një zhvillim të shpejtë, falë thjeshtësisë dhe gjithëpërfshirjes së përdorimit të tyre. Një

procedurë e përgjithshme bootstrap për seritë kohore stacionare, e çliruar nga specifikimi i modelit,

është teknika bootstrap me blloqe, e cila rizgjedh (me kthim) blloqe me vrojtime të njëpasnjëshme.

Në këtë tezë, ne studiojmë përdorimet e metodave bootstrap për rizgjedhjen e serive kohore me

memorie të gjatë. Ne propozojmë një teknikë alternative, bootstrapin me blloqe me cikle. Ne

krahasojmë këtë metodë bootstrap me procedurat e tjera ekzistuese me anë të një eksperimenti Monte

Carlo duke vlerësuar parametrin e memories d. Gjithashtu tregohet se, metoda e propozuar është e

dobishme për të zbuluar ekzistencën e memories së gjatë në një seri kohore stacionare.

Fjalëkyçe: seri kohore, memorie e gjatë, modeli ARFIMA, metodat e rizgjedhjes, bootstrap me blloqe,

interval besimi.

Abstract

In the last years a wide literature has been dedicated to the study of the long memory time series. There

are usually two different names for the measure of long memory in a random process.

1. The quantity is called Hurst exponent or self-similarity parameter and is universally

recognized by the literature on self-similar processes and fractional Brownian motion.

2. The parameter is the memory parameter and is due to the literature about

autoregressive fractionally integrated moving average, ARFIMA(p,d,q), processes introduced by

Granger and Joyeux (1980) and Hosking (1981), separately.

These quantities are related by the equation 0.5H d .

Bootstrap methods are resampling techniques first introduced by Efron (1979). They have developed

quickly since then due to their simplicity and generality in use. A general bootstrap procedure for

stationary time series, free of specifying modeling, is the block bootstrap technique, that resamples

(with replacement) blocks of consecutive observations.

In this thesis we study the implement of bootstrap methods for replicating the time series with long

memory. We propose an alternative technique, the block bootstrap with cycles. We compare this

bootstrap method with other existing procedures in a wide Monte Carlo experiment, by estimating the

memory parameter d. It is also demonstrated that, the proposed approach is useful to detect the

presence of long memory in a stationary time series.

Keywords: time series, long memory, ARFIMA model, resampling methods, block bootstrap,

confidence interval.

(0, 1)H

( 0.5, 0.5)d

UNIVERSITETI I TIRANËS FAKULTETI I SHKENCAVE TË NATYRËS · Tabela 3.18 Fuqia (empirike), në...

Documents

Transcript of UNIVERSITETI I TIRANËS FAKULTETI I SHKENCAVE TË NATYRËS · Tabela 3.18 Fuqia (empirike), në...