G. Bruno - Modelli di scomposizione di serie storiche

Modelli di scomposizionedi serie storiche

Giancarlo Bruno – Istat

XI Conferenza nazionale di statistica20 febbraio 2013

Indice

1. Motivazione

2. L’approccio classico alla scomposizione delle serie storiche

3. Approccio moderno per la scomposizione di serie storiche

Motivazione

1990 1995 2000 2005 2010 2015

40

60

80

100

120

Motivazione

1990 1995 2000 2005 2010 2015

80

90

100

110

Scomponibilità di una seriestorica

L’ipotesi di base che faremo è che esiste la possibilità discomporre una serie storica in componenti, ad esempio:

• Tendenza• Stagionalità• Componente erratica o irregolare

La serie osservata Yt sarà data dalla somma di tutte o alcunedi queste:

Yt = µt + γt + εt

Approccio classico allascomposizione

Nell’approccio cosiddetto classico le componenti vengonorappresentate mediante opportune funzioni matematiche note,a meno di un ridotto numero di parametri che possono esserestimati mediante i dati disponibili.Tali funzioni riproducono quelle che si ritengono essere lecaratteristiche salienti delle componenti.

Tendenza

La tendenza (trend) rappresenta la variabilità della serieconnessa a movimenti riconducibili al lungo periodo; ingenerale, quindi, essa è supposta essere abbastanza “liscia”.Nell’approccio classico la tendenza è rappresentata da unafunzione del tempo, ad esempio:

• tendenza costante: µt = α

• tendenza lineare: µt = α+ β1t• tendenza quadratica: µt = α+ β1t + β2t2

• tendenza esponenziale: µt = eα+β1t

Stagionalità

La componente stagionale ha la caratteristica di ripetersi inmaniera regolare ogni s periodi, dove s è la frequenza dellaserie osservata: 4 per serie trimestrali, 12 per serie mensili,ecc.Essa può essere caratterizzata in vari modi, ad esempiomediante s variabili dicotomiche. In questo caso la stagionalitàè data da:

γt =s∑

i=1

δiDit cons∑

i=1

δi = 0

dove Dit assume valore 1 nella stagione i e 0 altrove, mentre icoefficienti δi ne misurano l’effetto.

Componente irregolare

Nell’approccio classico questa è l’unica componente stocastica,in genere rappresentata da un rumore bianco, ossia unprocesso non prevedibile a partire dalla conoscenza del suopassato.

εt ∼ WN(0, σ2)

Stima dei coefficienti

Ipotizzando che la serie osservata sia composta da unatendenza lineare, dalla componente stagionale e da quellairregolare:

Yt = µt + γt + εt

= α+ β1t +s∑

i=1

δiDit + εt t = 1, · · · ,T

è possibile stimare i coefficienti α, β1 e δi con i MQO.

Limiti dell’approccio classico

L’approccio classico ha alcuni inconvenienti:

• Occorre ipotizzare una precisa forma funzionale per lecomponenti; questo implica tra l’altro una notevole dose disoggettività, che può essere fonte di problemi soprattuttose il modello deve essere usato anche in previsione.

• Le componenti sono molto “rigide”. Spesso può esserepreferibile un approccio “locale”.

Esempio

La serie artificiale accantorappresenta un esempio dicome la scelta di unafunzione analitica possaessere controversa.

Si potrebbe, infatti, scegliereuna tendenza lineareoppure quadratica o anchedata dalla composizione didue tendenze lineari.La scelta, anche soloimplicitamente, contieneuna valutazione previsiva.

0 20 40 60 80 100 120

120

140

160

180

200

Esempio

La serie artificiale accantorappresenta un esempio dicome la scelta di unafunzione analitica possaessere controversa.Si potrebbe, infatti, scegliereuna tendenza lineare

oppure quadratica o anchedata dalla composizione didue tendenze lineari.La scelta, anche soloimplicitamente, contieneuna valutazione previsiva.

0 20 40 60 80 100 120

120

140

160

180

200

Esempio

La serie artificiale accantorappresenta un esempio dicome la scelta di unafunzione analitica possaessere controversa.Si potrebbe, infatti, scegliereuna tendenza lineareoppure quadratica

o anchedata dalla composizione didue tendenze lineari.La scelta, anche soloimplicitamente, contieneuna valutazione previsiva.

0 20 40 60 80 100 120

120

140

160

180

200

Esempio

La serie artificiale accantorappresenta un esempio dicome la scelta di unafunzione analitica possaessere controversa.Si potrebbe, infatti, scegliereuna tendenza lineareoppure quadratica o anchedata dalla composizione didue tendenze lineari.La scelta, anche soloimplicitamente, contieneuna valutazione previsiva.

0 20 40 60 80 100 120

120

140

160

180

200

Esempio

Problemi analoghiemergono con seriereali. In questo casoabbiamo l’indice dellaproduzione industriale,rappresentato comecomposto da un trendpolinomiale di 5◦ grado euna stagionalitàdeterministica. I residuisono lontani dall’esserewhite noise!

1990 1995 2000 2005 2010 2015

40

60

80

100

120 IPItendenza

Uso di metodi locali

Dei limiti dell’approccio globale si ha consapevolezza da lungotempo nella letteratura empirica sulle serie storiche.Allo scopo di superarli sono stati escogitati vari metodi, cheessenzialmente si caratterizzano per essere in qualche modolocali.

Componenti stocastiche

L’uso di componenti stocastiche permette di rendere piùverosimili e flessibili i modelli per le componenti.Prendiamo ad esempio una tendenza lineare deterministica:

µt = α+ β1t

In questo modello ogni osservazione del campione riceve lostesso peso nella stima dei parametri e contribuisce allo stessomodo alla previsione. In questo senso il metodo discomposizione classico può essere visto come un metodoglobale.

Tendenza stocastica

Una possibile “flessibilizzazione” consiste nel renderestocastica tale componente, ossia nel rendere variabili icoefficienti α e β1.Ciò può essere illustrato riformulando la tendenza lineare informa ricorsiva:

µt = µt−1 + β1

a questa espressione è possibile aggiungere un elementoaleatorio ηt ∼ N(0, σ2

η), ottenendo:

µt = µt−1 + β1 + ηt

Tendenza stocastica

È immediato osservare che:

µt = µ0 +t∑

i=1

ηi + β1t

quindi, trascurando il fattore iniziale µ0, la tendenzacomplessiva è il risultato della composizione di un trend linearedeterministico, β1t , e di una passeggiata aleatoria,

∑ti=1 ηi .

La varianza del disturbo casuale ηt e la distanza dall’origine,determineranno la maggiore o minore possibilità diallontanamento della serie complessiva dal trenddeterministico.

Esempio

µt = β1 + µt−1 + ηt

con ηt ∼ N(0, 0,1)e β1 = 0,3

0 20 40 60 80 100

0

10

20

30

tendenza deterministicatendenza stocastica

Tendenza stocastica

L’esempio precedente può essere ulteriormente generalizzato,considerando come variabile e stocastico anche il termine β1,cosiddetto drift o deriva.Un modello spesso utilizzato è il seguente (cd. local lineartrend): {

µt = µt−1 + βt + ηt

βt = βt−1 + ζt

con ηt ∼ N(0, σ2η)

ζt ∼ N(0, σ2ζ )

E(ηtζt) = 0

Esempio

{µt = µt−1 + βt + ηt

βt = βt−1 + ζt

con ηt ∼ N(0, 0,1)ζt ∼ N(0, 0,01)β0 = 0,3

0 20 40 60 80 100

0

10

20

30

40

Local linear trendLocal level with drift

Esempio

In alcuni casi può esseredesiderabile diminuire lavariabilità di breve periododella tendenza.È possibile ottenere unacomponente più liscia(smooth trend) ponendoσ2

η = 0{µt = µt−1 + βt

βt = βt−1 + ζt

con ζt ∼ N(0, 0,01)

0 20 40 60 80 100

0

10

20

30

40

Local linear trendSmooth trend

Componente stagionale

Analogamente alla trend anche la stagionalità può essere resastocastica, e dunque in qualche modo evolutiva nel tempo.Ad esempio, si può ipotizzare che la somma degli effetti su speriodi non sia esattamente pari a 0, ma uguale allarealizzazione di una variabile aleatoria con media nulla:

s∑i=1

δi = κt κ ∼ N(0, σ2κ)

Esempio

In questo esempio si puònotare l’adattamento che siottiene con un semplicemodello composto da unosmooth trend, unacomponente stagionalestocastica e un disturboresiduo.

Inoltre è possibile calcolareun intervallo di confidenzaper le componenti cosìstimate.

1990 1995 2000 2005 2010 2015

40

60

80

100

120

IPILocal linear trend

Esempio

In questo esempio si puònotare l’adattamento che siottiene con un semplicemodello composto da unosmooth trend, unacomponente stagionalestocastica e un disturboresiduo.Inoltre è possibile calcolareun intervallo di confidenzaper le componenti cosìstimate.

1990 1995 2000 2005 2010 2015

40

60

80

100

120

IPILocal linear trend

Stima

Non ci soffermeremo qui sulla stima dei parametri e dellecomponenti dei modelli quali quelli qui presentati,genericamente noti come modelli strutturali di serie storiche(Structural Time Series Models).In questa sede basti dire che sotto l’ipotesi di normalità eincorrelazione seriale dei disturbi e di loro incorrelazionecontemporanea, la stima di parametri e componenti può essereottenuta in modo relativamente semplice attraverso il cosiddettofiltro di Kalman, presente in tutti i principali pacchetti statisticiche comprendono un modulo per l’analisi delle serie storiche.

Conclusioni

• In questa presentazione abbiamo mostrato l’utilità discomporre una serie storica in componenti non osservabili

• È stato introdotto l’approccio cosiddetto classico,evidenziandone le potenzialità e i punti di debolezza

• Abbiamo quindi descritto una possibile generalizzazionedell’approccio classico, ottenuta rendendo stocastiche lecomponenti

Grazie dell’attenzione

G. Bruno - Modelli di scomposizione di serie storiche

Documents

Transcript of G. Bruno - Modelli di scomposizione di serie storiche