G. Bruno - Modelli di scomposizione di serie storiche
-
Upload
istituto-nazionale-di-statistica -
Category
Documents
-
view
36.068 -
download
4
description
Transcript of G. Bruno - Modelli di scomposizione di serie storiche
Modelli di scomposizionedi serie storiche
Giancarlo Bruno – Istat
XI Conferenza nazionale di statistica20 febbraio 2013
Indice
1. Motivazione
2. L’approccio classico alla scomposizione delle serie storiche
3. Approccio moderno per la scomposizione di serie storiche
Motivazione
1990 1995 2000 2005 2010 2015
40
60
80
100
120
Motivazione
1990 1995 2000 2005 2010 2015
40
60
80
100
120
Motivazione
1990 1995 2000 2005 2010 2015
40
60
80
100
120
Motivazione
1990 1995 2000 2005 2010 2015
80
90
100
110
Scomponibilità di una seriestorica
L’ipotesi di base che faremo è che esiste la possibilità discomporre una serie storica in componenti, ad esempio:
• Tendenza• Stagionalità• Componente erratica o irregolare
La serie osservata Yt sarà data dalla somma di tutte o alcunedi queste:
Yt = µt + γt + εt
Approccio classico allascomposizione
Nell’approccio cosiddetto classico le componenti vengonorappresentate mediante opportune funzioni matematiche note,a meno di un ridotto numero di parametri che possono esserestimati mediante i dati disponibili.Tali funzioni riproducono quelle che si ritengono essere lecaratteristiche salienti delle componenti.
Tendenza
La tendenza (trend) rappresenta la variabilità della serieconnessa a movimenti riconducibili al lungo periodo; ingenerale, quindi, essa è supposta essere abbastanza “liscia”.Nell’approccio classico la tendenza è rappresentata da unafunzione del tempo, ad esempio:
• tendenza costante: µt = α
• tendenza lineare: µt = α+ β1t• tendenza quadratica: µt = α+ β1t + β2t2
• tendenza esponenziale: µt = eα+β1t
Stagionalità
La componente stagionale ha la caratteristica di ripetersi inmaniera regolare ogni s periodi, dove s è la frequenza dellaserie osservata: 4 per serie trimestrali, 12 per serie mensili,ecc.Essa può essere caratterizzata in vari modi, ad esempiomediante s variabili dicotomiche. In questo caso la stagionalitàè data da:
γt =s∑
i=1
δiDit cons∑
i=1
δi = 0
dove Dit assume valore 1 nella stagione i e 0 altrove, mentre icoefficienti δi ne misurano l’effetto.
Componente irregolare
Nell’approccio classico questa è l’unica componente stocastica,in genere rappresentata da un rumore bianco, ossia unprocesso non prevedibile a partire dalla conoscenza del suopassato.
εt ∼ WN(0, σ2)
Stima dei coefficienti
Ipotizzando che la serie osservata sia composta da unatendenza lineare, dalla componente stagionale e da quellairregolare:
Yt = µt + γt + εt
= α+ β1t +s∑
i=1
δiDit + εt t = 1, · · · ,T
è possibile stimare i coefficienti α, β1 e δi con i MQO.
Limiti dell’approccio classico
L’approccio classico ha alcuni inconvenienti:
• Occorre ipotizzare una precisa forma funzionale per lecomponenti; questo implica tra l’altro una notevole dose disoggettività, che può essere fonte di problemi soprattuttose il modello deve essere usato anche in previsione.
• Le componenti sono molto “rigide”. Spesso può esserepreferibile un approccio “locale”.
Esempio
La serie artificiale accantorappresenta un esempio dicome la scelta di unafunzione analitica possaessere controversa.
Si potrebbe, infatti, scegliereuna tendenza lineareoppure quadratica o anchedata dalla composizione didue tendenze lineari.La scelta, anche soloimplicitamente, contieneuna valutazione previsiva.
0 20 40 60 80 100 120
120
140
160
180
200
Esempio
La serie artificiale accantorappresenta un esempio dicome la scelta di unafunzione analitica possaessere controversa.Si potrebbe, infatti, scegliereuna tendenza lineare
oppure quadratica o anchedata dalla composizione didue tendenze lineari.La scelta, anche soloimplicitamente, contieneuna valutazione previsiva.
0 20 40 60 80 100 120
120
140
160
180
200
Esempio
La serie artificiale accantorappresenta un esempio dicome la scelta di unafunzione analitica possaessere controversa.Si potrebbe, infatti, scegliereuna tendenza lineareoppure quadratica
o anchedata dalla composizione didue tendenze lineari.La scelta, anche soloimplicitamente, contieneuna valutazione previsiva.
0 20 40 60 80 100 120
120
140
160
180
200
Esempio
La serie artificiale accantorappresenta un esempio dicome la scelta di unafunzione analitica possaessere controversa.Si potrebbe, infatti, scegliereuna tendenza lineareoppure quadratica o anchedata dalla composizione didue tendenze lineari.La scelta, anche soloimplicitamente, contieneuna valutazione previsiva.
0 20 40 60 80 100 120
120
140
160
180
200
Esempio
Problemi analoghiemergono con seriereali. In questo casoabbiamo l’indice dellaproduzione industriale,rappresentato comecomposto da un trendpolinomiale di 5◦ grado euna stagionalitàdeterministica. I residuisono lontani dall’esserewhite noise!
1990 1995 2000 2005 2010 2015
40
60
80
100
120 IPItendenza
Uso di metodi locali
Dei limiti dell’approccio globale si ha consapevolezza da lungotempo nella letteratura empirica sulle serie storiche.Allo scopo di superarli sono stati escogitati vari metodi, cheessenzialmente si caratterizzano per essere in qualche modolocali.
Componenti stocastiche
L’uso di componenti stocastiche permette di rendere piùverosimili e flessibili i modelli per le componenti.Prendiamo ad esempio una tendenza lineare deterministica:
µt = α+ β1t
In questo modello ogni osservazione del campione riceve lostesso peso nella stima dei parametri e contribuisce allo stessomodo alla previsione. In questo senso il metodo discomposizione classico può essere visto come un metodoglobale.
Tendenza stocastica
Una possibile “flessibilizzazione” consiste nel renderestocastica tale componente, ossia nel rendere variabili icoefficienti α e β1.Ciò può essere illustrato riformulando la tendenza lineare informa ricorsiva:
µt = µt−1 + β1
a questa espressione è possibile aggiungere un elementoaleatorio ηt ∼ N(0, σ2
η), ottenendo:
µt = µt−1 + β1 + ηt
Tendenza stocastica
Una possibile “flessibilizzazione” consiste nel renderestocastica tale componente, ossia nel rendere variabili icoefficienti α e β1.Ciò può essere illustrato riformulando la tendenza lineare informa ricorsiva:
µt = µt−1 + β1
a questa espressione è possibile aggiungere un elementoaleatorio ηt ∼ N(0, σ2
η), ottenendo:
µt = µt−1 + β1 + ηt
Tendenza stocastica
È immediato osservare che:
µt = µ0 +t∑
i=1
ηi + β1t
quindi, trascurando il fattore iniziale µ0, la tendenzacomplessiva è il risultato della composizione di un trend linearedeterministico, β1t , e di una passeggiata aleatoria,
∑ti=1 ηi .
La varianza del disturbo casuale ηt e la distanza dall’origine,determineranno la maggiore o minore possibilità diallontanamento della serie complessiva dal trenddeterministico.
Esempio
µt = β1 + µt−1 + ηt
con ηt ∼ N(0, 0,1)e β1 = 0,3
0 20 40 60 80 100
0
10
20
30
tendenza deterministicatendenza stocastica
Tendenza stocastica
L’esempio precedente può essere ulteriormente generalizzato,considerando come variabile e stocastico anche il termine β1,cosiddetto drift o deriva.Un modello spesso utilizzato è il seguente (cd. local lineartrend): {
µt = µt−1 + βt + ηt
βt = βt−1 + ζt
con ηt ∼ N(0, σ2η)
ζt ∼ N(0, σ2ζ )
E(ηtζt) = 0
Esempio
{µt = µt−1 + βt + ηt
βt = βt−1 + ζt
con ηt ∼ N(0, 0,1)ζt ∼ N(0, 0,01)β0 = 0,3
0 20 40 60 80 100
0
10
20
30
40
Local linear trendLocal level with drift
Esempio
In alcuni casi può esseredesiderabile diminuire lavariabilità di breve periododella tendenza.È possibile ottenere unacomponente più liscia(smooth trend) ponendoσ2
η = 0{µt = µt−1 + βt
βt = βt−1 + ζt
con ζt ∼ N(0, 0,01)
0 20 40 60 80 100
0
10
20
30
40
Local linear trendSmooth trend
Componente stagionale
Analogamente alla trend anche la stagionalità può essere resastocastica, e dunque in qualche modo evolutiva nel tempo.Ad esempio, si può ipotizzare che la somma degli effetti su speriodi non sia esattamente pari a 0, ma uguale allarealizzazione di una variabile aleatoria con media nulla:
s∑i=1
δi = κt κ ∼ N(0, σ2κ)
Esempio
In questo esempio si puònotare l’adattamento che siottiene con un semplicemodello composto da unosmooth trend, unacomponente stagionalestocastica e un disturboresiduo.
Inoltre è possibile calcolareun intervallo di confidenzaper le componenti cosìstimate.
1990 1995 2000 2005 2010 2015
40
60
80
100
120
IPILocal linear trend
Esempio
In questo esempio si puònotare l’adattamento che siottiene con un semplicemodello composto da unosmooth trend, unacomponente stagionalestocastica e un disturboresiduo.Inoltre è possibile calcolareun intervallo di confidenzaper le componenti cosìstimate.
1990 1995 2000 2005 2010 2015
40
60
80
100
120
IPILocal linear trend
Stima
Non ci soffermeremo qui sulla stima dei parametri e dellecomponenti dei modelli quali quelli qui presentati,genericamente noti come modelli strutturali di serie storiche(Structural Time Series Models).In questa sede basti dire che sotto l’ipotesi di normalità eincorrelazione seriale dei disturbi e di loro incorrelazionecontemporanea, la stima di parametri e componenti può essereottenuta in modo relativamente semplice attraverso il cosiddettofiltro di Kalman, presente in tutti i principali pacchetti statisticiche comprendono un modulo per l’analisi delle serie storiche.
Conclusioni
• In questa presentazione abbiamo mostrato l’utilità discomporre una serie storica in componenti non osservabili
• È stato introdotto l’approccio cosiddetto classico,evidenziandone le potenzialità e i punti di debolezza
• Abbiamo quindi descritto una possibile generalizzazionedell’approccio classico, ottenuta rendendo stocastiche lecomponenti
Grazie dell’attenzione
Conclusioni
• In questa presentazione abbiamo mostrato l’utilità discomporre una serie storica in componenti non osservabili
• È stato introdotto l’approccio cosiddetto classico,evidenziandone le potenzialità e i punti di debolezza
• Abbiamo quindi descritto una possibile generalizzazionedell’approccio classico, ottenuta rendendo stocastiche lecomponenti
Grazie dell’attenzione