Prédiction multi-step de la volatilité : le modèle ARIMA-GARCH appliqué aux séries temporelles...
Transcript of Prédiction multi-step de la volatilité : le modèle ARIMA-GARCH appliqué aux séries temporelles...
Prédiction multi-step de la volatilité :
le modèle ARIMA-GARCH appliqué aux séries temporelles d’affaiblissement par la pluie sur les liaisons Terre-Satellite
SAMA – 21/03/2008
L. de Montera, C. Mallet and L. BarthesCentre d’Etudes des Environnements Terrestre et planétaires (CETP)
Vélizy-Villacoublay, France
1/29
I P S L
Université - VSQ
2/29
I/Le problème à résoudre
II/ Rappels et modèles classiques de type ARMA
III/ Modélisation ARIMA et limitations
IV/ Modélisation GARCH des erreurs
V/ Prédiction multi-step et performances
Le problème à résoudre
3/29
Affaiblissement par la pluie des liaisons Terre-Satellite en bade EHF (20-50 Ghz):
Solution : adaptation de la puissance d'émission en fonction des conditions de propagation
En raison du temps de réaction de la boucle de contrôle,
=> Il faut prédire l'affaiblissement à t+10secondes
pour éviter que la liaison ne soit coupée
20 GHz ↓
44 GHz ↑
les données
4/29
L'affaiblissement (en dB) de la balise 20 GHz du satellite OLYMPUS a été mesuré à Gometz-la-Ville pendant 15 mois.
Cette base de données, échantillonée à 1seconde, contient 67 évènements de pluie.
0 500 1000 1500 2000 2500 3000 3500 4000 4500 50000
5
10
15
20
25
30
time, s.
att
enuation,
dB
.
Exemple d'affaiblissement pendant un orage.
5/29
I/Le problème à résoudre
II/ Rappels et modèles classiques de type ARMA
III/ Modélisation ARIMA et limitations
IV/ Modélisation GARCH des erreurs
V/ Prédiction multi-step et performances
La notion de stationnarité (1)
6/29
Définition - Un processus Xt est dit stationnaire au sens fort si, quelque soit n, t, h,
on a l’égalité en loi : ), X, (X ) , X, (X hnthtntt
Définition - Un processus Xt est dit stationnaire au second ordre, ou au sens faible, si la moyenne du processus est constante et si les autocovariances ne dépendent que de la l’intervalle entre les observations :
th(h)) ,XCov(X
tXtE
htt pour tout et pour tout
pour tout )(
La dernière propriété implique en particulier que la variance de Xt est constante
La notion de stationnarité (2)
7/29
Définition – Un processus Xt est non-stationnaire de type déterministe s’il
peut s’écrire : tt tfX )(
où f(t) est un tendance déterministe, dans ce cas, on a :
2)(
)()(
t
t
XV
tfXE La moyenne dépend de t
Définition – Un processus Xt est non-stationnaire de type stochastique lorsqu’il est intégré d’ordre d, c’est-à-dire que le processus résultant de d différenciations est stationnaire:
Marche aléatoire (d=1) : La variance dépend de t
td X est stationnaire
tXV
XXEXXXX
t
tt
iitttt 2
0
1011
)(
)(
stationnaire non-stationnaire (déterministe)
non-stationnaire (stochastique)
Les modèles classiques stationnaires
8/29
Soit εt un bruit blanc gaussien N(0,σ) au sens fort (i.i.d.).
• Le modèle AR(p) (Auto Regressive):
1
tit
p
iit XX
• Le modèle MA(q) (Moving Average):
1
it
q
iittX
• Le modèle ARMA(p, q):
11
it
q
iitit
p
iit XX
Les modèles classiques non stationnaires
9/29
Soit εt un bruit blanc gaussien N(0,σ) au sens fort (i.i.d.).
• La marche aléatoire: ttttt XXX 1
• Le modèle ARIMA(p, d, q) (Auto Regressive Integrated Moving Average):
11
it
q
iitit
dp
iit
d XX
10/29
I/Le problème à résoudre
II/ Rappels et modèles classiques de type ARMA
III/ Modélisation ARIMA et limitations
IV/ Modélisation GARCH des erreurs
V/ Prédiction multi-step et performances
Stationarisation (1)
11/29
On applique le test de stationnarité de Box & Jenkins: si l'autocorrélation reste
proche de 1 pour un nombre élevé de retard, le processus est intégré.
autocorrélation
Il faut travailler sur la première différence:
1 ttt XXX
Stationarisation (2)
12/29
L'autocorrélation des différences montre que le processus est maintenant stationarisé.
Une seule différenciation est suffisante.
autocorrélation
série différenciée
Modélisation ARMA des différences
13/29
Identification des ordres par la méthode du 'coin' (basée sur l'autocorrélation)
Estimation des paramètres par OLS (Ordinary Least Squares)
Modélisation complète ARIMA(2,1,2):
22112211
1
tttttt
ttt
XXX
XXX
5709.0
52.1
2058.0
161.1
2
1
2
1
avec
Validation
14/29
La validation se fait par l'étude des résidus εt qui doivent être un bruit blanc gaussien fort (i.i.d.).
Les résidus sont de moyenne nulle et ne sont pas corrélés, on peut parler de bruit blanc faible, MAIS:
•phénomène de "volatility clustering"•distribution à queues épaisses
(Kurtosis=12)
Hétéroscédasticité conditionnelle
Ces propriétés (classiques en finance) sont due au fait que la variance conditionnelle n'est pas constante
(hétéroscédasticité, du grec "hetero" → different et "skedastios" → dispersion)
15/29
On voit que les résidus sont non-corrélés mais pas indépendants.
L'hypothèse de processus ARIMA(2,1,2) pur est donc rejetée.
Autocorrélation des résidus au carré
CsteXXXV tttt ,...,, 321
16/29
I/Le problème à résoudre
II/ Rappels et modèles classiques de type ARMA
III/ Modélisation ARIMA et limitations
IV/ Modélisation GARCH des erreurs
V/ Prédiction multi-step et performances
Modélisation GARCH des erreurs
En pratique, l'hétéroscédasticité conditionnelle pose deux problèmes:
• Le modèle ARMA pur sous-estime les risques pendant les périodes de forte volatilité, car la variance de l'erreur augmente.
• L'estimation des paramètres est biaisée car l'algorithme OLS suppose que les résidus ont une variance constante.
17/29
On est donc amené à modéliser la variance des erreurs. Le modèle le plus populaire est le modèle GARCH(1,1) (Generalized Auto Regressive Conditionnal Heteroscedasticity):
N(0,1) , . blancbruit t ttt
122
12
12 . ttttt Ek
σt est une estimation de la variance conditionnelle de l'erreur, elle change à chaque instant et ne se réalise qu'une seule fois.
Propriétés des processus GARCH
• Pour qu'un processus GARCH soit stationnaire, il faut α+β<1
• La variance non-conditionnelle est alors k/(1- α-β)• GARCH permet de reproduire l'autocorrélation des erreurs au carré et donc la 'volatility clustering'
• GARCH produit des distribution 'leptokurtique' (à queues épaisses, K>3)
18/29
t
t
21
1333 2
2
22
2
t
tc
E
EVarK
Modélisation ARIMA-GARCH
19/29
L'estimation des paramètre ARIMA et GARCH doit se faire conjointement: On initialise les paramètres ARIMA et GARCH par OLS puis on les 'rafine' conjointement par Maximum de Vraisemblance.
1 ttt XXX
22112211 tttttt XXX
N(0,1) , . blancbruit t ttt
21
21
2 . ttt k
6271.0
5931.1
1991.0
1629.1
2
1
2
1
964.0
035.0
62.9
ek
Validation
20/29
Les résidus ηt du modèle ARIMA-GARCH doivent être un bruit blanc gaussien de variance 1
Le modèle ARIMA-GARCH est validé.
21/29
I/Le problème à résoudre
II/ Rappels et modèles classiques de type ARMA
III/ Modélisation ARIMA et limitations
IV/ Modélisation GARCH des erreurs
V/ Prédiction multi-step et performances
Prédiction multi-step (1): l'espérance du processus à t+h
22/29
Principe - Pour calculer les on itère h fois le modèle en remplaçant les erreurs futures par leur espérance, soit 0.
Le modèle est basé sur le processus différencié d'où:
prédiction
11
h
iitcthtc
h
iittht XEXXEXXX
22112211 :ARMA . tttttt XXXeq
2211
22112
1211211
2 ,
2
1
itcitcitc
tttctc
tttttc
XEXEXEiit
XXEXEt
XXXEt
itc XE
Prédiction multi-step (2): la variance l'erreur à t+h
23/29
Principe - On itère h fois l'équation ARMA en conservant les erreurs futures car leur variance n'est pas nulle.
22112211 :ARMA . tttttt XXXeq
i
jjtjiitcit XEX
1,
Les coefficients λi,j n'ont pas d'expression simple et sont calculés numériquement avec la suite:
1 1
1 1
2 2 1 1
1 1 2 2 1 1 1 1 for 2
t
t t
i t ii i t i t i i
U
U U
U U U
C'est l'équation ARMA mais avec uniquement les erreurs futurs, on peut en effet les séparer grâce à la linéarité de l'équation.
Prédiction multi-step (2): la variance de Xt à t+h
24/29
On remplace les dans la première équation (différentiation) pour obtenir l'erreur de prédiction et+h à t+h:
Comme les erreurs sont décorrélées, on peut distribuer l'opérateur variance:
avec
1
h
ji,j
1
1 1,
11
h
jjtjhtchtht
ji
h
jjtjhtcht
erreur
h
i
i
jjtji
prédiction
h
iitctht
h
iittht
XEXe
XEX
XEXXXXX
h
jjtcj
h
jjtjchtc VVeV
1
2
1
Prédiction multi-step (2): la variance de Xt à t+h
25/29
Principe - Les sont par définition les σt+j2. Pour le calculer leur
espérance, on itère l'espérance de l'équation GARCH.
On calcule le terme générale de cette suite puis on remplace dans l'expression de la variance. Finalement :
jtcV
2
12
21
21
2
).(
..
tctc
tctctc
EkE
EEkE
21
21
2 . :GARCH . ttt keq
h
jt
jj
jhtcc keVE1
21
11
2 )()(1
)(1
Prédiction multi-step (3): La marge d'erreur à t+h
26/29
On sait que la distribution de l'erreur à t+h est gaussienne centrée, car c'est une somme de gaussienne centrée, d'où
htccht eVEP
erfPM
21
100
2)( avec %1
%
erreurd' marge
%
prédictiondu temps) (P%
X demajorant
% )()( PMXEPX hthtcht
Mesure des performances
27/29
On sait que la distribution de l'erreur à t+h est gaussienne centrée, car c'est une somme de gaussienne centrée, d'où
]0[
10%10%
1010
])([1
)(tt XX
tt dtXPXT
PC
1940 1960 1980 2000 2020 2040 2060 208015
16
17
18
19
20
21
22
Time, s.
Att
enua
tion,
dB
.
AttenuationUpper bound
Link failure
Coût
Comparaison
28/29
Autres modèles de prédiction:
•Persistance (At+10=At)
•ONERA (chaîne de Markov à deux échantillons)
•NASA (équation stochastique du premier ordre)
•Portsmouth Univ. (ARMA adaptatif)
•Glamorgan Univ. (neurone linéaire ADALINE)
95 95.5 96 96.5 97 97.5 98 98.5 99 99.50
0.2
0.4
0.6
0.8
1
1.2
Link availability, % of time
Mea
n co
st, d
B
PersistencePortsmouth Univ.ARMA/GARCHONERAGlamorgan Univ.NASA
Le modèle ARIMA-GARCH permet de réduire le coût de la majoration en estimant dynamiquement l'intervalle de confiance
Conclusion
29/29
Le modèle ARIMA-GARCH permet d'améliorer la gestion des risques en modélisant la variance de l'erreur de prédiction.
Ce modèle a déjà fait ses preuves dans de nombreux domaines et est couramment utilisé, que ce soit en finance, en architecture (force du vent), en hydrologie (débits des cours d'eau), ou en infrastructures réseau (traffic routier ou internet).
Ce modèle semble adapté aux processus ayant un lien avec les turbulences ou avec des systèmes organisés complexes (comportement fractal) qui sont fréquents en géophysique.