Prédiction multi-step de la volatilité : le modèle ARIMA-GARCH appliqué aux séries temporelles...

Prédiction multi-step de la volatilité :

le modèle ARIMA-GARCH appliqué aux séries temporelles d’affaiblissement par la pluie sur les liaisons Terre-Satellite

SAMA – 21/03/2008

L. de Montera, C. Mallet and L. BarthesCentre d’Etudes des Environnements Terrestre et planétaires (CETP)

Vélizy-Villacoublay, France

1/29

I P S L

Université - VSQ

2/29

I/Le problème à résoudre

II/ Rappels et modèles classiques de type ARMA

III/ Modélisation ARIMA et limitations

IV/ Modélisation GARCH des erreurs

V/ Prédiction multi-step et performances

Le problème à résoudre

3/29

Affaiblissement par la pluie des liaisons Terre-Satellite en bade EHF (20-50 Ghz):

Solution : adaptation de la puissance d'émission en fonction des conditions de propagation

En raison du temps de réaction de la boucle de contrôle,

=> Il faut prédire l'affaiblissement à t+10secondes

pour éviter que la liaison ne soit coupée

20 GHz ↓

44 GHz ↑

les données

4/29

L'affaiblissement (en dB) de la balise 20 GHz du satellite OLYMPUS a été mesuré à Gometz-la-Ville pendant 15 mois.

Cette base de données, échantillonée à 1seconde, contient 67 évènements de pluie.

0 500 1000 1500 2000 2500 3000 3500 4000 4500 50000

5

10

15

20

25

30

time, s.

att

enuation,

dB

.

Exemple d'affaiblissement pendant un orage.

5/29






La notion de stationnarité (1)

6/29

Définition - Un processus Xt est dit stationnaire au sens fort si, quelque soit n, t, h,

on a l’égalité en loi : ), X, (X ) , X, (X hnthtntt

Définition - Un processus Xt est dit stationnaire au second ordre, ou au sens faible, si la moyenne du processus est constante et si les autocovariances ne dépendent que de la l’intervalle entre les observations :

th(h)) ,XCov(X

tXtE

htt pour tout et pour tout

pour tout )(

La dernière propriété implique en particulier que la variance de Xt est constante

La notion de stationnarité (2)

7/29

Définition – Un processus Xt est non-stationnaire de type déterministe s’il

peut s’écrire : tt tfX )(

où f(t) est un tendance déterministe, dans ce cas, on a :

2)(

)()(

t

t

XV

tfXE La moyenne dépend de t

Définition – Un processus Xt est non-stationnaire de type stochastique lorsqu’il est intégré d’ordre d, c’est-à-dire que le processus résultant de d différenciations est stationnaire:

Marche aléatoire (d=1) : La variance dépend de t

td X est stationnaire

tXV

XXEXXXX

t

tt

iitttt 2

0

1011

)(

)(

stationnaire non-stationnaire (déterministe)

non-stationnaire (stochastique)

Les modèles classiques stationnaires

8/29

Soit εt un bruit blanc gaussien N(0,σ) au sens fort (i.i.d.).

• Le modèle AR(p) (Auto Regressive):

1

tit

p

iit XX

• Le modèle MA(q) (Moving Average):

1

it

q

iittX

• Le modèle ARMA(p, q):

11

it

q

iitit

p

iit XX

Les modèles classiques non stationnaires

9/29

Soit εt un bruit blanc gaussien N(0,σ) au sens fort (i.i.d.).

• La marche aléatoire: ttttt XXX 1

• Le modèle ARIMA(p, d, q) (Auto Regressive Integrated Moving Average):

11

it

q

iitit

dp

iit

d XX

10/29






Stationarisation (1)

11/29

On applique le test de stationnarité de Box & Jenkins: si l'autocorrélation reste

proche de 1 pour un nombre élevé de retard, le processus est intégré.

autocorrélation

Il faut travailler sur la première différence:

1 ttt XXX

Stationarisation (2)

12/29

L'autocorrélation des différences montre que le processus est maintenant stationarisé.

Une seule différenciation est suffisante.

autocorrélation

série différenciée

Modélisation ARMA des différences

13/29

Identification des ordres par la méthode du 'coin' (basée sur l'autocorrélation)

Estimation des paramètres par OLS (Ordinary Least Squares)

Modélisation complète ARIMA(2,1,2):

22112211

1

tttttt

ttt

XXX

XXX

5709.0

52.1

2058.0

161.1

2

1

2

1

avec

Validation

14/29

La validation se fait par l'étude des résidus εt qui doivent être un bruit blanc gaussien fort (i.i.d.).

Les résidus sont de moyenne nulle et ne sont pas corrélés, on peut parler de bruit blanc faible, MAIS:

•phénomène de "volatility clustering"•distribution à queues épaisses

(Kurtosis=12)

Hétéroscédasticité conditionnelle

Ces propriétés (classiques en finance) sont due au fait que la variance conditionnelle n'est pas constante

(hétéroscédasticité, du grec "hetero" → different et "skedastios" → dispersion)

15/29

On voit que les résidus sont non-corrélés mais pas indépendants.

L'hypothèse de processus ARIMA(2,1,2) pur est donc rejetée.

Autocorrélation des résidus au carré

CsteXXXV tttt ,...,, 321

16/29






Modélisation GARCH des erreurs

En pratique, l'hétéroscédasticité conditionnelle pose deux problèmes:

• Le modèle ARMA pur sous-estime les risques pendant les périodes de forte volatilité, car la variance de l'erreur augmente.

• L'estimation des paramètres est biaisée car l'algorithme OLS suppose que les résidus ont une variance constante.

17/29

On est donc amené à modéliser la variance des erreurs. Le modèle le plus populaire est le modèle GARCH(1,1) (Generalized Auto Regressive Conditionnal Heteroscedasticity):

N(0,1) , . blancbruit t ttt

122

12

12 . ttttt Ek

σt est une estimation de la variance conditionnelle de l'erreur, elle change à chaque instant et ne se réalise qu'une seule fois.

Propriétés des processus GARCH

• Pour qu'un processus GARCH soit stationnaire, il faut α+β<1

• La variance non-conditionnelle est alors k/(1- α-β)• GARCH permet de reproduire l'autocorrélation des erreurs au carré et donc la 'volatility clustering'

• GARCH produit des distribution 'leptokurtique' (à queues épaisses, K>3)

18/29

t

t

21

1333 2

2

22

2

t

tc

E

EVarK

Modélisation ARIMA-GARCH

19/29

L'estimation des paramètre ARIMA et GARCH doit se faire conjointement: On initialise les paramètres ARIMA et GARCH par OLS puis on les 'rafine' conjointement par Maximum de Vraisemblance.

1 ttt XXX

22112211 tttttt XXX

N(0,1) , . blancbruit t ttt

21

21

2 . ttt k

6271.0

5931.1

1991.0

1629.1

2

1

2

1

964.0

035.0

62.9

ek

Validation

20/29

Les résidus ηt du modèle ARIMA-GARCH doivent être un bruit blanc gaussien de variance 1

Le modèle ARIMA-GARCH est validé.

21/29






Prédiction multi-step (1): l'espérance du processus à t+h

22/29

Principe - Pour calculer les on itère h fois le modèle en remplaçant les erreurs futures par leur espérance, soit 0.

Le modèle est basé sur le processus différencié d'où:

prédiction

11

h

iitcthtc

h

iittht XEXXEXXX

22112211 :ARMA . tttttt XXXeq

2211

22112

1211211

2 ,

2

1

itcitcitc

tttctc

tttttc

XEXEXEiit

XXEXEt

XXXEt

itc XE

Prédiction multi-step (2): la variance l'erreur à t+h

23/29

Principe - On itère h fois l'équation ARMA en conservant les erreurs futures car leur variance n'est pas nulle.

22112211 :ARMA . tttttt XXXeq

i

jjtjiitcit XEX

1,

Les coefficients λi,j n'ont pas d'expression simple et sont calculés numériquement avec la suite:

1 1

1 1

2 2 1 1

1 1 2 2 1 1 1 1 for 2

t

t t

i t ii i t i t i i

U

U U

U U U

C'est l'équation ARMA mais avec uniquement les erreurs futurs, on peut en effet les séparer grâce à la linéarité de l'équation.

Prédiction multi-step (2): la variance de Xt à t+h

24/29

On remplace les dans la première équation (différentiation) pour obtenir l'erreur de prédiction et+h à t+h:

Comme les erreurs sont décorrélées, on peut distribuer l'opérateur variance:

avec

1

h

ji,j

1

1 1,

11

h

jjtjhtchtht

ji

h

jjtjhtcht

erreur

h

i

i

jjtji

prédiction

h

iitctht

h

iittht

XEXe

XEX

XEXXXXX

h

jjtcj

h

jjtjchtc VVeV

1

2

1

Prédiction multi-step (2): la variance de Xt à t+h

25/29

Principe - Les sont par définition les σt+j2. Pour le calculer leur

espérance, on itère l'espérance de l'équation GARCH.

On calcule le terme générale de cette suite puis on remplace dans l'expression de la variance. Finalement :

jtcV

2

12

21

21

2

).(

..

tctc

tctctc

EkE

EEkE

21

21

2 . :GARCH . ttt keq

h

jt

jj

jhtcc keVE1

21

11

2 )()(1

)(1

Prédiction multi-step (3): La marge d'erreur à t+h

26/29

On sait que la distribution de l'erreur à t+h est gaussienne centrée, car c'est une somme de gaussienne centrée, d'où

htccht eVEP

erfPM

21

100

2)( avec %1

%

erreurd' marge

%

prédictiondu temps) (P%

X demajorant

% )()( PMXEPX hthtcht

Mesure des performances

27/29

On sait que la distribution de l'erreur à t+h est gaussienne centrée, car c'est une somme de gaussienne centrée, d'où

]0[

10%10%

1010

])([1

)(tt XX

tt dtXPXT

PC

1940 1960 1980 2000 2020 2040 2060 208015

16

17

18

19

20

21

22

Time, s.

Att

enua

tion,

dB

.

AttenuationUpper bound

Link failure

Coût

Comparaison

28/29

Autres modèles de prédiction:

•Persistance (At+10=At)

•ONERA (chaîne de Markov à deux échantillons)

•NASA (équation stochastique du premier ordre)

•Portsmouth Univ. (ARMA adaptatif)

•Glamorgan Univ. (neurone linéaire ADALINE)

95 95.5 96 96.5 97 97.5 98 98.5 99 99.50

0.2

0.4

0.6

0.8

1

1.2

Link availability, % of time

Mea

n co

st, d

B

PersistencePortsmouth Univ.ARMA/GARCHONERAGlamorgan Univ.NASA

Le modèle ARIMA-GARCH permet de réduire le coût de la majoration en estimant dynamiquement l'intervalle de confiance

Conclusion

29/29

Le modèle ARIMA-GARCH permet d'améliorer la gestion des risques en modélisant la variance de l'erreur de prédiction.

Ce modèle a déjà fait ses preuves dans de nombreux domaines et est couramment utilisé, que ce soit en finance, en architecture (force du vent), en hydrologie (débits des cours d'eau), ou en infrastructures réseau (traffic routier ou internet).

Ce modèle semble adapté aux processus ayant un lien avec les turbulences ou avec des systèmes organisés complexes (comportement fractal) qui sont fréquents en géophysique.

Prédiction multi-step de la volatilité : le modèle ARIMA-GARCH appliqué aux séries temporelles...

Documents

Transcript of Prédiction multi-step de la volatilité : le modèle ARIMA-GARCH appliqué aux séries temporelles...