Variations Temporelles Séries Chronologiques
Transcript of Variations Temporelles Séries Chronologiques
Faculté de Médecine de Marseille, Université de la Méditerranée
Laboratoire d’Enseignement et de Recherche sur le Traitement de l’Information Médicale
Dr Roch GiorgiDr Roch Giorgi
Variations Temporelles–
Séries Chronologiques
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Définition
Série statistique ordonnée en fonction du tempsNombre de bronchiolite du nourrissonNombre de séjour pour la prise en charge d’un infarctus du myocarde dans un CHUVente d’un médicament sur des périodes successives
Corrélation entre les termes qui composent la sérieChaque observation dépend statistiquement des observations précédentes
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Objectifs
DescriptifIdentifier les différentes sources de variation de la série
Tendance, variations saisonnières, variations accidentelles ou points de rupture
Éliminer les changements systématiques de moyenne et de variance en fonction du temps
Rendre la série stationnaire
ExplicatifModéliser la série pour en comprendre la structure, la comparer à celle d’une autre série
PrédictifPrédire les valeurs future connaissant le passé
Détection d’augmentations inhabituelles, systèmes d’alerte, évaluation d’une intervention
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Composantes = Mouvements
Tendance généraleIndique l’évolution du phénomène étudié
Cycles autour de cette tendanceNotion de période
SaisonniersVariations se reproduisant périodiquement à des moments bien déterminés
Accidentels ou résiduelsDus à des facteurs exceptionnels, pour la plupart imprévisibles
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Tendance Générale
0
200
400
600
800
1000
1200
1400
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Q
2000 2001 2002 2003
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Périodicité – Influence Accidentelle
Q
0
200
400
600
800
1000
1200
1400
1 2 3 4
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Tendance – Période - Accidents
1
2
3
4200
400
600
800
1000
1200
0
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Prévision
0
1
2
3
4
5
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Variations Temporelles
Soit la série de données temporelles X1, X2, …Modèle additif pour décrire Xt
t t t tX M S U= + +
Mt = variation de la moyenne, tendance, avec tSt = effet saisonnier, qui varie périodiquement avec tUt = fluctuations aléatoires « stationnaires », de moyenne et de variance indépendantes de t
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Analyse de la Tendance (1)
Nécessité de disposer d’une série statistique sur une longue périodeVariations régulières à long terme, que l’on peu décrire par une ou plusieurs fonctions continuesReprésentation graphique afin d’avoir une vue globale du phénomène étudiéRéaliser un « lissage » de la courbe
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Analyse de la Tendance (2)
Représentation des moyennes par périodes (années) si les données sont saisonnières (mois, semaines, …)Représentation de Mt par une fonction simple de t
Polynôme : Mt = a0 + a1t + a2t2 + … aptp
Exponentielle : Mt = a0 + a1exp(-βt)
Logistique :( )t
kM =1+exp -βt
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Analyse de la Tendance (3)
Ajuster des polynômes différents mais de même degré à diverses parties de la série
Choisir les n premiers termesY ajuster un polynôme de degré p (p < n)Prédire par ce polynôme la valeur centrale des n premiers termesRecommencer en décalant le tout d’un terme
Correspond au calcul d’une moyenne mobile
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Moyennes Mobiles (1)
Construction d’une nouvelle série en calculant des moyennes arithmétiques successives de longueur p fixe à partir des données originales
Chacune des moyennes correspond au « milieu » de la période pour laquelle la moyenne arithmétique est calculée
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Moyennes Mobiles (2)
Ordre 3
t1 t2 t3 t4 … t23 t24 t25 t26
2,2 2,8 2,9 3,5 … 3,8 4,35 3,3 3,8
2,63 3,06 3,10 … 4,10 3,82 3,82
2, 2 2,8 2,93
+ + 3,8 4,35 3,33
+ +
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Moyennes Mobiles (3)
Ordre 5
t1 t2 t3 t4 … t23 t24 t25 t26
2,2 2,8 2,9 3,5 … 3,8 4,35 3,3 3,8
2,86 3,12 … 3,84 3,88
2, 2 2,8 2,9 3,5 2,95
+ + + +
Si p est impair (p = 2k + 1) k valeurs sont perdues à chaque extrémitéSi p est pair, les moyennes obtenues ne correspondent pas à une abscisse existante
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Moyennes Mobiles (4)
0
1
2
3
4
5
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
Données originales MM d'ordre 3 MM d'ordre 5
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Moyennes Mobiles (5)
Lisse la sérieFiltre les variations à court termeLaisse les variations à long terme
( )t1T X =
2q+1
q
t rq
X +−∑
Plus on prend une échelle grande plus on lisseProblème si l’on cherche a estimer la tendance pour les premiers et derniers points
Ajustement prolongé en se fondant sur moins de pointsEntraîne une plus grande imprécision
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Effet sur les Autres Composantes
Soit la série de données temporelles X1, X2, …
t t t tX M S U= + +
( ) ( ) ( ) ( )t t t tT X T M T S T U= + +Avec Mt = MM d’ordre 3
En retranchant la modélisation de la tendance, on a
( ) ( ) ( )t t t t t tX T X S T S U T U− = − + −
Introduction d’autocorrélation
La filtration par une moyenne mobile peut créer une structure autocorrélée artificielle dans les résidus
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Analyse de la Tendance (5)
Stabilisation de la série Xt afin de pouvoir la modéliser (≠ de l’estimer)
1ères différences
1t t tX X X+∆ = −Élimine une tendance linéaireExemple
Xt = bt + c + εt avec E(εt) = 0E(Xt) = bt + c, et donc croit avec t
Mais∆ Xt = Xt+1 - Xt = b + εt+1 - εt et E(∆ Xt) = b, ne dépend plus de t
Et doncXt+1 = Xt + b + ut, avec ut = εt+1 - εt
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Effet Saisonnier
Pour une série mensuelle, est défini comme périodique de période 12
St+12=St
avec 12
10i
iS
=
=∑
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Analyse de l’Effet Saisonnier (1)
En l’absence de tendanceComparer la moyenne annuelle aux moyennes mensuelles (différence, rapport)
ExempleValeurs trimestrielles : X1 = 12, X2 = 4, X3 = 2, X4 = 4, X5 = X1,…Moyenne annuelle = 5,5Effet saisonnier : S1 = 6,5, S2 = -1,5, S3 = -3,5, S4 = -1,5
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Analyse de l’Effet Saisonnier (2)
En présence d’une tendance (1)Avec les moyennes mobiles
TendancePériode paire (exemple = 12)T(Xt) = 1/12(1/2Xt-6 + Xt-5 + Xt-4 + … + Xt+5 + 1/2Xt+6)Période impaireT(Xt) = moyenne arithmétique sur la période
Effet saisonnierS(Xt) = Xt – T(Xt) ou S(Xt) = Xt / T(Xt)
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Analyse de l’Effet Saisonnier (2)
En présence d’une tendance (2)Modéliser St par une fonction périodique de période 12
12
1
2 2cos sin12 12t j j
j
S a j t b j tπ π=
⎡ ⎤⎛ ⎞ ⎛ ⎞= +⎜ ⎟ ⎜ ⎟⎢ ⎥⎝ ⎠ ⎝ ⎠⎣ ⎦∑
Désaisonnaliser la série∆12Xt = Xt+12 – Xt
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Autocorrélation Temporelle (1)
Soit la série temporelle Xt : x1, …, xn
Étude de la corrélation entre (x1, …, xn-1) et (x2, …, xn)Coefficient d’autocorrélation empirique d’ordre 1
( )( )
( )
1
11
12
1
n
t tt
n
tt
x x x xr
x x
−
+=
=
− −=
−
∑
∑ 1
1 n
tt
x xn =
= ∑avec
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Autocorrélation Temporelle (2)
Coefficient d’autocorrélation empirique d’ordre k (« lag »)
( )( )
( )
11
2
1
, 0
n k
t tt
k n
tt
x x x xr k
x x
−
+=
=
− −= ≥
−
∑
∑
Autocovariance d’ordre k
( )( )11
1 , 0n k
k t tt
c x x x x kn
−
+=
= − − ≥∑
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Corrélogramme (1)
Graphe de rk en fonction de k (k < n)
Permet de repérer une tendance ou une saisonnalité
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Corrélogramme – Données Indépendantes
-1
-0,8
-0,6
-0,4
-0,2
0
0,2
0,4
0,6
0,8
1
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16Lag(k)
rk
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Corrélogramme – Série Stationnaire
-1
-0,8
-0,6
-0,4
-0,2
0
0,2
0,4
0,6
0,8
1
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Temps
xt
Lag(k)
rk
Série de données
Corrélogramme
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Corrélogramme – Série non Stationnaire
Temps
xtSérie de données
-1
-0,8
-0,6
-0,4
-0,2
0
0,2
0,4
0,6
0,8
1
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16Lag(k)
rkCorrélogramme
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Corrélogramme – Effet Saisonnier
-1
-0,8
-0,6
-0,4
-0,2
0
0,2
0,4
0,6
0,8
1
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16Lag(k)
rk
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Corrélogramme (2)
Pour une série stationnaire avec n observations
( ) 2
1
1 1 2M
k jj
Var r rn =
⎡ ⎤+⎢ ⎥
⎣ ⎦∑
Si pour j > M, rj est négligeable
Si les données de la série sont indépendantes, rksuit une loi
Étude des coefficients par rapport àValeur de test statistique
( )N 0, 1 n1,96 n±
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Corrélogramme (3)
Lag(k)
-1
-0,8
-0,6
-0,4
-0,2
0
0,2
0,4
0,6
0,8
1
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
rk
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Processus Autorégressifs (AR)
Un processus autorégressif d’ordre p relie une valeur Xt à une combinaison linéaire de son passé
( ) 1 1 2 2AR p : ...t t t p t p tX a X a X a X ε− − −= + + + +
( )1
AR p : p
t j t j tj
X a X ε−=
= +∑Où εt est le « bruit blanc » : nul en moyenne (E(εt)=0), série de termes indépendants
ExempleAR(1) : Xt = aXt-1 + εt ; sera stationnaire si |a| < 1
Jusqu’à quel ordre p aller ?
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
AR: Autocorrélations – Autocorrélations Partielles
Autocorrélation d’ordre kÉtude de la corrélation entre Xt et Xt-k
Décroissent exponentiellement quand K augmente
Autocorrélation partielle d’ordre kÉtude de la corrélation résiduelle entre Xt et Xt-k après prise en compte des valeurs intermédiaires Xt-1, …, Xt-k+1
Sont nulles après un certain décalage
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Processus en Moyenne Mobile (MA)
Un processus en moyenne mobile d’ordre q relie une valeur Xt à une combinaison linéaire de bruits blancs (i.e. variables indépendantes)
( )0
MA q : q
t j t jj
X b ε −=
=∑( ) 0 1 1MA q : ...t t t q t qX b b bε ε ε− −= + + +
Avec b0=1, εt est le « bruit blanc » : nul en moyenne (E(εt)=0), série de termes indépendants
ExempleMA(1) : Xt = εt + b1εt-1 ; sera stationnaire si |q| ≥ 2
Jusqu’à quel ordre q aller ?
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
MA: Autocorrélations – Autocorrélations Partielles
Autocorrélation d’ordre kÉtude de la corrélation entre Xt et Xt-k
Sont nulles après un certain décalage
Autocorrélation partielle d’ordre kÉtude de la corrélation résiduelle entre Xt et Xt-k après prise en compte des valeurs intermédiaires Xt-1, …, Xt-k+1
Décroissent exponentiellement quand K augmente
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Modèle Mixte AR et MA : ARMA
Généralisation des 2 modèles précédents
( )1 0
ARMA p,q : p q
t j t j j t jj j
X a X b ε− −= =
= +∑ ∑( ) 1 1 0ARMA p,q : ... ...t t p t p t q t qX a X a X b bε ε− − −= + + + + +
Avec b0=1, εt est le « bruit blanc » : nul en moyenne (E(εt)=0), série de termes indépendants
D’une manière formelle, ne fait intervenir qu’un petit nombre de paramètres (principe de parcimonie)
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
ARMA: Autocorrélations – Autocorrélations Partielles
Autocorrélation d’ordre kSemblables à celles d’un AR(p)Décroissent exponentiellement quand K augmente
Autocorrélation partielle d’ordre kSemblables à celles d’un MA(q)Décroissent exponentiellement quand K augmente
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Série Stationnaire – non Stationnaire
Série stationnaireMéthodes
AR(p)MA(q)ARMA(p,q)
Série non stationnaireÉtape 1 : rendre la série stationnaireÉtape 2 : désaisonnaliser la sérieMéthodes
ARIMA(p,d,q) : AutoRegressive Integrated Moving Average
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Estimation – Tests – Adéquation
ParamètresAR(p) : aj
MA(q) : bj
ARMA(p,q) : aj et bj
…Procédures algorithmiquesTests statistiques
Maximum de vraisemblanceÉcart réduit
Examen des résidusÉcart entre prédit – observéBruit blanc
© Roch Giorgi, LERTIM, Faculté de Médecine, Université de la Méditerranée
Prévision
A relativement court terme
Basée sur la modélisation de la série
En supposant que la meilleure prédiction des erreurs futures est 01 2ˆ ˆ, ,...n nε ε+ +