Chapitre 2 : Etude d’une série chronologique - Le GEAN
Transcript of Chapitre 2 : Etude d’une série chronologique - Le GEAN
Chapitre 2 : Etude d’une série
chronologique
Mesurer l’évolution des
données
Variation absolue, variation relative
• Soit et les valeurs prises par une variable
V, aux dates d (départ) et a (arrivée), sur le
même individu.
• La variation absolue de la variable V entre les
dates d et a est : .
• La variation relative de la variable V entre les
dates d et a est :
• Le terme de variation relative est synonyme de
taux de variation et de taux de croissance.
dvav
a dV v v
1a d a
d d
v v vVt
V v v
Années 2000 2001 2002
Nombre de cinémas en France 2180 2192 2153
Exemples de calculs :
2000/ 2001 2192 2180 12Variation absolue
2001/ 2002
2153 21920.0178
2192Variation relative
Remarques : * Les variations absolues ont l’unité de grandeur considérée (sur
l’exemple ci-dessus on note qu’on dénombrait 12 cinémas de plus en 2001 par
rapport à 2000).
* Les variations relatives sont sans unités et donc souvent exprimées en
pourcentage (sur l’exemple ci-dessus on dénombrait 1,78% de moins de cinémas
en 2002 par rapport à 2001).
*Les variations relatives ne sont pas additives :
2000 / 2001 2001/ 2002 2000 / 2002
0.01228
0.005505 ( 0.01779) 0.01238
t t t
Calcul des contributions à la croissance • On donne l’évolution du chiffre d’affaire détaillé d’une société
spécialisée dans le multimédia :
• Le taux de variation du CA global est alors de :
• Pour déterminer ensuite lequel des secteurs d’activité a le plus
contribué à cette croissance, on peut calculer en première approche
les taux de variation pour chaque secteur comme par exemple pour
les lecteurs de DVD :
Lecteur DVD LCD Plasma Total
CA 2004 18 097 13 229 7 930 39 256
CA 2005 18 448 16 179 10 475 45 102
45102 3925614,9%
39256
CA
CA
2004
18448 180971,9%
18097
DVD
DVD
CA
CA
•On obtient alors les taux de variation suivant :
•Cependant, il n’est pas aisé d’interpréter ces taux comme des contributions à la croissance globale car ni leur moyenne ni leur somme ne permet de réobtenir le taux de variation global. En effet, pour cela il faut prendre en compte l’importance de chaque secteur par rapport à l’activité globale du groupe. On calcule ainsi des coefficients, représentant ce qu’on appelle l’effet masse, qui donnent la part représentée par chaque secteur sur l’année de départ :
Lecteur DVD LCD Plasma CA Global
Taux de variation +1,9% +22,3% +32,1% +14,9%
Secteur Lecteur DVD LCD Plasma Total
Effet masse 0,461 0,337 0,202 1
2004
2004
DVDDVD
global
CAEffet masse
CA
• Ces coefficients permettent de pondérer les taux de variations de chaque secteur pour en faire leur moyenne et réobtenir ainsi le taux de variation du CA global :
• Le taux de variation du CA global se décomposent donc en une somme de contributions de chacun des secteurs à cette croissance. Chaque contribution s’exprimant de manière analogue à celle présentée ci-dessous :
• On obtient alors le tableau des contributions suivant :
• En conclusion, même si les écrans LCD n’ont pas la plus forte croissance, ce sont eux qui ont le plus contribué à la croissance du chiffre d’affaire global.
2004
2004 2004
" "
DVD DVDDVD
DVD
effet masse croissance DVD
CA CAContribution
CA CA
14,9 0,461 1,9 0,337 22,3 0,202 32,1
DVD LCD plasma
Secteur Lecteur DVD LCD Plasma Total
Contribution 0,9 7,5 6,5 14,9
Bilan sur le calcul des contributions
• Soit une variable V se décomposant comme la somme de
différentes composantes :
• On peut alors calculer les taux de variation de chaque
composante et en faisant la moyenne pondérée de ces taux
selon l’importance de chacune des composantes on retrouve le
taux de variation de V. Ce taux se lit aussi alors comme somme
des contributions de chaque composante.
• La contribution de chaque composante i se décompose ainsi :
1 2 nV = composante +composante +....+composante
,
,
i d i
d i d
composante composanteeffet masse taux de variation
V composante
Indices élémentaires
•L’indice élémentaire de la variable V, à la date a de base 1 à la date d est :
•L’indice élémentaire de la variable V, à la date a de base 100 à la date d est :
•L’indice en base 1 peut aussi être défini à partir du taux de variation t par :
En multipliant une valeur par i, on lui fait subir une variation de ( )% (on appelle également i le coefficient
multiplicateur)
/a
a dd
vi
v
/ /100 100 aa d a d
d
vI i
v
1 i t
100 t
Base glissante/Base fixe
• Exemple traité : Evolution de la dette publique
• Indices en base glissante (date t, base 100 en t-1)
• Indices en base fixe (date t, base 100 en 1998)
• Dans la suite du cours, sauf indication contraire, nous
considèrerons des indices en base glissante.
Année 1998 1999 2000 2001 2002 2003 2004
Dette
publique
777,9 796 817 840,8 901,4 995,6 1067
Année 1998 1999 2000 2001 2002 2003 2004
indice 102,3 102,6 102,9 107,2 110,4 107,2
Année 1998 1999 2000 2001 2002 2003 2004
indice 100 102,3 105,0 108,1 115,9 128,0 137,2
Propriété de circularité des indices
élémentaires en base 1
• Ainsi, contrairement au cas des variations relatives on
peut, à partir des évolutions entre chaque année
déterminer l’évolution entre la première et la dernière
année.
• En appliquant cette propriété au cas précédent avec
les indices en base glissante, on obtient :
/ 1 1/ 2 1/ 0 / 0...n n n n ni i i i
2004/ 2003 2003/ 2002 1999/1998 2004/1998... 1,072 1,104 ... 1,023 1,370i i i i
Taux de variation moyen • On peut remarquer dans les tableaux précédents que la dette publique a
augmenté de 37,2% entre 1998 et 2004. On va maintenant chercher le taux de variation moyen c’est-à-dire celui qu’il faudrait appliquer entre chaque année pour aboutir à la même variation globale.
• Selon la même idée, on calcule d’abord l’indice annuel moyen :
D’où
• Le taux de croissance annuel moyen sur la période 1998-2004 est donc de 5,4% ( ).
• Ce taux ne dépendant que des valeurs prises aux deux extrémités de la période étudiée. Il peut donc ne pas représenter très justement ce qui s’est passé pendant cette période notamment si les dates extrêmes correspondent à des années particulièrement fastes (ou à l’inverse mauvaises) ce qui peut influencer fortement ce taux.
62004/1998 1,372m m m m m m mi i i i i i i i
6 1,372 1,054mi
mi
1m mt i
Indices synthétiques
• Les indices synthétiques ont pour but de résumer par un
seul indicateur une série d’indices de prix (ou de quantités)
correspondant à une série de produits.
• Imaginons le cas d’une société spécialisée dans la
distribution de courrier amenée à renouveler fréquemment
son parc de véhicules à 2 et 4 roues. On donne ci-dessous
l’évolution des prix et des quantités des produits concernés
entre 2 années :
•Entre ces deux dates, les indices simples des prix des deux produits sont :
et
Autrement dit le prix des voitures augmentait de 3,8% pendant que celui d’un
vélo diminuait de 16,7%
•Pour synthétiser ces deux indicateurs en un seul, l’idée la plus simple est de
mesurer l’évolution de la dépense totale entre les deux années, on obtient
ainsi l’indice de la dépense :
soit une diminution de 19,7%
• Résumer une augmentation de 3,8% et une diminution de 16,7% par une
diminution de 19,7% pose problème. Cela vient du fait que les deux premiers
indices sont des indices de prix tandis que le troisième est un indice de la
dépense qui mesure à la fois l’évolution des prix et des quantités
consommées. D’où l’idée, pour calculer un indice synthétique des prix de fixer
les quantités consommées à la date initiale ce qui conduit à l’indice de
Laspeyres des prix.
13500( ) 100 103,85
13000Ip voiture
100( ) 100 83,33
120Ip bicyclette
/
13500 1000 100 4500100 80,26
13000 1300 120 4000a d
dépense totale date arrivéeV
dépense totale date départ
Indice de Laspeyres
•On synthétise donc bien deux indices des prix par un indice se situant entre eux deux.
Cependant cet indice synthétique se trouve beaucoup plus proche de l’indice des prix
des voitures ce qui s’explique par sa définition sous forme de moyenne des deux indices
pondérée par les coefficients budgétaires et représentant les parts de
dépense associées à chaque type de véhicule :
•Ainsi : et on a alors :
( ) 13500 1300 100 4000100 100 103,28
13000 1300 120 4000
dépense totale date arrivée qutésdatedépartLp
dépense totale date départ
voiture
voiture voiture vélo véloLp Ip Ip
13000 13000,972
13000 1300 120 4000
120 40000,028
13000 1300 120 4000
voiture
vélo
1/0 0,972 ( ) 0,028 ( ) 0,972 103.85 0,028 83,33 103,28Lp Ip voiture Ip vélo
vélo
Lissage d’une série chronologique
par les moyennes mobiles
• Pour illustrer les techniques utilisées nous considèrerons
les nombres d’entrées par mois (en millions) dans les
salles de cinéma en France.
L’objectif est d’estimer des tendances sur des séries chronologiques en diminuant
l’amplitude des oscillations. On utilise pour cela des moyennes mobiles d’ordres plus
ou moins importants. Ainsi une moyenne mobile d’ordre 3 est calculée à partir des
relevés sur 3 mois successifs (le résultat étant affectée à la date médiane des trois
dates utilisées) :
02 02 02 16,22 23,24 14,87
3( 2002) 18,113 3
jan fev mary y yMM t Février
Moyenne mobile d’ordre pair
• Une moyenne calculée avec 4 valeurs, par exemple
doit être affectée à la date médiane (ici 2,5). Or cette date
(dans le cas des moyennes mobiles d’ordre pair) ne correspond
pas à une date de la série. La moyenne calculée avec les
quatre valeurs suivantes vaut et doit être
affectée à la date 3,5. L’idée est donc de calculer la moyenne
des deux moyennes ci-dessus et de l’affecter à la date 3
(médiane de 2,5 et 3,5). Il s’ensuit que :
1 2 3 4
4
y y y y
2 3 4 5
4
y y y y
1 2 3 4 2 3 4 514( 3)
2 4 4
y y y y y y y yMM t
1 12 2 13
112( 7) ( ,..., ) ( ,..., )
2MM t moyenne y y moyenne y y
Décomposer une série
chronologique
Généralités
• Une série se décompose souvent selon quatre composantes : la tendance T (évolution durable, régulière), les fluctuations conjoncturelles C (oscillations autour de la tendance, irrégulières en amplitude et durée), le mouvement saisonnier S (mouvement périodique, d’amplitudes similaires et de périodicité inférieure ou égale à l’année) et les variations accidentelles A.
• Le lissage d’une série est une transformation qui limite les oscillations dues aux composantes C, S et A d’une série. Plus les moyennes mobiles sont d’un ordre élevé, plus le lissage est important. Si l’on veut identifier la tendance, il convient de choisir une moyenne d’ordre élevé. Si l’objectif est d’aplanir légèrement la série, le choix d’une moyenne mobile d’ordre faible doit être effectué.
• Lorsque la série présente une composante saisonnière de périodicité constante, on peut utiliser la moyenne mobile d’ordre égal à la périodicité pour éliminer le mouvement saisonnier. C’est à peu près le cas de la série étudiée précédemment avec la MM12 qui rend assez bien compte de la tendance.
• L’estimation de la tendance par la moyenne mobile
en éliminant la composante saisonnière présente
deux inconvénients :
– Si la périodicité du mouvement est longue (par exemple 12
mois comme dans le cas précédent), l’obligation de choisir
une MM12 entraîne un lissage qui risque d’être excessif
(cela élimine la composante saisonnière mais aussi toutes
les autres variations que l’on peut souhaiter laisser
apparentes) ;
– D’autre part elle ne donne pas d’estimation pour les
premières et dernières dates de la série (les 6 premières
et 6 dernières pour une MM12).
• Un moyen de pallier ces deux inconvénients est
d’utiliser la méthodes des rapports saisonniers.
Correction des variations saisonnières
• Nous allons détailler la méthode citée précédemment à partir des chiffres d’affaires trimestriels des commerces d’une station de sport d’hiver. La méthode de correction des variations saisonnières permet, en 5 étapes de passer de la série brute à la série dite corrigée des variations saisonnières (série CVS)
80
90
100
110
120
130
140
150
T3 20
02
T4 20
02
T1 20
03
T2 20
03
T3 20
03
T4 20
03
T1 20
04
T2 20
04
T3 20
04
T4 20
04
T1 20
05
T2 20
05
T3 20
05
T4 20
05
T1 20
06
T2 20
06
Modèle utilisé
• Nous allons utiliser un modèle simplifié par rapport
aux généralités énoncées précédemment puisque la
décomposition de la série brute Y se fera uniquement
par l’estimation d’un mouvement saisonnier S et d’une
tendance X qui est l’agrégation des composantes T,C
et A vues précédemment. On suppose alors que le
modèle multiplicatif suivant va nous permettre
d’estimer ces deux composantes :
Y X S
Etape 1 : Première estimation de X
par la moyenne mobile.
• La périodicité du mouvement étant d’une
année, soit 4 trimestres, une première
estimation de X notée est réalisée à
partir des moyennes mobiles d’ordre 4 (les
données étant trimestrielles)
• Remarque : Si les données avaient été
mensuelles nous aurions utilisé une
MM12.
1X
Etape 2 : 1ère estimation du mouvement saisonnier S
• Une première estimation du mouvement saisonnier S est donc faite à
chaque date par le rapport saisonnier :
1
1
( )( )
tys t
x t
Vérification de la saisonnalité
Etape 3 : Deuxième estimation du
mouvement saisonnier
• Les rapports saisonniers, par exemple du premier
trimestre, prennent des valeurs différentes. Or, par
définition, le mouvement saisonnier doit être
parfaitement périodique. Il convient donc de calculer un
coefficient saisonnier unique pour chaque 1er trimestre,
puis de faire de même avec chaque autre trimestre.
• Le coefficient saisonnier d’un trimestre est calculé en
faisant la moyenne des rapports saisonniers obtenus
pour chaque année sur ce trimestre :
1 2003 1 2004 1 2005
2
( ) ( ) ( )( )
3
i i ii
s T s T s Ts T
iT
Etape 4 : Troisième estimation du
mouvement saisonnier S
• Le mouvement saisonnier ne devant pas avoir d’effet sur
une année complète, on s’attend à ce que la moyenne
des coefficients saisonniers soit de 1. Or la moyenne
des coefficients saisonniers ne vaut pas 1 mais 0.9966.
Il convient donc de corriger chaque coefficient en le
divisant par 0.9966 :
23
( )( )
0.9966
ii
s Ts T
Date CA global
T3 2002 98 0,9029 0,906
T4 2002 100 0,9986 1,002
T1 2003 110 101 1,0891 1,1126 1,1164
T2 2003 98 101 0,9703 0,9724 0,9757
T3 2003 94 102,38 0,9182 0,9029 0,906
T4 2003 104 103,75 1,0024 0,9986 1,002
T1 2004 117 105 1,1143 1,1126 1,1164
T2 2004 102 107,38 0,9499 0,9724 0,9757
T3 2004 100 111,25 0,8989 0,9029 0,906
T4 2004 117 115,75 1,0108 0,9986 1,002
T1 2005 135 119 1,1345 1,1126 1,1164
T2 2005 120 120,38 0,9969 0,9724 0,9757
T3 2005 108 121,13 0,8916 0,9029 0,906
T4 2005 120 122,13 0,9826 0,9986 1,002
T1 2006 138 1,1126 1,1164
T2 2006 125 0,9724 0,9757
1( )x t2 ( )is T
1( )s t 3( )is T
Etape 5 : Deuxième estimation de
X : série CVS
• On réalise une deuxième estimation de X en
posant :
• Cette dernière estimation de la tendance
s’appelle la série CVS, c’est-à-dire corrigée des
variations saisonnières.
• Avec la méthode utilisée on a donc, d’après la
relation ci-dessus :
2
3
( )( )
( )
y tx t
s t
Y X S
Graphique comparatif
80
90
100
110
120
130
140
150
T3
20
02
T4
20
02
T1
20
03
T2
20
03
T3
20
03
T4
20
03
T1
20
04
T2
20
04
T3
20
04
T4
20
04
T1
20
05
T2
20
05
T3
20
05
T4
20
05
T1
20
06
T2
20
06
série brute
mm4
cvs