Prévisions trafic aérien
description
Transcript of Prévisions trafic aérien
Présentation 8 juin 2012
ADN – Alexander’s Drifts Net
Préparé et présentépar Alexandre SERVIGNE – Responsable des Prévisions de traficet Raphaël BOUDRA – Support Statistiques et Méthodes
Orly, Décembre 2010
Plan
1 PRESENTATION D’ ADN » 1.1 Eléments de contexte
Principales variables prévuesDifférentes segmentations
2 PRESENTATION DU MOTEUR « ADN »2.1 Architecture2.2 Modèles intégrés
NPSARIMASARIMAXDECOMPOSITION TENDANCE CYCLEMODELES ECONOMETRIQUES
2.3 Agrégation des prédicteurs
3 Piste: optimisation quadratique sous contrainte linéaire
Orly, Décembre 2010
PRESENTATION D’ »ADN »
Orly, Décembre 2010
Production des prévisions de trafic à court, moyen et long termes, indispensables à l'entreprise :
1/ pour sa gestion courante;
2/ pour élaborer son programme d'investissement;
3/ pour alimenter sa réflexion stratégique;
4/ pour permettre d'élaborer certains document contractuels ou légaux ;
5/ pour alimenter ses études d'opportunité sur les opérations d'acquisition d'aéroports tiers.
Eléments de contexte
Orly, Décembre 2010
Principales variables prévues
1.2 Principales variables prévues…
Orly, Décembre 2010
1.2 Principales variables prévues…
Nombre de passagers : 88 Millions en 2011
Passagers en Origine/Destination
Passagers en Correspondance
Orly, Décembre 2010
1.2 Principales variables prévues…
Nombre de Mouvements : 735 400 en 2011
Mouvements mixtes
Mouvements cargos
Orly, Décembre 2010
1.2 Principales variables prévues…
Emport ( nombre moyen de passagers par avion ) : 130
Orly, Décembre 2010
1.2 Principales variables prévues…
Masse Maximale au Décollage par catégorie avion : 36 Millions tonnes/an
Orly, Décembre 2010
Une segmentation du trafic à géométrie variable selon la demande :
Orly, Décembre 2010
• géographique : 12 régions, 200 pays, 2000 destinations
1.3 segmentation du trafic à géométrie variable selon la demande
Orly, Décembre 2010
• physique : 2 plateformes, 13 aérogares
1.3 segmentation du trafic à géométrie variable selon la demande
Orly, Décembre 2010
• stratégique : 200 compagnies aériennes, alliances et code-share.
1.3 segmentation du trafic à géométrie variable selon la demande
Orly, Décembre 2010
• comptable : 5 faisceaux de facturation
1.3 segmentation du trafic à géométrie variable selon la demande
Orly, Décembre 2010
Compte tenu :
• la multiplicité des facteurs à prendre en compte
• de leurs intéractions
• la multiplicité des flux et de leurs configurations
• l’homogénéité à préserver
Motivation de »ADN »
Orly, Décembre 2010
l’outil nécessite :
• de la flexibilité
• de la traçabilité
• de la modularité
• une exécution rapide
Motivation de »ADN »
Orly, Décembre 2010
En résumé il doit permettre de se faciliter la vie à modéliser et dégager du temps pour aborder le transport aérien sous d’autres aspects:
Économique et géopolitiques : revenu des ménages, prix du pétrole, tensions géopolitiques, echanges commerciaux,…
Sociologique et démographique : population,…
Techniques : évolutions des types avions, consommation, ..
stratégiques : concurrence des autres modes de transport, degré de concentration ( alliance, fusion,..),
structure des réseaux, low-cost,..
Financiéres : taxes , redevances , prix du billet,..
Réglementaires : sureté, sécurité, développement durable,..
Capacitive : sureté, sécurité, développement durable,..
Motivation de »ADN »
Orly, Décembre 2010
1.2 caractéristiques
« ADN » est un moteur de calcul intégré dans une architecture dont les données sont organisées en arborescence.
Il intègre des prédicteurs paramétriques et non paramétriques
et fournit une prévision en agrégeant ces prédicteurs.
Orly, Décembre 2010
1.2 caractéristiques
Un outil de simulation et d’aide à la décision qui doit prendre en compte :
1. les prévisions du modèle Kenza 2. l’expertise métier 3. les points cibles décidés par le comité exécutif
Orly, Décembre 2010
1.4 Quelle architecture ?
Quelle architecture ?
Orly, Décembre 2010
Régions
Pays
Villes
Terrains
Opérateurs
Une architecture dont les données sont organisées en arborescence :
ADP
1.4 Quelle architecture ?
Orly, Décembre 2010
…. Et les arborescences peuvent être corrélées entre elles
PAX
MVT
EMPORT MMD
1.4 Quelle architecture ?
Orly, Décembre 2010
Orly CDG
ADP
Régions
Pays
Villes
Terrains
Opérateurs
Une architecture approchée à différents niveaux par différentes méthodologies :
PAX
KENZA
ADN
Point Cible
Expertise métier
Orly, Décembre 2010
Orly CDG
ADP
Régions
Pays
Villes
Terrains
Opérateurs
Une architecture approchée à différents niveaux par différentes méthodologies :
KENZA
PAX
Orly, Décembre 2010
Orly CDG
ADP
Régions
Pays
Villes
Terrains
Opérateurs
Une architecture approchée à différents niveaux par différentes méthodologies :
PAX
Expertise métier
Orly, Décembre 2010
Orly CDG
ADP
Régions
Pays
Villes
Terrains
Opérateurs
Une architecture approchée à différents niveaux par différentes méthodologies :
Point Cible
PAX
Orly, Décembre 2010
Orly CDG
ADP
Régions
Pays
Villes
Terrains
Opérateurs
Une architecture approchée à différents niveaux par différentes méthodologies :
ADN
PAX
Orly, Décembre 2010
Exemple de segmentation
Orly, Décembre 2010
1.5 Une architecture à créer en fonction de la demande :
NA
TIO
NA
L
SC
HE
NG
EN
AU
TR
E U
E
DO
M-T
OM
RE
ST
E D
U M
ON
DE
ADP
Les faisceaux ne sont pas homogènes en terme de comportement des consommateurs. Il n’est donc pas pertinent de modéliser ce niveau de détail.
Segmentation souhaité : faisceaux de facturation
Orly, Décembre 2010
1. Une architecture à créer en fonction de la modélisation
Segmentation pertinente pour la modélisation : la région
EU
RO
PE
DE
L’E
ST
A
ME
RIQ
UE
LA
TIN
E
AU
TR
E A
SIE
DO
M-T
OM
AF
RIQ
UE
NA
TIO
NA
L
AM
ER
IQU
E D
U N
OR
D
EU
RO
PE
DU
SU
D
EU
RO
PE
DU
NO
RD
PO
UR
TO
UR
ME
DIT
ER
RA
NE
E
AS
IE D
EV
EL
OP
PE
RE
ST
E D
U M
ON
DE
Les régions regroupent les pays qui évoluent dans un contexte économique et démographique comparables.
ADP
Orly, Décembre 2010
1.4 Cohérence des segmentations
Les segmentations sont-elles cohérentes entre-elles?
Orly, Décembre 2010
1. Cohérence entre segmentation souhaitée et modélisée
AMERIQUE LATINE
SCHENGEN AUTRE UE DOM-TOMRESTE DU MONDE NATIONAL
EUROPE DE L’ESTFRANCE
EUROPE DU SUD
EUROPE DU NORD
DOM-TOM
AMERIQUE DU NORD
ASIE DEVELOPPE
AFRIQUE
AUTRE ASIE
MEDITERANNEE
Faisceaux
Régions
Orly, Décembre 2010
1. Cohérence entre segmentation souhaitée et modélisée
A quel faisceau faut-il rattacher la région Europe de l’est ? 3 faisceaux lui sont associés .
AMERIQUE LATINE
SCHENGEN AUTRE UE DOM-TOMRESTE DU MONDE NATIONAL
EUROPE DE L’ESTFRANCE
EUROPE DU SUD
EUROPE DU NORD
DOM-TOM
AMERIQUE DU NORD
ASIE DEVELOPPE
AFRIQUE
AUTRE ASIE
MEDITERANNEE
Faisceaux
Régions
Orly, Décembre 2010
1. Cohérence entre le découpage souhaité et celui modélisé
A quel niveau de détail faut-il descendre pour ne pas avoir ce chevauchement ?
Orly, Décembre 2010
ADP
EU
RO
PE
DE
L’E
ST
A
ME
RIQ
UE
LA
TIN
E
AU
TR
E A
SIE
DO
M-T
OM
AF
RIQ
UE
AM
ER
IQU
E D
U N
OR
D
EU
RO
PE
DU
SU
D
EU
RO
PE
DU
NO
RD
PO
UR
TO
UR
ME
DIT
ER
RA
NE
E
AS
IE D
EV
EL
OP
PE
RE
ST
E D
U M
ON
DE
NA
TIO
NA
L
Rep
. Tch
èqu
e
Ro
um
anie
Regroupement de pays : Albanie, Arménie
L’arborescence intégrera les pays afin d’associer les régions aux faisceaux
1. Cohérence entre le découpage souhaité et celui modélisé
Orly, Décembre 2010
ADP
L’arborescence intégrera les pays afin d’associer les régions aux faisceaux
ADP
1. Cohérence entre le découpage souhaité et celui modélisé
Orly, Décembre 2010
ADP
L’arborescence intégrera les pays afin d’associer les régions aux faisceaux
ADP
1. Cohérence entre le découpage souhaité et celui modélisé
Orly, Décembre 2010
• Dans la littérature on entend parler de :
« Blue Chip Average Forecast », « Consensus Forecast ».
=> Il s'agit de moyennes de prévisions issues de divers organismes.
« ADN »: SYSTÈME AUTOMATIQUE DE PREVISIONS
PROPOSANT UNE ALTERNATIVE A LA SELECTION DE
MODELE ...
• « ADN » permet d'obtenir des prévisions par combinaisons
de prédicteurs paramétriques et non paramétriques.
Présentation d’ »ADN »
Orly, Décembre 2010
1.Notation/Définition
On observe au cours du temps
2.Objectif
On cherche à prévoir ty
dt Ry )(
Formalisation du problème
Orly, Décembre 2010
•L’ »ADN » est un système permettant de modéliser le « détail » tout en respectant les prévisions issues du modèle KENZA.
•On suppose que est une série temporelle.
• La prévision est définie par son espérance conditionnelle:
dt RY )(
)(:ˆ ttt IYEy
Formalisation du problème
Orly, Décembre 2010
Méthodes intégrées dans « ADN »
Orly, Décembre 2010
1.1.2 EXEMPLE:
Modélisation statistique non paramétrique
BLOC 1 DERNIER BLOC = BLOC TEMOIN
SERIE MENSUELLE DE TRAFIC FAISCEAU « INTERNATIONAL » DU 1er JANVIER 2003 AU 01APR2012
BLOC 10 BLOC 20
r
r r
r
Orly, Décembre 2010
Modélisation statistique non paramétrique
EXPRESSION DES POIDS:
- La mise en œuvre de cette prévision requiert de choisir:
1- Le noyau K ( pas très influent ): on choisit le noyau gaussien
2- la taille des blocs r = taille d’une saison.
3- La fenêtre h(n) déterminée par validation croisée.
n
iTi
TiTi
K
KW
1,
,,
)(
),...,(),...,( 11, nh
YYYYKK riirnn
Ti,avec:
Orly, Décembre 2010
Modélisation statistique non paramétrique
COEFFICIENTS DE SIMILARITES : Wi,T ( r=12 ; h(n)=1,385) SERIE TRAFIC INTERNATIONAL
Orly, Décembre 2010
Modélisation statistique non paramétrique
hn
rjjnn
j
jhjhn Wms
s
mYY ).).(^
Yj centré réduit (provenant du passé)
•Réajustement de Yj aux valeurs présentes
Où:
• : moyenne du bloc j.
• : écart-type du bloc j.
• : poids quantifiant la proximité entre le dernier bloc centré réduit et le bloc j centré réduit.
jm
js
jw
FORMULE POUR LA PREVISION:
Orly, Décembre 2010
Modélisation statistique non paramétrique
•CALCUL D’UN INTERVALLE DE CONFIANCE DE LA PREVISION:
Loi conditionnelle de sachant hnY 1,..., rnn YY
• On estime cette loi conditionnelle par la loi discrète sur associée aux poids Wi,T:
hrnn YYY ,...,, 1
Ti
hn
ixY WxF
hi ,1
^
.1)(
On utilise les quantiles de cette loi pour déterminer un intervalle de
confiance de prévision conditionnelle à hnY
^
Orly, Décembre 2010
Modélisation statistique SARIMA
SQDPqdpSARIMA ),,)(,,(
où: est un bb de variance . S : période, (P,D,Q): ordres de la partie saisonnière. (p,d,q): ordres de la partie ARIMA classique.
Nombre de jeux de paramètres et donc de prédicteurs potentiels élevé!!!
Introduction de procédures de tests afin de réduire les temps de calcul.
nS
nDssd BQBQYBBPBBP )()(.)1)(()1)(( qQPp
)( n2
FORMULE:
Orly, Décembre 2010
Modélisation statistique SARIMAX
nnn BP
QX
BD
BNaY ).(.
)(
)(,1
1
1
FORMULE :
Dynamique de X1 Dynamique propre à Yn
En pratique: - On identifie la structure ARMA de Yn.
- On étudie le lien entre Yn et X1 via les corrélations croisées.- On en déduit des ordres possibles pour N1 et D1.
=> Nombre de jeux de paramètres et donc de prédicteurs potentiels élevé!!!
Introduction de procédures de tests afin de réduire les temps de calcul.
Orly, Décembre 2010
Modélisation statistique DECOMPOSITION TENDANCE+ CYCLE (4/4)
MODELE: tttt STY
En pratique:
On choisit une (ou plusieurs) forme pour la tendance
(linéaire, quadratique,…).
On régresse la composante saisonnière sur des harmoniques ie:
).sin(.).cos(.^
tbtaTY tt
Orly, Décembre 2010
Modélisation statistique MODELISATION ECONOMETRIQUE (4/4)
Catalogue de modèles:
« ADN » intègre un catalogue de modèles économétriques…:
Modèle linéaire Yt=a.Xt+b;Modèle Log-linéaire Yt=a.log(Xt)+b;Modèle exponentiel Yt=a.e(aXt+b);…
permettant de modéliser simplement la dépendance entre plusieurs variables
Orly, Décembre 2010
• A ce stade, on dispose de plusieurs prédicteurs j
fournissant chacun des prévisions: pour h=1,…,N.
=> AGREGATION
j
hty
^
Modélisation statistique : agrégation prédicteurs
Orly, Décembre 2010
Prévision par pondération uniforme => Poids exponentiels
Modélisation statistique : agrégation prédicteurs
Orly, Décembre 2010
On dispose de la série de trafic aérien du faisceau « International ».
Afin de juger de l’apport de la stratégie de pondération exponentielle
dans le système « ADN », nous modélisons cette série sur la période
s’étalant du 1er janvier 2003 au 1er mars 2011.
Nous disposons donc de 99 valeurs.
Nous comparons les performances en prévision sur les 12 données
suivantes de chacune des stratégies (« meilleur modèle »,
pondération uniforme, pondération exponentielle).
Application
Orly, Décembre 2010
Application
SERIE MENSUELLE DE TRAFIC FAISCEAU « INTERNATIONAL » DU 1er JANVIER 2003 AU 01APR2012
TEST VALIDATION
Orly, Décembre 2010
1.1.2 EXEMPLE:
Modélisation statistique DECOMPOSITION TENDANCE+ CYCLE (4/4)
PERFORMANCES DE DIFFERENTES STRATEGIES (RMSE) sur les 12 derniers mois en prévision
Uniform weights Exponential
weights
115235
31230
Tt
ititiT yyT
RMSE 2,,, )ˆ(
1:
Orly, Décembre 2010
• Rappel: si l’on désigne par la perte
cumulée du jème prédicteur sur les T premières échéances, alors la
stratégie d’agrégation par des poids exponentiels nous assure
en théorie de meilleures performances que celle du meilleur
prédicteur.
Fonction de perte : perte quadratique
)ln(2
.)(min)(sup,...,1
^
NT
MLELNj
jTnT
Modélisation statistique : agrégation prédicteurs
MOTIVATION
T
k
jkk
jT yylyL
1
)ˆ,(:)ˆ(
l
Orly, Décembre 2010
Modélisation statistique : agrégation prédicteurs probabilistes
p
j
jt
jtt fpf
11
ˆ:ˆ
Avec :
• le j-ème prédicteur à la date t
• et ,
jty
j
jt
jtj
tfL
fLp
))ˆ(exp(
))ˆ(exp(: ))(ˆlog(:)ˆ,( kj
jk yffyL
Orly, Décembre 2010
Résumé partiel
•Nous avons obtenus des prévisions pour différentes variables d’intérêt à différents niveaux de détail
A ce stade,
• SOMME DES PREVISIONS != SOMME DES PREVISIONS DES PARTIES
Orly, Décembre 2010
Résumé partiel
DEVELOPPEMENTS FUTURS...
Orly, Décembre 2010
2.5 Piste de résolution
Résoudre la problématique (respect des contraintes de cohérence + prévisions agrégées) comme un problème d’optimisation quadratique sous contraintes linéaires :
2ˆminarg:ˆ zyz
dCz
Rz d
Prévisions respectant
Contraintes cohérence
ContraintesCohérence
Prévisions statistiques
Orly, Décembre 2010
Fonction de perte adaptée à la prévision
)ˆ()ˆ(:ˆ '2zyzyzy
Avec
)ˆ(/10
0)ˆ(/1
:
11
NNt
t
yL
yL
Les prévisions sont d’autant plus changées qu’elles ont été mauvaises dans le passé/ On cherche à changer le moins possibles les prévisions qui ont été précises dans le passé
Orly, Décembre 2010
Les contraintes
ccc
KKKdzCdzC
dCz
Contraintes de cohérence
Contraintes KENZA
Orly, Décembre 2010
Bibliographie
Journal de la société française de statistiques, Gilles Stoltz