ModélisationStatistique - claroline.locean-ipsl.upmc.fr · Modélisation statistique Plan...
Transcript of ModélisationStatistique - claroline.locean-ipsl.upmc.fr · Modélisation statistique Plan...
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
Modélisation StatistiqueStatistiquesdescriptives
Modélisation
Linéaire Non Linéaire
Régressionlinéaire
Analyse en composantesprincipales Cartes topologiques
Classification
Régression
Supervisé
Perceptronmulti-couches
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
1/20
Sommaire du documentPlanModélisation statistiqueStatistiques descriptives
Découpage des coursStatistiques unidimensionnellesStatistiques bidimensionnellesStatistiques multidimensionnelles
Modélisation linéaireRégression linéaireAnalyse en composantes principales
Modélisation non linéairePerceptron multicouchesCartes topologiques
BibliographieNous joindreRéalisation
Dans ce document tous les liens actifs sont en vert
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
2/20 Schéma de la modélisation statistiqueStatistiquesdescriptives
Modélisation
Linéaire Non Linéaire
Régressionlinéaire
Analyse en composantesprincipales Cartes topologiques
Classification
Régression
Supervisé
Perceptronmulti-couches
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
3/20
StatistiquesdescriptivesStatistiquesdescriptives
unevariable
X
unevariable
X
deuxvariables
X ,Y
deuxvariables
X ,Y
plusieursvariables
Xk k ∈ [1, n]
plusieursvariables
Xk k ∈ [1, n]
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
4/20
Cours de statistiques descriptivesLe cours de statistiques descriptives comporte 3 cours:
I Statistiques unidimensionnelles
I Statistiques bidimensionnelles
I Statistiques multidimensionnelles
Statistiquesunidimensionnelles
Description du cours
Statistiquesbidimensionnelles
Description du cours
Description du coursStatistiquesmultidimensionnelles
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
5/20 Statistiques unidimensionelles 1/2
Caractéristiques:
I une seule variable X qui peut prendre n valeurs xiParamètres:
I moyenne
I médianeI quartiles
I variance et écart type
Représentations graphiques:
I camembertsI histogrammes
I boîtes à moustaches
Accès à la description du cours
Étude de cas
Statistiquesunidimensionnelles
Paramètres
MoyenneQuartiles:
médiane etautres quartiles
VarianceEcart type
Représentationsgraphiques
Camemberts Histogrammes Boîtes àmoustaches
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
6/20
Statistiques unidimensionelles 2/2
Statistiquesunidimensionnelles
Paramètres:Moyenne
x =1
n
n∑i=1
xi
Variance
V(X) =1
n
n∑i=1
(xi − x)2
Représentations graphiques:
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
7/20 Statistiques bidimensionelles 1/2
Caractéristiques:
I Deux variables X et Y
Indicateurs:I CovarianceI Coefficient de corrélation
Représentations graphiques:
I Diagrammes de dispersion
I Histogramme 2D
Accès à la description du cours
Étude de cas:Données environnementales
et effet de serre
Statistiquesbidimensionnelles
Déterminationdes indicateurs
Covariance Coefficientde corrélation
Représentationsgraphiques
Diagrammesde dispersion
Histogrammes2D
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
8/20
Statistiques bidimensionelles 2/2
Statistiquesbidimensionnelles
Paramètres:σX =
√V(X) σY =
√V(Y )
Covariance
Cov(X, Y ) =
n∑i=1
(xi − x)(yi − y)
Coefficient de corrélation
rxy = Cor(X, Y ) =Cov(X, Y )
σX σY
Représentations graphiques:
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
9/20 Statistiques multidimensionelles 1/2
Caractéristiques:
I Un grand nombre de variables XnIndicateurs:
I Vecteur moyen
I Matrice de covarianceI Coefficient de corrélation e
Représentations graphiques:
I Représentation géométrique
I Ellipsoïde de Mahalanobis
Accès à la description du cours
Statistiquesmultidimensionnelles
Déterminationdes indicateurs
Vecteur moyen Matrice decovariance
Matrice decorrélation
Représentationsgraphiques
Réprésentationgéométrique
Ellipsoïde deMahalanobis
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
10/20
Statistiques multidimensionelles 2/2
Statistiquesmultidimensionnelles
Paramètres:Sij = Cov(Xi , Xj ) et Sii = V(Xi )rij = Cor(Xi , Xj )
Matrice de covarianceS11 . . . S1p
.
.
....
.
.
.Sp1 . . . Spp
Matrice de corrélation
r11 . . . r1p...
.
.
....
rp1 . . . rpp
Représentation graphique:
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
11/20
Modélisation linéaireModélisation linéaire
Régressionlinéaire
Régressionlinéaire
Analyseen
composantesprincipales
Analyseen
composantesprincipales
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
12/20
Modélisation linéaireModélisation Linéaire
Deux variables X, Y
Régressionlinéaire
Analyse en composantesprincipales ACP
n variablesXk k ∈ [1, n]
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
13/20
Régression linéaireAccès à la description du cours
RégressionModélisationy = f (x)
Régression linéaire :Méthode des
moindres carrés
Modèle déterministe
Déterminationde a et b
par la méthode desmoindres carrés
Détermination de lavariable aléatoire ε
Régression Linéaire
y = ax + b
Modèle probabiliste
Régression
y = ax + b + εε variable aléatoire
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
14/20 Analyse en composantes principalesAccès à la description du cours
Première étude de cas:Variables climatiques liées à l’effet
de serre
Deuxième étude de cas :Températures locales et effet de serre
Analyse en com-posantes principales
Méthodes
Diagonalisation Méthode desmoindres carrés
But
Diminuerle nombre de variables
Obtenir desreprésentations
graphiques
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
15/20
Modélisationnon linéaireModélisationnon linéaire
CartestopologiquesCartestopologiques Perceptron
multicouchesPerceptronmulticouches
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
16/20 Perceptron multicouches
Les vidéos ci-dessous extraites d’une conférence de Sylvie Thiriavous permettront d’avoir un aperçu sur le perceptronmulticouche
Perceptron :introductionVidéo
Modèle directModélisation de la
fonction de transfertModélisation de l’incertitude
Vidéo
Modèle inversePerceptron Modèle inverse
Vidéo
Accès au cours sur IPSL formations
Etude de cas 1 : Régressionpar Perceptron Multicouche
Etude de cas 2 : Classificationpar Perceptron Multicouche
Application aux iris de Fisher
Etude de cas 3 : Reconnaissancedes chiffres manuscrits Codage desdonnées Masques et poids partagés
Etude de cas 4 : Modélisation dela fonction de transfert du diffu-
siomètre NSCAT et des incertitudes
Etude de cas 5 : Inversion desobservations du radiomètre Sea-WiFS pour la quantification desaérosols- comparaison avec l’al-gorithme standard de la NASA
Etude de cas 6 : Modélisation deséries chronologiques - Applica-
tion à la prévision du trafic SNCF
Etude de cas 7 : Etude de la prévis-ibilité de séries chronologiques detempératures issues de la base dedonnées ERA-Interim du centreEuropéen au moyen de modèlesneuronaux (perceptron multi-couches et cartes de Kohonen)
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
17/20 Cartes topologiques
Les vidéos ci-dessous extraites d’une conférence de Sylvie Thiriavous permettront d’avoir un aperçu sur les cartes topologiques(cartes de Kohonen)
Couleur de l’océanVidéo
Polution atmosphériqueVidéo
Accès au cours sur IPSL formations
Etude de cas 1 : Classificationpar cartes topologiques - Util-
isation de la SOM Toolbox
Etude de cas 2 : Caractérisationde phénomène d’upwelling
au large du Sénégal à partirtempératures de surface de
l’océan et des concentration enChlorophylle-a observées par satellite
Etude de cas 3 : Etude et prévi-sion du phénomène El Nino à
partir des anomalies mensuellesde températures de surface de lamer observées par satellite prèsdes côtes d’Amérique du Sud.
Etude de cas 4 : Etude de la prévis-ibilité de séries chronologiques detempératures issues de la base dedonnées ERA-Interim du centreEuropéen au moyen de modèlesneuronaux (perceptron multi-
couches et cartes topologiques)
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
18/20
Ouvrages sur la modélisation statistique
1. Saporta ,Probabilités, analyse des données et statistique, Springer 2011
2. G. Dreyfus, J.M. Martinez, M. Samuelides, M.B. Gordon, F. Badran, S. Thiria [2008], Apprentissage statistique(Réseaux de neurones, Cartes topologiques, Machines à vecteurs supports), Eyrolles 3ème édition, 2008.
3. Christopher M. Bishop [2006], Pattern recognition and machine learning, Springer 2006
4. Vladimir N. Vapnik , Statistical Learning Theory , Wiley 1998
5. Richard O. Duda, Peter E. Hart, David G. Stork, Pattern Classification, 2nd Edition Wiley 2000
6. Kohonen, Teuvo, Self-Organizing Maps Springer 2001
Page précédente Plan Nous joindre Page suivante
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
19/20
Nous joindre
I Les responsables du MASTER TRIED
I Les enseignants
Cécile MalletCécile Mallet est maître de conférences à l’UVSQ
et enseigne dans le master TRIED
Sylvie ThiriaSylvie Thiria est Professeur d’université
et enseigne dans le master TRIED
Page précédente Plan
Modélisationstatistique
Plan
Modélisationstatistique
StatistiquesdescriptivesDécoupage des cours
Statistiquesunidimensionnelles
(suite)
Statistiquesbidimensionnelles
(suite)
Statistiquesmultidimensionnelles
(suite)
ModélisationlinéaireRégression linéaire
Analyse encomposantesprincipales
Modélisation nonlinéairePerceptronmulticouches
Cartes topologiques
Bibliographie
Nous joindre
Réalisation
20/20
Réalisation du documentI FORMAV
http://formav.eu
22 Bd de la Libération
92370 Chaville
01.47.09.22.75
I Martine Arrou-Vignod
Ingénieur et Agrégée de Mathématiques
Directrice de FORMAV
Page précédente Plan