LA STATISTIQUE
-
Upload
uriel-jimenez -
Category
Documents
-
view
38 -
download
0
description
Transcript of LA STATISTIQUE
![Page 1: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/1.jpg)
LA STATISTIQUE
SON HISTOIREET SES APPLICATIONS
![Page 2: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/2.jpg)
LA STATISTIQUEQUELLE EST CETTE DISCIPLINE ?
Petit Robert
Etude méthodique des faits sociaux par des procédés numériques (classements, dénombrements, inventaires chiffrés, recensements) destinée à renseigner et à aider les gouvernements.
Ensemble de techniques d’interprétation mathématique appliquées à des phénomènes pour lesquels une étude exhaustive de tous les facteurs est impossible, à cause de leur grand nombre et de leur complexité.
![Page 3: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/3.jpg)
LA STATISTIQUE
BIBLIOGRAPHIE
J. J. DROESBEKE et P. TASSI, Histoire de la statistique, Que sais-je ? n°2527, PUF, 1997.
Faut-il se fier aux statistiques ? Tangente, n°77 (octobre - novembre 2000).
G. BRONNER, Coïncidences, Vuibert, 2007.
![Page 4: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/4.jpg)
« Statistique » : du latin statisticum (ce qui se rapporte à l’Etat)
Gottfried Achenwall (1746) : premier enseignement de la
statistique (Allemagne)
En fait, origine plus ancienne :
mot déjà utilisé dans un texte administratif de Colbert
(vers 1666)
![Page 5: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/5.jpg)
Chefs d’Etats : connaître leur puissance : population, richesses,
potentiel militaire…
idée de recensement
Premiers recensements :
* Sumériens : 5000 à 2000 av J.-C.* Egyptiens : recensements systématiques de la population
Etats forts avec un système administratif fort
![Page 6: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/6.jpg)
Au début,
la statistique a consisté à observer des faits
Statistique descriptive
• XIVe siècle : début des enregistrements des actes civils
(naissances, mariages, décès)
![Page 7: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/7.jpg)
![Page 8: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/8.jpg)
Nombre de morts dans les hôpitaux militaires britanniques (guerre de Crimée)Florence Nightingale (1820-1910)
gris : maladies évitables brun : blessures mortelles rose : autres causes
![Page 9: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/9.jpg)
• XVIIe siècle : Probabilités estimations, prévisions
Extrapolation à partir d’une partie de la population(W. Petty: estimation de la population londonienne, 1686)
Juger d’après un échantillon:(problème de la représentativité)
Statistique inférentielle
![Page 10: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/10.jpg)
• XXe siècle : développement des sondages (U.S.A.)
* 1885 : création de l’Institut International de la Statistique (IIS)
* 1895 – 1925 : débat sur la représentativité (IIS)
- A. Kiaer (Norvège) : « une partie pour le tout »
réactions violentes
* Après 1925 : « Comment tirer l’échantillon ? »
![Page 11: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/11.jpg)
•Date cruciale : 3 novembre 1936
Election présidentielle américaineF. Roosevelt versus G. Landon
•Magazine Literary Digest : 2000 000 personnes (téléphone)
Landon
•G. Gallup : 3 000 personnes Roosevelt
Principe de la validité d’un sondage accepté
![Page 12: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/12.jpg)
-5000 -2900 1600 1700 1800 1900
2000
Recensements, sondages
1666: Colbert1746: Achenwall
1885: IIS 1936: Roosevelt vs Landon1938: IFOP
1946: INSEE
Valeurs typiques
1602: moy. arith. Tycho Brahé
1722: moy. pond.Roger Cotes
1757: médianeBoscovich
1805: varianceLegendre, Gauss
1874: moy. géom. moy. Harm. W.S. Jevons
Graphiques 1637: Descartes 1786: diag. en barres diag. en secteurs W. Playfair
1855: diag. pol.F. Nightingale
1874: Pyram. des âges Surf. de corrélation
Indices 1707: nombre indice Fleetwood
1738: indice des prix Dutot
1865: Laspeyres1875: Paasche
Ajustement, corrélation, régression1805-1806Legendre-GaussMoindres carrés
1888 et 1896:Galton et K. PearsonCoef. de Corrélation.
1904: K. Pearson, Khi-deux1904 Spearmann, rho
1938: Kendall
Tau
![Page 13: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/13.jpg)
La statistique fait partie de la culture
ANGLO-SAXONNE
Culture probabiliste indispensable
Enorme retard en France
![Page 14: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/14.jpg)
• Causes :
- Statistique: parent pauvre des probabilités et des mathématiques
- Forte imprégnation cartésienne
- L’«incertain» est antipédagogique (déstabilisant …)
- Nette préférence pour l’enseignement de certitudes
- Association obligatoire avec une autre discipline (bio., gestion,...)
(l’approche pluridisciplinaire est encore mal acceptée)
![Page 15: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/15.jpg)
• Conséquences :
* Bon sens statistique insuffisamment développé
* La présentation de données statistiques : un exercice « difficile »
* « Un chiffre ne peut être qu’exact , exempt de toute
indétermination »
Risque de manipuler l’opinion
![Page 16: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/16.jpg)
Exemples :
• moyenne, médiane
• cote de popularité des hommes politiques
• classement des hôpitaux, des lycées…
• rapports d’«experts» …
![Page 17: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/17.jpg)
Connaître, c’est mesurer (Brunschvicg)
La statistique nous dit:
* Comment effectuer les mesures
* Comment extraire l’information des mesures
![Page 18: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/18.jpg)
INFORMATION
Principale matière première du XXIe siècle
Sa production et son exploitation
statisticiens
![Page 19: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/19.jpg)
LA VARIABILITE En général, dans une population, la variabilité
est un critère de qualité , voire une nécessité (pour la survie)
Exception : l’industrie
Le statisticien doit savoir :- appréhender- analyser- « gérer » la variabilité
La variabilité est une entrave à l’inférence statistique
Qualité de la variabilité
![Page 20: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/20.jpg)
moyenne variance 2
proportion
Moyenne xvariance s2 proportion x/n
Population Echantillon( x1 , x2 , ...., xn )
tirage
Inférence statistique
inconnues
![Page 21: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/21.jpg)
LA STATISTIQUE DESCRIPTIVE
LA STATISTIQUE INFERENTIELLE
Série statistique univariée Série statistique bivariée La modélisation Les plans d’expériences Les sondages L’estimation Les tests statistiques Les séries chronologiques L’analyse des données
Le data mining
![Page 22: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/22.jpg)
LA MODELISATION
En général, une observation dépendd’un grand nombre de
facteurs
cause multifactorielle
les effets des facteurs ne sont pas simplement additifs
(présence d’interactions)
![Page 23: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/23.jpg)
LA MODELISATION (suite)
Le statisticien va tenter :
d’identifier les facteurs prépondérants
évaluer leur importance relative
expliciter le lien de ces facteurs « causaux »avec le caractère étudié, à
l’aide d’un
modèle mathématique
![Page 24: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/24.jpg)
Exemple :
variable expliquée : prix d’une voiture
variables explicatives : cylindrée, puissance, vitesse, largeur, longueur, poids …
prix = 1775 + 103,8 puissance + 9,8 poids (CV DIN) (kg)
![Page 25: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/25.jpg)
Exemple: biométrie foetale
Log10 EPF = 1,6961 + 0,02253 PC + 0,01645 PA + 0,06439 LF
(Weiner et al., 1985)
EPF: estimation poids fœtal (en g)PC: périmètre crânien (mm)PA: périmètre abdominal (mm)LF: longueur fémur (mm)
![Page 26: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/26.jpg)
Statisticiens Interlocuteurs privilégiés des décideurs
• dans tous les secteurs d’activité :
( politique, économique, scientifique, industriel … )
et
• à tous les niveaux :
(collecte de données, conception des systèmes d’information, contrôle de la production, analyse et restitution des données, etc.)
![Page 27: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/27.jpg)
Diversification des métiers de la statistique
Discipline transversale par excellence
![Page 28: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/28.jpg)
DOMAINES D’ UTILISATION DE LA STATISTIQUE
STATISTIQUES OFFICIELLES (I.N.S.E.E.) PRESSE – MEDIAS BANQUES – ASSURANCES SCIENCES DE LA VIE ENVIRONNEMENT ( Foresterie, pêche …) SANTE SCIENCES HUMAINES ENTREPRISES – INDUSTRIE ( R&D, contrôle
de qualité, études de marché, management … )
FINANCE RECHERCHE FONDAMENTALE ET APPLIQUEE etc …
![Page 29: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/29.jpg)
et même … LA POESIE !
![Page 30: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/30.jpg)
• BANQUES
Probabilité qu’un client rembourse son crédit ?
Cette probabilité peut être exprimée en fonction :
- du montant moyen de son compte courant- de la durée du crédit- du montant du crédit- du sexe- de la situation familiale
etc …
![Page 31: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/31.jpg)
• ASSURANCES (calcul des primes)
Assurance décès
- Taux d’intérêt- Tables de mortalité- Frais de gestion
Assurance-auto
Tarif unique ou différencié ?
![Page 32: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/32.jpg)
• Le risque dépend de nombreux facteurs :
* Assuré :- Age- Sexe- Profession- Résidence- Expérience, etc …
* Véhicule :- Modèle- Puissance, etc …
![Page 33: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/33.jpg)
• Etude du « risque ou coût » (actuariat)
par des méthodes de régression
« juste tarif » mieux résister à la concurrenceproblèmes de déontologie et d’éthique
![Page 34: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/34.jpg)
SCIENCES DE L’ENVIRONNEMENT
Surveillance d’un milieu (qualité d’une eau,…) Estimation de l’effectif d’une population Toxicologie de l’environnement, analyse du
risque Epidémiologie environnementale Prévision des effets du réchauffement
climatique Phénomènes extrêmes (vagues, cyclones, …) Prévision des épisodes de pollution (ozone) etc.
![Page 35: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/35.jpg)
Estimation du nombre de jours/an avec des températures > 35°CPériode 2090-2099 (Météo-France, 2007)
![Page 36: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/36.jpg)
SANTE – BIOLOGIE
Biométrie Imagerie médicale Génétique (trouver les gènes « coupables ») Epidémiologie Statistique de la preuve en sciences
forensiques Diagnostic médical (aide au diagnostic) Essais cliniques etc.
![Page 37: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/37.jpg)
Comparaison de deux traitements contre le VIH(Essai Trianon-ANRS81, INSERM U738)
![Page 38: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/38.jpg)
PharmacocinétiqueConcentration de théophylline (médicament contre l’asthme) chez 12 individus pendant 24 heures (IUT de Paris, département STID)
![Page 39: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/39.jpg)
LES ESSAIS CLINIQUES
Comparaison de plusieurs traitements
Essais cliniques randomisés en double-aveugle
Abstraction des aspects psychologiques : médecin et malade
Introduction du hasard dans l’expérience médicale
![Page 40: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/40.jpg)
• Exemple : un nouveau médicament a-t-il des effets secondaires ?
Effectifs observés
Traitement
Placebo
Nausées
Oui Non
15 35
4 46
![Page 41: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/41.jpg)
• Exemple : un nouveau médicament a-t-il des effets secondaires ?
Effectifs observés - Effectifs Théoriques
Traitement
Placebo
Nausées
Oui Non
15 9,5 35 40,5
4 9,5
46 40,5
2 = 7,86 Probabilité critique : 1%
![Page 42: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/42.jpg)
• Les risques d’erreur
Pas d’effetssecondaires
Effets secondaires
Décision Correcte
Décision Correcte
Décision du statisticien
Situationréelle
Pas d’effetssecondaires
Effets secondaires
Décision erronéePromotion d’unmauvaismédicament
Décision erronéePerte d’un bonmédicament
![Page 43: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/43.jpg)
•Poème de 429 mots découvert en 1985
Question : Shakespeare en est-il l’auteur ?
Le vocabulaire du poème s’écarte-t-il de façon statistiquement significative du vocabulaire shakespearien connu ?
* Méthode basée sur l’étude comparative :
- de la fréquence des répétitions et
- de l’ étendue du vocabulaire
échantillons successifs de 429 mots dans l’œuvre complète
![Page 44: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/44.jpg)
• L’œuvre complète comprend 31 534 mots distincts sur un total de 884 647 mots,
répartis de la manière suivante :
• 14 376 mots apparaissent une fois• 4 343 mots deux fois• 2 292 mots trois fois
etc …• 846 mots apparaissent plus de cent fois.
•La structure des répétitions est comparée à celle des œuvres de Marlowe, Ben Jonson …
![Page 45: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/45.jpg)
L’hypothèse : « Shakespeare est l’auteur du sonnet »
est remplacée par
l’hypothèse : « La structure des répétitions est comparable à celle
de l’œuvre de Shakespeare »
Conclusion : le sonnet a bien été écrit par Shakespeare ;
la probabilité d’erreur est faible
![Page 46: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/46.jpg)
DEBOUCHES
Banques Sociétés de placement collectif Compagnies d’assurance Services de marketing Sociétés de sondage Environnement Industrie pharmaceutique, santé (biostatistique) Industrie agroalimentaire Services de contrôle de la qualité de la production
(automobile, eau, etc.)
...
![Page 47: LA STATISTIQUE](https://reader036.fdocument.pub/reader036/viewer/2022062300/56812a46550346895d8d7ffb/html5/thumbnails/47.jpg)
à méditer …
Le hasard est la somme de nos ignorances
(Laplace)
Le hasard, cet hôte indésirable de la pensée humaine …
(Gérard Bronner)