intro-stats - LIRMM
Transcript of intro-stats - LIRMM
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 1/36
Méthodes quantitativesen Sociologie
(Rappels)types de variablesmoyennes, écarts types, quantileseffectifs, fréquenceshistogrammetable de fréquences cumuléesdensitéloi des grands nombres
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 2/36
1. type de valeur1. qualitatif (nominal)2. quantitatif discret (qualitatif ordinal)3. quantitatif continu
2.ensemble de valeurs1. ouvert2. fermé
3.multiplicité1. unique2. multiple
Plusieurs types de variabless
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 3/36
type de valeurqualitatif (nominal)quantitatif discret (qualitatif ordinal)quantitatif continu
couleur des yeux, sexe, cheveux, catégorie socio-professionnelle,...
ensemble de valeurs fermé
Variable qualitative
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 4/36
longueur, poids, taille, âge,...
ensemble de valeurs ouvert
type de valeur:qualitatif (nominal)quantitatif discret (qualitatif ordinal)quantitatif continu
Variable quantitative continue
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 5/36
nombre d’enfants, années d’études,...
ensemble de valeurs fermé
type de valeur:qualitatif (nominal)quantitatif discret (qualitatif ordinal)quantitatif continu
Variable quantitative discrète
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 6/36
type de valeur:qualitatif (nominal)quantitatif discret (qualitatif ordinal)quantitatif continu
sport préféré, profession,...
ensemble de valeurs ouvert
Variable qualitative ouverte
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 7/36
Variable à valeurs multiples
type de valeur:qualitatif (nominal)quantitatif discret (qualitatif ordinal)quantitatif continu
sports pratiqués, âges des enfants, CSP des frères et soeurs,...
ensemble de valeurs ouvert ou fermé
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 8/36
Résumer une mesure
ModeMédiane (et quantiles)MoyenneVarianceEcart type
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 9/36
Variable qualitative
ModeMédiane (et quantiles)MoyenneVarianceEcart type
Valeur dont l’effectif est le plus élevé
type d'achat # prêts
véhicule 262
mobilier 61
divers 46
trésorerie 41
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 10/36
Variable quantitative
ModeMédiane (et quantiles)MoyenneVarianceEcart type
Somme des valeurs/Effectif total
nom note
Alain 3
Bernard 6
Catherine 8
Danièle 4
Eric 2
Françoise 1
somme 24
moyenne 4x = 1
nxi
i=1
i=n
∑
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 11/36
Variable quantitative
ModeMédiane (et quantiles)MoyenneVariance (empirique)Ecart type
Moyenne des carrés des écarts à la moyenne
A B C D
nom note écart^2 note^2
Alain 3 1 9
Bernard 6 4 36
Catherine 8 16 64
Danièle 4 0 16
Eric 2 4 4
Françoise 1 9 1
moyennes 4,00 5,67 21,67
Variance 5,67
v = σ2(x) = x2 − x 2
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 12/36
v = σ2(x) = (x − x )2 = x2 − 2 ⋅ x ⋅ x + x 2
v = σ2(x) = x2 − 2 ⋅ x ⋅ x + x 2 = x2 − x 2
La variance
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 13/36
Variable quantitative
ModeMédiane (et quantiles)MoyenneVarianceEcart type (empirique)
Moyenne quadratique des écarts à la moyenne
σ(x) = σ2(x) = x2 − x 2
nom note
Alain 3
Bernard 6
Catherine 8
Danièle 4
Eric 2
Françoise 1
Variance 5,67
Ecart type 2,38
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 14/36
v = σsb2 (x) = 1
2n(n −1)(xi − x j )
2
i=1, j=1, j≠i
i=n, j=n
∑
La variance sans biais (non empirique)
nom note A B C D E F
Alain 3 0 9 25 1 1 4
Bernard 6 9 0 4 4 16 25
Catherine 8 25 4 0 16 36 49
Danièle 4 1 4 16 0 4 9
Eric 2 1 16 36 4 0 1
Françoise 1 4 25 49 9 1 0
Variance 5,67 6,67 9,67 21,7 5,67 9,67 14,7
V. sans biais 6,8 8 11,6 26 6,8 11,6 17,6
Demi-moyenne des carrés des écarts
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 15/36
Variable quantitative
ModeMédiane (et quantiles)MoyenneVarianceEcart type
Valeur partageant la population en 2 moitiés
nom note
Françoise 1
Eric 2
Alain 3
Danièle 4
Bernard 6
Catherine 8
Médiane 3,5
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 16/36
Représentation graphique
CamembertHistogrammeHistogramme de ParetoFonction de répartition
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 17/36
Variable qualitative
CamembertHistogrammeHistogramme de ParetoFonction de répartition
type d'achat # prêts
divers 46
mobilier 61
trésorerie 41
véhicule 262# prêts
type d'achat
diversmobiliertrésorerievéhicule
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 18/36
type d'achat # prêts
véhicule 262
mobilier 61
divers 46
trésorerie 41
CamembertHistogrammeHistogramme de ParetoFonction de répartition
300
200
100
0véhicule mobilier divers trésorerie
type d'achat
# prêts
Variable qualitative
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 19/36
Variable quantitative
CamembertHistogrammeHistogramme de ParetoFonction de répartition
nom note tranche effectif
Françoise 1 1 à 3 3
Eric 2 4 à 6 2
Alain 3 7 à 9 1
Danièle 4
Bernard 6
Catherine 8
3
2,5
2
1,5
1
0,5
01 à 3 4 à 6 7 à 9
tranche
effectif
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 20/36
A B C D
trancheeffectif 0 0
1 à 3 3 3 3
4 à 6 2 6 5
7 à 9 1 9 6
Variable quantitative
CamembertHistogrammeHistogramme de ParetoFonction de répartition
6
5
4
3
2
1
01050
peut aussi être calculée sur les données
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 21/36
nom note tranche effectif
Françoise 1 1 à 3 3
Eric 2 4 à 6 2
Alain 3 7 à 9 1
Danièle 4 1 à 2 2
Bernard 6 3 à 4 2
Catherine 8 5 à 6 1
7 à 8 1
3
2
1
01 à 3 4 à 6 7 à 9
3
2
1
01 à 2 3 à 4 5 à 6 7 à 8
Des effectifs à la densité
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 22/36
effectif tranche densité
3 1 à 3 1,00
2 4 à 6 0,67
1 7 à 9 0,33
2 1 à 2 1,00
2 3 à 4 1,00
1 5 à 6 0,50
1 7 à 8 0,50
1,00
0,90
0,80
0,70
0,60
0,50
0,40
0,30
0,20
0,10
0,001 à 3 4 à 6 7 à 9
1,00
0,90
0,80
0,70
0,60
0,50
0,40
0,30
0,20
0,10
0,001 à 23 à 45 à 67 à 8
Des effectifs à la densité
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 23/36
Calcul des quantiles: interpolation linéaire
Données “en tranches” avec, pour chaque tranche:
m, la valeur minimum de la tranchef(m), la fréquence cumulée en md, la densité dans la tranche
q = m + f (q) − f (m)d
d = f (q) − f (m)q − m
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 24/36
tranche fréquence densité m f(m)
1 à 2 3,333e-1 0,17 0,5 0,00%
3 à 4 33,33% 0,17 2,5 33,33%
5 à 6 1,667e-1 0,08 4,5 66,67%
7 à 8 1,667e-1 0,08 6,5 83,33%
8,5 100,00%
Médiane:f(q)=50% (1/2)m = 3, f(m) = 33,33% (1/3),d=0,17 (1/6)
Calcul des quantiles: interpolation linéaire
q = m + f (q) − f (m)d
q = 2,5 + (50%-33,33%)/0,17= 3,5
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 25/36
Boite à pattes (ou à moustaches)
minimum 1er quartile médiane 3ème quartile maximum
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 26/36
Notion d’espérance mathématique
Exemple 1: lancer de pièceon lance la pièce (non pipée) un grand nombre de fois (n)on note le nombre de “face”l’espérance mathématique est n/2la moyenne est proche de n/2, et ce d’autant plus que n est grand
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 27/36
Notion d’espérance mathématique
Exemple 2: lancer de déon lance le dé (non pipé) un grand nombre de fois (n)on note la moyenne des chiffres tirésl’espérance mathématique est 7/2la moyenne est proche de 7/2, et ce d’autant plus que n est grand
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 28/36
Notion d’espérance mathématique
La loi des grands nombresn variables aléatoires de même loi, d’espérance mathématique ala moyenne tend, quand n augmente, vers l’espérance mathématique
x = 1n
X1 + ... + Xn)( tend vers a certain
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 29/36
Loi de Laplace Gauss (normale)
d(x) = 1σ 2π
e−( x−α)2
2σ2
densité donnée par (moyenne α et écart-type σ):
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 30/36
Loi normale
σ 2σ
95%la probabilité que la variable soit entre α−2σ et α+2σ est 95%
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 31/36
Théorème central limite
Soient n variables aléatoires d’espérance 0 et de moment d’ordre 2 (espérance du carré, variance) égal à σ2
On s’intéresse à la variable:
x = 1n
X1 + ... + Xn )(
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 32/36
d(x) = 1σ 2π
e− x2
2σ2
Théorème central limite
La densité de probabilité de la variable x tend vers une loi normale:
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 33/36
Théorème central limite
Applicationsdans la loi des grands nombres, l’écart type de la moyenne est racine(n)la courbe des fréquences cumulées tend vers la fonction de répartition
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 34/36
Exemple de loi normale
vous avancez en suivant toujours la même direction, en file indiennevous traversez une forêt:vous passez aléatoirement à droite ou à gauche des arbres qui sont sur votre chemin
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 35/36
La probabilité de passer à droite est de 50% (donc également 50% à gauche)
Exemple de loi normale
Méthodes quantitatives en Sociologie Joël Quinqueton
Université P ul Valéry
Montpellier III
21/01/00 36/36
La probabilité de passer à droite (dans le sens de la marche) est de 25% (donc 75% à gauche)
Exemple de loi normale (2)