S1 Exam Statistiques Descriptives Www.cours-FSJES.blogspot.com
Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques...
-
Upload
jacqui-cartier -
Category
Documents
-
view
124 -
download
2
Transcript of Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques...
Deuxième partie : initiation au traitement quantitatif des
données ; éléments de statistiques descriptives
Introduction à la statistique
Tableau individu/variable
Caractère 1
sexe
Caractère 2
âge
Caractère 3
profession
… Caractère X
Individu 1
Individu 2
…
Individu n
I La statistique à une dimension : principaux types
de variables et leur représentation
P : population X : la variable xi : symbole d’une modalité i de chaque variable x1, x2, …xp : ensemble des modalités pour i allant
de 1 à p. ni : nombre d’individus ayant répondu xi à la
variable X n1, n2,…np : effectifs correspondant aux
modalités N : total des effectifs fi : fréquence soit ni/N
Distribution statistique de la population selon une
variable
Modalités xi
effectifs
Fréquence fi %
x1 n1 f1 = n1/N f1 *100
x2 n2 f2 = n2/N f2 *100
… …
xp np fp = np/N fp *100
Total N 1 100
Exemple
Modalité xi Effectifs ni
Fréquence fi %
Homme ; x1
40 40/110 = 0,36
36 %
Femme ; x2 70 70/110 = 0,64
64 %
Total 110 1 100 %
Autres conventions de notation
N = n1+ n1+…+ n1=p
iin
1
14070110/1110
70
110
40
1/.../1......
1/1/
21
11
1
111
NNexemple
NNNNN
ou
NN
nn
nnnnff
nnf
p
p
p
p
ii
p
ii
p
ii
I1 Les variables qualitatives
A/ Définition
B/ Les variables nominales
C/ Les variables ordinales
D/ La représentation des variables qualitatives
Origine sociale des étudiants de 1ère année de sociologie (1994-1995)
Modalités ni fi angle
indépendants
31 0,1 36°
Cadres et prof intellec sup
70 0,23 82,8°
Prof interm 76 0,24 86,4°
employés 26 0,08 28,8°
Ouvriers et inactifs
108 0,35 126°
Total 329 1 360°
• les diagrammes circulaires
Angle = 100 fi * 360/100 = 360 * fi
répartition des étudiants de sociologie selon l'origine sociale (enquête 1994-95)
10%
23%
24%
8%
35%
indépendants
cadres et pro intellecsup
prof interm
employés
ouvriers et inactifs
• Les tuyaux d’orgue
I2 Les variables quantitatives
Les variables discrètes
modalités effectifs
fréquence Effectifs cumulés Fréquence cumulée
0 n0 F0=n0/N n0 N0/N
1 n1 F1=n1/N n0+n1 (n0+n1)/N
…. … … …
xi ni Fi=ni/N n0+n1+…+ni (n0+n1+…+ni)/N
…. … … …
xp np Fp=np/N n0+n1+…+np= N (n0+n1+…+np)/N=1
Total N 1
Exemple : nombre d’enfants par couple
modalités
effectifs fréquence Effectifs cumulés
Fréquence cumulée
0 8 0,27 8 0,27
1 10 0,33 18 0,60
2 5 0,17 23 0,77
3 0 0 23 0,77
4 4 0,13 27 0,90
5 3 0,1 30 1
Total 30 1
Représentations des variables discrètes : les diagrammes en bâton
Les variables continues
- Données brutes non groupées
- Données groupées en classes
Variables continues groupées en classes
classes ni fi Centre de classe Ci
[y0-y1] n1 n1/N C1=(y0+y1)/2
[y1-y2] n2 n2/N C2=(y1+y2)/2
[yi-1-yi] ni ni/N Ci=(yi-1+yi)/2
[yp-1-yp] np np/N Cp=(yp-1+yp)/2
N 1
Exemple : résultat d’un amphi à un examen (cas de l’amplitude constante)
classes ni fi Centre de
classe Ci
[0-5] 39 39/145 = 0,27 2,5
[5-10] 58 58/145 = 0,4 7,5
[10-15] 36 36/145 = 0,25 12,5
[15-20] 12 12/145 = 0,08 17,5
145 1
Histogramme (amplitude constante)
Exemple : répartition des effectifs en 3 tranches d’âge d’amplitude variable
ni fi amplitude Ci
[20;30[ 2000 0,36 10 25
[30;50[ 3000 0,54 20 40
[50;55[ 500 0,09 5 52,5
Total 5500 1
Hi = ni/amplitude
Histogramme (amplitude variable)
Histogramme des fréquences (amplitude variable)
Tableau récapitulatifTypes de variables Type de tableaux Représentation
qualitatives
nominales
Effectifset
Fréquences
Diagramme circulaire
Tuyaux d’orgueordinales
quantitatives
discrètes
Effect, fréq, effect et fréq cumulés
Diagrammes en bâtons
continues
Non groupées : xi et ni ordonnés
Fonction FRE
Groupées en classes : effect, fréq, centre, amplitude
Histogrammes et histogrammes normés (amplitude variable)
II Les paramètres de position
II1 Le mode
Définition
Le mode M est la modalité de la variable qui correspond au plus grand effectif
Variables qualitatives
Modalités (xi) ni %
Indépendants 31 10 %
Cadres 70 23 %
Professions intermédiaires 76 24 %
Employés 26 8 %
Ouvriers et inactifs 108 35 %
total 329 100 %
Exemple : Origine sociale des étudiants de 1ère année de
sociologie (1994-1995)
Mode : ouvriers et inactifs
• Les variables quantitatives discrètes
Modalités (xi) Effectif ni Fréquence fi
0 8 0,27
1 10 0,33
2 5 0,17
3 0 0
4 4 0,13
5 3 0,1
Total 30 1
Mode : 1 enfant
• Les variables quantitatives continues (amplitude constante)
CM Li
21
1
M = mode
Li = borne inférieure de la classe modale
C = amplitude de la classe modale
∆1 = effectif classe modale – effectif classe précédente
∆2 = effectif classe modale – effectif classe suivante
Exemple : résultat d’un amphi à un examen (cas de l’amplitude constante)
Classes ni
[0;5[ 39
[5;10[ 58
[10;15[ 36
[15;20[ 12
145
M = 5 + (19/19+22)*5 = 7,32
• Les variables quantitatives continues (amplitude variable)
ni amplitude
hi
[20;30[ 2000 10 200
[30;50[ 3000 20 150
[50;55[ 500 10 100
5500
Même formule avec∆1 = valeur hi de la classe modale – valeur hi de la classe précédente∆2 = valeur hi de la classe modale – valeur hi de la classe suivanteM = 20 + (200/200+50)*10 = 28 ans
II2 La moyenne arithmétique
Les variables discrètes
NX
p
iii xn
1
Exemple : nombre d’enfants par couple
Modalités (xi)
Effectif ni
nixi
0 8 0
1 10 10
2 5 10
3 0 0
4 4 16
5 3 15
total 30 51
Moyenne = 51/30 = 1,70
• Les variables continues
Non groupées Groupées en classes
NX
p
iix
1
NX
p
iiiCn
1
Exemple : résultat d’un amphi à un examen
Classes ni Ci niCi
[0;5[ 39 2,5 97,5
[5;10[ 58 7,5 435
[10;15[ 36 12,5 450
[15;20[ 12 17,5 210
145 1192,5
Moyenne = 1192,5/145 = 8,22
II3 La médiane
La médiane est la valeur de la variable qui partage en 2 parties égales ou en 2 sous-ensemble égaux la population
La médiane est plus stable que la moyenne car elle n’est pas influencée par les valeurs extrêmes
• Les variables discrètes
x¡ n¡ effectifs cumulés
0 10 10
1 30 40
2 40 80
3 10 90
4 5 95
5 4 99
6 1 100
100
Nombre d’enfants par couple exemple 1
x¡ n¡ effectifs cumulés
0 5 5
1 25 30
2 20 50
3 15 65
4 15 80
5 12 92
6 8 100
100
Nombre d’enfants par couple exemple 2
• Les variables continues groupées en classes
C
NLiMe
nnn
i
i
11
...2
AvecLi : borne inférieure de la classe médianeni : effectif de la classe médianeC : amplitude de la classe médianen1+…+ni-1 : effectifs cumulés des classes précédant la classe médiane
Exemple : distribution de salaires
x¡ n¡ effectif cumulé
[0,2000[ 10 10
[2000,4000[ 30 40
[4000,6000[ 40 80
[6000,8000[ 10 90
[8000,10000[ 5 95
[10000,12000[ 4 99
≥ 12000 1 100
N=100
N/2 = 50 ===> intervalle médian correspond à l’effectif cumulé 80 soit [4000,6000[.L¡ = 4000
Me = 4000 + ((50-40)/40) 2000 = 4500 Frs