Module : Méthodes quantitatives Statistique Descriptive I ...

33
1 UNIVERSITE HASSAN II-AIN CHOK FACULTE DES SCIENCES JURIDIQUES ECONOMIQUES ET SOCIALES CASABLANCA Module : Méthodes quantitatives Statistique Descriptive I Eléments du cours de M. DAAMOUCH 2013-2014 Ensembles 5 et 6 Avertissement et conseil : Ce document est incomplet, il ne comprend ni l’intégralité du cours, ni les applications, ni les exemples, ni le travail pédagogique indispensable pour le comprendre. L’étudiant est tenu d’assister aux séances de cours

Transcript of Module : Méthodes quantitatives Statistique Descriptive I ...

Page 1: Module : Méthodes quantitatives Statistique Descriptive I ...

1

UNIVERSITE HASSAN II-AIN CHOK FACULTE DES SCIENCES JURIDIQUES ECONOMIQUES ET SOCIALES CASABLANCA

Module : Méthodes quantitatives

Statistique Descriptive I

Eléments du cours de M. DAAMOUCH

2013-2014

Ensembles 5 et 6

Avertissement et conseil : Ce document est incomplet, il

ne comprend ni l’intégralité du cours, ni les applications, ni les exemples, ni le travail pédagogique indispensable pour le comprendre. L’étudiant est tenu d’assister aux

séances de cours

Page 2: Module : Méthodes quantitatives Statistique Descriptive I ...

2

INTRODUCTION AU COURS

I- Définitions et Objectifs de la statistique

1- les objectifs de la statistique

La statistique a pour objet l’étude, à l’aide de traitements mathématiques, de

nombreux faits correspondant à l’observation d’un phénomène , dans le but de

rendre compte de la réalité, d’essayer de l’expliquer et d’aider à la prise de

décision.

Les objectifs de la statistique descriptive sont de décrire, de synthétiser, de

comparer des données recueillies sur un phénomène donné au cours des

différentes périodes ou en différents endroits.

2- Définitions

La statistique est une méthode de collecte, de présentation et d’analyse des

observations relatives à des individus appartenant à un même ensemble défini de

manière précise afin de mettre en évidence certaines propriétés générales de cet

ensemble.

La statistique descriptive est la partie de la statistique dont le rôle est de décrire un

phénomène ; en d’autres termes ; à le mesurer, à l’évaluer, à classer les mesures, à

présenter ces mesures sous forme de tableaux ou graphiques, à synthétiser ces

mesures par quelques indicateurs de manière à avoir une idée rapide et simple du

phénomène étudié et aussi pour permettre de faire des comparaisons.

Remarque : Il faut faire une distinction entre les statistiques et la statistique.

Les statistiques désignent les données quantitatives (chiffrés), c’est

l’information brute sous forme de données numérique

Exemple :

La statistique est la discipline qui s’attache à étudier ces données

numériques brutes dans le but de fournir le maximum des renseignements

sur le phénomène en question. Donc la statistique est une méthode

scientifique qui vise la description quantitative des chiffres bruts

Page 3: Module : Méthodes quantitatives Statistique Descriptive I ...

3

II- Apport de la statistique à la science économique :

a) La statistique est indispensable aux théoriciens de l’économie, puisqu’elle permet de

mettre en évidence l’interdépendance des phénomènes économiques et de vérifier la

validité de certaines hypothèses par confrontation de la théorie à la réalité.

b) La statistique est indispensable aux praticiens de l’économie, elle permet : aux

pouvoirs publics d’agir correctement en matière de politique économique et d’éviter le

déclenchement des cycles économiques négatifs (crises économiques) et permet aussi une

aide précieuse aux opérateurs privés dans leurs processus de prise de décisions en vue

d’une rationalisation optimale de la gestion des entités économiques.

III- Méthodes d’observation statistique

Deux méthodes principales pour collecter des données :

1- Recensement (enquête exhaustive)

Le recensement est une opération de collecte d’information qui porte sur toutes les

unités formant la population étudié.

Exemple :

2- Enquête par sondage (enquête partielle)

C’est une opération portant sur une partie de la population. Les unités statistiques

concernées par ce sondage constituent un échantillon. Ce dernier est choisi de

manière à représenter la population mère

Exemple :

IV- Vocabulaire utilisé en statistique descriptive :

La statistique utilise comme toute science qui se respecte un vocabulaire et des

concepts spécifiques qu’il faut présenter et définir avant tout propos.

1- Population statistique (ou univers statistique) : c’est l’ensemble de tous les

individus auxquels l’étude statistique s’intéresse.

Exemple :

2- Unité statistique (ou individu statistique) : un élément de cet ensemble ou plus

précisément élément qui composent la population

Exemple :

Page 4: Module : Méthodes quantitatives Statistique Descriptive I ...

4

3- L’échantillon : c’est une partie ou un sous ensemble de la population mère

Exemple :

4- Caractère statistique : c’est la propriété retenue pour développer l’étude

statistique

Exemple :

5- La Modalité : les modalités sont les différents états possibles d’un caractère ;

Exemple :

Un caractère peut être qualitatif ou quantitatif

a. Il est qualitatif lorsqu’ il ne peut être exprimé en valeur, on ne peut pas le

mesurer ou le quantifier mais seulement le repérer.

Exemple :

b. Il est quantitatif quand il peut être exprimé en valeur, il est mesurable ;

chiffrable.

Exemple :

Un caractère peut être quantitatif discret (discontinu) ou quantitatif continu.

Il est quantitatif discret si ses modalités sont des nombres entiers isolés ;

Exemple :

Il est quantitatif continu si ses modalités sont exprimées par des intervalles

de valeurs ;

Exemple :

6- Variable statistique : chaque modalité d’un caractère est constituée par un

nombre ou un ensemble de valeurs, appelé variable. Selon la nature de la

variable il y a variable discrète et variable statistique continue.

Page 5: Module : Méthodes quantitatives Statistique Descriptive I ...

5

Variable discrète prend des valeurs entières

Variable continue prend toute valeur dans un intervalle de mesure

7- Classe : c’est un groupement de valeurs selon les intervalles qui peuvent être

– ou non – égaux ; une classe se définit par deux limites : la limite inférieure

appartient à la classe, la limite supérieure est exclue de la classe. La différence

entre les deux limites donne l’amplitude.

Exemple :

8- L’effectif ou fréquence absolu : c’est le nombre d’individus ayant une valeur

de la modalité.

Exemple :

9- Fréquence relative : c’est la part de l’effectif de la modalité à l’effectif total

Exemple :

10- Série statistique : c’est l’ensemble des valeurs qui mesurent le caractère.

V- Symboles mathématiques utilisés en STATISTIQUE.

1- les valeurs de caractère sont symbolisées par ni xxxx ......,,...,, 21 on parle des xi

Si la série est une série avec des classes les xi représenteront les centres de classes.

2- les effectifs sont symbolisés par ni nnnn .,.................,, 21 on parle des ni

L’effectif total est symbolisé par N .

3- la fréquence relative s’écrit : N

nf i

i

3- L’opérateur somme ∑ (se lit Sigma) ; On utilise ce symbole pour designer l’opération

Somme.

n

i

ini xxxxx1

21 ..........

Exemple : on a : 4321 xxxx =

4

1i

ix

5

2

5

2

5

2

44)(i

i

i i

ii bxabaxbax = a(x 2 )-(b) + ax 3 - b + ax 4 -b + ax 5 -b

= a ( 5432 xxxx ) – 4b.

Page 6: Module : Méthodes quantitatives Statistique Descriptive I ...

6

Propriétés du sigma

ana .

ii xaax

naxax ii

iiii yxyx

5- - L’opérateur produit (se lit Pi).

On utilise ce symbole si la variable se multiplie.

n

n

i

i xxxx

....21

1

Exemple :x 1 x 2 x 3 =

3

1i

ix ; ax 2 ax 3 ax 4 =a 3

4

2i

ix

Page 7: Module : Méthodes quantitatives Statistique Descriptive I ...

7

Chapitre I : Elaboration des tableaux statistiques

et représentation graphique.

Avant toute représentation graphique des données statistiques, il est primordial de faire

une classification de ses données dans des tableaux statistiques

I- Présentation des tableaux statistiques. Le dépouillement (dénombrement) des données statistiques permet de les synthétiser dans

des tableaux statistiques.

A- Présentation générale du tableau statistique

Considérons une population statistique P composé de n individu et décrite suivant le

caractère C dont les modalités sont : m1 , m2, ……,mk .on désigne par ni le nombre

présentant la modalité mi d’effectif ou fréquence absolue. Ainsi nous aurons le

tableau suivant :

Caractère étudié Effectif ou

fréquence absolue

Fréquence relative Pourcentage (%)

m1

m2

.

.

mi

.

.

.

mk

n1

n2

.

.

ni

.

.

.

nk

f1= n1/N

f2= n2/N

.

.

fi= ni/N

.

.

.

fk= nk/N

P1=f1 x100

P2=f2 x100

Pi=fi x100

.

.

.

Pk=fk x100

TOTAL Nn

k

i

i 1

11

k

i

if 1001

k

i

iP

N= effectif total

ni = nombre d’observation correspondant à la modalité mi

N = ki

k

i

i nnnnn

.........21

1

B- Cas d’un caractère qualitatif :

Dans une entreprise de 40 salariés, on se propose l’étude de l’état matrimonial de chaque

salarié. Après enquête les résultats ont été comme suit :

Notation : célibataire ( C ) , marié (M) , veuf ( V ) , divorcé ( D ) .

Page 8: Module : Méthodes quantitatives Statistique Descriptive I ...

8

M M M C C M M MV C M D V D V C C C M M M M M M M M C C C M V C D D C

C.D D D D

B- cas d’un caractère quantitatif discret :

Exemple (2) :

L’enquête auprès de 40 familles concernant le nombre d’enfants a charge, a donné les

résultats suivants : 5 1 1 3 0 2 3 0 4 6 5 2 1 5 5 4 6 3 2 0 1 6 4 3 1 0 1 5 6 4 3 2 6 6

5 4 3 6 0 1.

- L’ordre et le classement sont nécessaires.

Page 9: Module : Méthodes quantitatives Statistique Descriptive I ...

9

C- Cas d’un caractère quantitatif continu

Dans ce cas chaque modalité est une classe,[L1-L2[ et les classes peuvent être a

amplitudes égales ou inégales.

Exemple 3 : Soit une distribution statistique des ouvriers d’une E se selon leur âge.

- La limite inférieure de la classe fait partie de cette classe, alors que la limite

supérieure est exclue, mais fait partie de la classe suivante : [L1-L2[

- La 1ère

et la dernière classe de la série peuvent avoir des amplitudes indéterminées,

il convient de préciser leur limite.

- La colonne fi℅ cumulées croissante nous donne le ℅ des individus ayant une valeur

inférieure à xi.

Exemple :

- La colonne fi℅ cumulées décroissante nous donne le ℅ des individus ayant une

valeur supérieure à xi.

Exemple :

II) Représentations Graphiques.

Les graphiques constituent un mode de présentation de résultats statistiques sous forme

de tracé géométrique qui permet une description immédiate et complète. Selon la nature

du caractère, il y’a différents types de représentations graphiques.

A- Représentation graphique d’un caractère qualitatif :

Plusieurs types de graphiques sont utilisés pour représenter ce caractère, nous retenons 2

types : Les tuyaux d’orgue et le diagramme circulaire ou semi circulaire.

Page 10: Module : Méthodes quantitatives Statistique Descriptive I ...

10

1-le diagramme en tuyaux d’orgue :

Ce sont des tuyaux dont les bases sont égales, alors que la hauteur est proportionnelle

à l’effectif ou à la fréquence relative de la modalité.

Exemple1 :

2-diagramme circulaire

B- Représentation graphique d’un caractère quantitatif discret :

Il peut être représenté par 2 types de graphiques :

Le digramme en bâtons utilisant des effectifs ou des fréquences relatives.

La courbe cumulative qui nécessite des fréquences cumulées croissantes ou

décroissantes.

1- le diagramme en bâtons :

Chaque bâton issu d’une modalité à une longueur proportionnelle à l’effectif ou à

la fréquence de la modalité.

Exemple :

Page 11: Module : Méthodes quantitatives Statistique Descriptive I ...

11

2- la courbe cumulative croissante et décroissante.

C’est la courbe qui représente la fonction de répartition F(x).C’est une courbe en

escaliers.

Définition :on appelle fonction cumulative ou fonction de répartition la fonction

F(x) qui à toute valeur, associe la portion des individus dont le caractère est

strictement inférieur ( <) à x.

F(x) est définie pour toute valeur réelle de x telle que : x < xi

F(-∞) = 0 et F(+∞) = 1

Exemple :

C- Représentation graphique d’un caractère quantitatif continu.

On a 2 types de graphiques :

- l’histogramme pour représenter les effectifs ou les fréquences relatives.

- La courbe cumulative pour représenter les effectifs ou les fréquences

cumulées croissantes ou décroissantes.

1- l’histogramme :

c’est un ensemble de rectangles adjacents ayant des bases égales aux amplitudes

des classes et des hauteurs correspondant aux effectifs ou aux fréquences

relatives.

1er

cas : les classes ont des amplitudes égales.

Exemple :

Page 12: Module : Méthodes quantitatives Statistique Descriptive I ...

12

2ème

cas : les classes ont des amplitudes inégales. Il faut corriger les effectifs

ou les fréquences relatives en choisissant une amplitude de base a0 (en général

la plus petite)

i

ii

an

acorrigéna

ancorigénii

i

0. 0

Exemple :

Page 13: Module : Méthodes quantitatives Statistique Descriptive I ...

13

2- La courbe cumulative :

C’est le graphique représentant la fonction de réparation F(x)

Les valeurs de x sont les limites des classes, les valeurs de y sont les fi % cumulés

croissantes ou décroissantes

Si la courbe cumulative est croissante elle a pour coordonnées les limites supérieurs

des classes et les fi % cumulés croissantes

Exemple :

Page 14: Module : Méthodes quantitatives Statistique Descriptive I ...

14

Remarque : l’intersection des 2 courbes donne la valeur médiane Me

Page 15: Module : Méthodes quantitatives Statistique Descriptive I ...

15

CHAPITRE II : Les caractéristiques de tendance centrale

Les représentations graphiques, en permettant de faire une 1ère

synthèse des

informations contenues dans les tableaux et de donner les 1ères

conclusions pour une

distribution donnée, restent insuffisantes quand aux conclusions comparatives entre 2 ou

plusieurs séries statistiques, d’où l’importance des paramètres centraux.

On retient ceux les plus utilisés : la médiane (Me), le Mode (Mo), et les moyennes.

I- la médiane (Me).

A- définition : La médiane (Me) est la valeur du caractère telle que la moitié des

individus ont une valeur inférieure et l’autre moitié ont une valeur supérieure, la valeur

médiane partage l’histogramme en 2 aires égales.

B- Détermination de la médiane (Me).

1- cas d’une série simple :

a- Le nombre d’observation est impair N=2n+1=> n=2

1N ; la médiane correspond à la

(n+1) ème observations.

Exemple :les notes d’un candidat à l’examen sont :5-6-8-12-13-14-15.

N = 7 = 2n+1 => n = 3 ; la médiane correspond à la (n+1) observations. C’est la 4ème

note : Me=12.

b-le nombre d’observation est pair : N = 2n => n=2

N, la médiane correspond à

la2

1somme de (n) et la (n+1) observations.

Exemple : un étudiant a obtenu les notes suivantes :3-14-8-11-10-14-16-12.

Classement :3-8-10-11-12-14-14-16.

n =2

8 = 4. Me =

2

1211 = 11,5 ici on a un intervalle médian.

2-cas d’une série classée :

Exemple :

Page 16: Module : Méthodes quantitatives Statistique Descriptive I ...

16

a) détermination graphique de la médiane Me.

On trace les courbes cumulatives croissantes et décroissantes.

L’intersection des 2 courbes nous donne la médiane

b) détermination de la médiane par le calcul

Les étapes :

1 ere étape : le rang de la médiane 2

ni ou

2

% fi ou

2

fi

2ème

étape : détermination de la classe médiane [L1 , L2]

3ème

étape : calcul par interpolation linéaire

:

)(

)2

(

)(12

1

12

1

ii

i

i

nn

nn

LL

LMe Me = L 1 + [ (L 2 - L

1)

)(

)2

(

12

1

ii

i

i

nn

nn

]

Exemple

Page 17: Module : Méthodes quantitatives Statistique Descriptive I ...

17

II- Le mode (Mo)

A- Définition :

On appelle Mode (Mo) ou dominante d’une série statistique la valeur du caractère qui

a le plus grand effectif (ni) ou la plus grande fréquence relative (fi), c’est la plus

fréquente.

B- Détermination du mode Mo

1-cas d’une Variable discrète

La détermination est directe : le Mode (Mo) est la valeur de la modalité qui a le

plus grand effectif (ni) ou la fréquence relative (fi) la plus grande.

Exemple :

2-cas d’une variable continue.

a- Détermination graphique :

On trace l’histogramme, on joint les limites > du tuyau modal et de celui avant mode,

et on joint les limites < du tuyau modal et de celui après mode. L’intersection est

projetée sur l’axe des x.

Page 18: Module : Méthodes quantitatives Statistique Descriptive I ...

18

b- calcul du Mode :

On suit les étapes suivantes

* On corrige les ni si les classes sont d’amplitudes inégales

* On trace l’histogramme (facultatif) .

* On détermine la classe modale [L1-L2[.

* L’amplitude de la classe modale bi.

* La 1ère

différence 1 = ni – ni-1

* La 2ème

différence 2 = ni – ni+1

Le mode Mo est donné par la formule suivante :

Mo = L 1 + [ ib

21

1 ]

Exemple

Page 19: Module : Méthodes quantitatives Statistique Descriptive I ...

19

III- Les moyennes :

A- La moyenne arithmétique :

1- Définition : on appelle moyenne arithmétique de la variable xi, notée x (se

lit x barre) la valeur obtenue, en divisant la sommes des valeurs observées

de la variable par l’effectif total.

2- Formules de la moyenne x :

a- Formule simple : chaque valeur xi est observée une seule fois ni = 1

x = k

k

nnnn

xxxx

....

....

321

321 = N

x

n

xk

i

i

k

i

i

k

i

i

1

1

1

Exemple : la taille (en m) de 5 étudiants est : 1,56 m, 1,6 m, 1,62 m, 1,7 m, 1,8 m

x = N

xi

i

5

1 = 5

8,17,162,16,156,1 =

5

28,8 = 1,656 m.

Chaque étudiant a une taille moyenne de 1,656 m.

b- Formule pondérée ni 1

x = k

kk

nnn

xnxnxn

.....

....

21

2211 =

k

i

i

k

i

ii

n

xn

1

1

Formule selon laquelle la fréquence utilisée (absolue ou relative).

n

i

i

n

i

ii

n

xn

x

1

1 = 100

%1

n

i

ixfi

=

n

i

ii xf1

c- Les propriétés de la moyenne :

C-1 :

i

ii

n

xxn )( = 0

C-2 c’est par rapport à x que la quantité

i

ii

n

xxn 2)( est minimum.

Page 20: Module : Méthodes quantitatives Statistique Descriptive I ...

20

B- La moyenne géométrique :

On utilise cette moyenne lorsque la variable xi se multiplie.

Soit une variable xi prenant des valeurs x1, x2, x3,……xn.

1- Définition :

On appelle moyenne géométrique notée G, la racine Nème

du produit des

valeurs, elle a pour expression :

G = nxxxx ...321 = [

n

i

ix1

] 1/N

formule simple si ni=1

Si ni 1 : G = ni n

n

nn nxxx ....21

21 = [

n

i

xi1

ni]

1/∑ ni

2- Calcul de la moyenne géométrique notée G.

On utilise les logarithmes Log.

Soit G = 10 valeur obtenue

Si ni=1, Log G = in

1log xi

et si ni 1 Log G =

n

i

i

n

i

ii

n

xLogn

1

1

..

.

C- La moyenne harmonique :

1- Définition : Soit la variable statistique xi qui a pour valeurs x 1 , x 2 , x 3 ,……, x n .

On appelle moyenne harmonique notée H, le nombre dont l’inverse est égal à la moyenne

arithmétique des inverses des valeurs observées.

2- Formule de H.

Si ni = 1 H

1 =

N

1

ix

1 Formule simple

3- Formule pondérée : ni 1

H

1 = i

i

i x

n

n

1

H =

ix

N

1

H =

i

i

i

x

n

n

Page 21: Module : Méthodes quantitatives Statistique Descriptive I ...

21

On l’utilise quand le phénomène varie comme l’inverse de la variable ou quand la

variable possède une unité composée ; telle la vitesse.

D- La moyenne quadratique

1- Définition : On appelle moyenne quadratique notée Q de n valeurs x1,x2,x3….xn

prises par la variable statistique x, la valeur dont le carré est égale a la moyenne

arithmétique des carrés de ces valeurs.

2- Formule deQ .

* Formule simple : ni = 1 : Q2

= N

xxx n

22

2

2

1 .......=

N

xi2

Q =N

xi2

.

* Formule pondérée : ni 1 : Q2

=

i

ii

i

ii

n

xnQ

n

xn22

.

* Elle est utilisée quand la variable est élevée au carré.

Remarque : Les valeurs des 4 moyennes vérifient l’inégalité suivante :

H < G < ¯x < Q

Exemple : le personnel d’une entreprise est reparti selon le nombre d’enfants à leur

charge

x G H Q

Enfants

xi

Personnel

ni

1

2

3

4

5

6

10

30

20

50

20

10

140

Page 22: Module : Méthodes quantitatives Statistique Descriptive I ...

22

Chapitre III : Les caractéristiques de dispersion

Les caractéristiques de tendance centrale ne sont pas toujours suffisantes pour

caractériser une série statistique, car 2 séries peuvent avoir Mo= Me = x alors qu’elles

sont distribuées de façon différente comme le montre l’exemple suivant :

Exemple : on a 2 séries relatives au nombre de pièces mauvaises produites par 2

machines A et B par semaine.

Machine A : 39, 40, 40, 41, 41, 41, 42, 42,43

Machine B : 1, 21, 21, 41, 41, 41, 61, 61,81

On constate que ces 2 séries ont : Me = Mo = x = 41 pièces mauvaises, cependant les 2

séries sont différentes par la dispersion de leurs valeurs.

Pour la série A : les valeurs se concentrent autour de la valeur centrale tandis que

Pour la série B : les valeurs sont plus dispersées par rapport à la valeur centrale.

Pour mesurer le degré de dispersion de ces valeurs par la valeur centrale on fait appel a

quelques caractéristiques de dispersion telles : l’entendue (E) ; les quantiles ; la variance

et l’écart type.

I - L’étendue (E) ou l’intervalle de variation :

L’étendue notée (E) ou l’intervalle de variation d’une série statistique est la différence

entre la plus grande valeur et la plus petite valeur de la variable statistique

E = Limite finale – limite initiale

Exemple précèdent :

Machine A : E = 43 – 39 = 4

Machine B : E = 81 – 1 = 80

Remarques : - l’étendue est facile à calculer et contient 100% des observations.

- cette caractéristique n’est pas très fiable car elle dépend des

valeurs extrêmes du caractère, valeurs souvent aberrantes ou

accidentelles.

II- Les quantiles :

Ce sont des paramètres qui nous renseignent sur la dispersion des valeurs de la

variable par rapport à la médiane.

A- Les quartiles

1- Définition : les quartiles Q i sont des valeurs de variables qui partagent la série en 4

parties égales ; on a 3 quartiles notés Q 1 , Q 2 , Q 3 .

* Le premier quartile Q 1 est la valeur du caractère tel que 25% des observations de la

série ont une valeur inférieure à Q 1 et 75% des observations ont une valeur supérieure à

Q 1 .

* Q 2 c’est le éme2 quartile qui correspond à la médiane Q 2 =Me.

Page 23: Module : Méthodes quantitatives Statistique Descriptive I ...

23

* Le eme3 quartile Q 3 : c’est la valeur du caractère tel que 75% des observations de la

série ont une valeur inférieure à Q 3 et 25% des observations ont une valeur supérieure à

Q 3 .

__ E

QQQ _____________________0 321 _____

25% 25% Me 25% 25% 100%

2- L’intervalle interquartile : c’est la différence entre 3Q et 1Q noté : Iq = 3Q - 1Q

cet intervalle contient 50% des observations centrales, on peut le comparer à l’étendue

pour mesurer son importance par rapport à la série.

3- Détermination des quartiles 1Q et 3Q .

Comme la médiane Me, les quartiles se déterminent à partir des ni cum ↗ ou fi cum

↗ et ce graphiquement ou par le calcul.

a/ calcul de 1Q , 3Q , Me.

Exemple : répartition de 100 salariés d’une entreprise se selon le salaire mensuel en

(1000 DH)

Salaires ni

8 – 10

10 – 12

10 – 14

14 – 16

16 - 18

22

28

30

15

5

100

Page 24: Module : Méthodes quantitatives Statistique Descriptive I ...

24

B- les déciles (Di) et les centiles (Ci)

1- les déciles : on divise la population en 10 parties égales on obtient 9 déciles

D 1 , D 2 ………D 9 .

* Le premier décile D 1 est la valeur du caractère telle que 10% des observations de la

série ont une valeur inférieure à D 1 et 90% des observations ont une valeur supérieure à

D 1 .

* Le eme9 décile D 9 : c’est la valeur du caractère tel que 90% des observations de la série

ont une valeur inférieure à D 9 . et 10% des observations ont une valeur supérieure à D 9 .

Remarque : l’intervalle interdécile D 9 - D 1 contient 80% des observations

détermination des déciles graphiquement ou par calcul. On utilise les ni cumulatif.

* Calcul de D 1 et D 9 :

2- Les centiles Ci

On divisent les observations d’une série statistique en 100 parties égales on

obtient 99 centiles.

Page 25: Module : Méthodes quantitatives Statistique Descriptive I ...

25

* Le premier centile C 1 est la valeur du caractère telle que 1% des observations de la

série ont une valeur inférieure à C 1 et 99% des observations ont une valeur supérieure à

C 1 .

* Le eme99 centile C 99 : c’est la valeur du caractère tel que 99% des observations de la

série ont une valeur inférieure à C 99 . et 1% des observations ont une valeur supérieure à

C 99 .

Remarque : l’intervalle intercentile C 99 - C 1 contient 98% des observations

a- Détermination des centiles C 1 et C 99 . On utilise les ni cumulatifs.

III - La variance V(x) et l’écart type (σx)

A- La variance V(x) :

1- Définition : la variance est la moyenne arithmétique des carrés des écarts de la

variable xi à sa moyenne arithmétique x .

Elle se définit par la quantité suivante :

n

xxixVnsi

n

xxinxVnsi

i

i

ii

2

2

)(:1.

)()(:1.

formule de définition.

En développant la formule de définition on obtient une formule développée :

Page 26: Module : Méthodes quantitatives Statistique Descriptive I ...

26

V(x) =

i

ii

n

xxn 2)( =

i

ii

n

xn2

- x 2 = 2

ii xf - x 2 = 100

%2

ii xf- x 2 = Q 2 - x 2 .

2- l’écart type (σx) : l’écart type est la racine carrée de la variance V(x)

σx = )(xV =

21

2)(

i

ii

n

xxn

L’écart type montre de combien en moyenne, la variable xi s’écarte de sa moyenne x .

3- Le coefficient de variation C.V.

Le C.V. est le rapport de l’écart type à la moyenne qui s’exprime en %

C.V. = x

x100.

On utilise le CV pour apprécier l’importance de la dispersion d’une série ou pour

comparer deux séries entre elles .

B/ Calcul de V(x), σx et C.V.

On reprend l’exemple précèdent : le salaire mensuel (10 3 DH)

Page 27: Module : Méthodes quantitatives Statistique Descriptive I ...

27

Chapitre IV : Les caractéristiques de concentration :

L’étude de la concentration permet de caractériser un certain nombre de grandeurs

économiques (salaire, revenu, l’impôt, chiffres d’affaires, superficie …). On parle de

concentration chaque fois qu’il y a une inégalité de répartition entre les individus d’une

population donnée. C’est une notion statistique qui ne concerne que certaines séries

statistiques, celles où le caractère peut être additionné.

On peut donc parler de concentration de revenus, de concentration foncière, de

concentrations de capitaux …

I –MESURE DE LA CONCENTRATION PAR L’INDICATEUR

ECART MEDIANE – MEDIALE

La détermination de cet indicateur nécessite au préalable la connaissance de la notion

médiale.

A- La médiale

1-Définition :

La médiale d’un caractère statistique est la valeur qui partage la masse des valeurs en

deux parties égales

la Mle est donc la valeur du caractère qui partage la somme des ni xi en 2 parties égales,

50% de cette masse (∑ ni xi) est < à cette valeur et 50% est ≥ à cette valeur.

2-Exemple de détermination de la médiale :

Page 28: Module : Méthodes quantitatives Statistique Descriptive I ...

28

B- L ‘écart Médiale – Médiane : ΔM

La comparaison de la valeur de la médiale et de la médiane constitue une mesure de

la concentration

La mesure de l’écart entre médiale et médiane renseigne sur le degré de concentration

Plus l’écart est grand et plus la concentration est forte et il est nul en cas de parfaite

égalité.

ΔM = Mle - Me

Pour apprécier la concentration, on rapporte l’écart à l’étendue de la série :

100

E

M

Si ΔM est grand par rapport à l’étendue : la concentration est forte

Si ΔM est petit par rapport à l’étendue : la concentration est faible

Si ΔM est nul : la concentration est nulle(Mle =Me)→égalité parfaite

Exemple

Page 29: Module : Méthodes quantitatives Statistique Descriptive I ...

29

II- LA COURBE DE LORENTZ (COURBE DE CONCENTRATION) :

La courbe de concentration permet de représenter graphiquement la répartition des

valeurs d’un caractère quantitatif, discret ou continu, entre les individus de la population.

La courbe de concentration permet de comparer à une répartition strictement égalitaire, la

répartition d’une série statistique donnée.

A- Construction de la courbe de Lorentz :

Sur les 2 côtés d’un carré, on porte (à la même échelle) :

Sur les abscisses (axe OX), les fréquences cumulées croissantes en % des

individus de chaque classe soit fi % cumulés croissantes ou Fi

Sur les ordonnés (axe OY), les fréquences cumulées croissantes en % des

masses soit les nixi en % cumulés croissantes ou Fnixi

Remarque : Fnixi → 100 ii

ii

xn

xn cum ↗

On porte dans le carré les différents points cordonnées (Fi , Fnixi) ou (fi %

cum ↗, nixi en % cum ↗). La courbe de concentration est obtenue en

joignant les points représentés.

Page 30: Module : Méthodes quantitatives Statistique Descriptive I ...

30

Exemple d’application : Dans le service après vente d’un grand magasin

d’électroménagers. On a relevé la durée des dépannages effectués pendant un trimestre

Durée de dépannage (en minutes) Nombre

0 - 20

20 – 40

40 – 60

60 – 80

80 – 100

100 – 120

120 - 140

4

36

64

80

58

24

14

Page 31: Module : Méthodes quantitatives Statistique Descriptive I ...

31

B- Interprétation de la représentation

Une répartition strictement égalitaire est représentée par la diagonale du carré, encore

appelé ligne d’équirépartition.

Ainsi plus la courbe correspondante à la distribution étudiée s’éloigne de cette ligne

(bissectrice), plus la série des valeurs du caractère étudié est inégalitaire et montre

une concentration de plus en plus importante à mesure que l’éloignement est grand.

III- L’INDICE DE CONCENTRATION OU COEFFICIENT DE GINI

A- Définition

L’indice de Gini est le rapport de l’aire situé entre la bissectrice et la courbe de

Lorentz à l’aire totale de demi- carré.

OABtriangledeAire

ionconcentratdeAireIG

Page 32: Module : Méthodes quantitatives Statistique Descriptive I ...

32

C- Calcul pratique : Méthode des trapèzes

L’aire sous la courbe est décomposée en triangle et trapèzes dont on calcule la surface

(ΣSi).

On obtient un triangle et des trapèzes

Aire de triangle OAB = 50002

100100

,

Aire de concentration = Aire de triangle OAB –Σ Si = 5000- Σ Si

OABtriangledeAire

ionconcentratdeAireIG

5000

5000

i

G

SI

Exemple : On reprend l’exemple précédent

Page 33: Module : Méthodes quantitatives Statistique Descriptive I ...

33

D- Interprétation de l’indice de Gini

L’indice de Gini est toujours compris entre 0 et 1. Plus il est proche de 1 plus la

concentration est forte et plus il est proche de 0 plus la concentration est faible.

- Si IG = 0 → cela signifie que l’aire de concentration est nul, la courbe est

confondu avec la bissectrice, on dit qu’on une situation d’égalité parfaite.

- Si IG = 1 → cela signifie que l’aire de concentration est égal à l’aire de

triangle OAB, on dit qu’on une situation d’inégalité parfaite.