labarere jose p04.ppt [Mode de compatibilité] · (échantillons indépendants) population1 µ 1,...
Transcript of labarere jose p04.ppt [Mode de compatibilité] · (échantillons indépendants) population1 µ 1,...
Plan
I. Nature des variables
I. Comparaison de 2 moyennes observées sur
2 échantillons indépendants
• Test Z de l’écart réduit
• Test t de Student
III. Comparaison de 2 moyennes observées sur 2
échantillons appariés
• Test Z de l’écart réduit
• Test t de Student
Plan
I. Nature des variables
II. Comparaison de 2 moyennes observées sur 2
échantillons indépendants
• Test Z de l’écart réduit
• Test t de Student
III. Comparaison de 2 moyennes observées sur 2
échantillons appariés
• Test Z de l’écart réduit
• Test t de Student
I. Nature des variables
• Comparer 2 moyennes = tester l’association entre
• 1 variable quantitative
• 1 variable qualitative binaire
• Exemple : µmasculin(âge) µféminin (âge) ?
- âge : variable quantitative continue
- sexe: variable qualitative binaire (dichotomique)
Plan
I. Nature des variables
II. Comparaison de 2 moyennes observées sur 2
échantillons indépendants
• Test Z de l’écart réduit
• Test t de Student
III. Comparaison de 2 moyennes observées sur 2
échantillons appariés
• Test Z de l’écart réduit
• Test t de Student
II. Comparaison de deux moyennes observées
(échantillons indépendants)
population1
µ1, σ1
échantillon
m1, s1
« Indépendant » signifie que l’échantillon 1 est constitué de manière
indépendante de l’échantillon 2 (par opposition aux échantillons
appariés) :
•Les sujets de l’échantillon 1 ne sont pas les mêmes que ceux de
l’échantillon 2
• Les 2 échantillons peuvent être d’effectifs différents.
population 2
µ2 , σ2
échantillon
m2, s2
II. Comparaison de deux moyennes observées
(échantillons indépendants)
population1
µ1, σ1
échantillon
m1, s1
population 2
µ2, σ2
échantillon
m2, s2
1.Formulation des hypothèses H0 : µ1 = µ2
H1 : µ1 µ2
2. Risque α = 0.05 (5%) a priori
3. Choix du test
Test Z de l’écart réduit (n1 > 30 et n2 > 30 )
Test t de Student ((n1 ≤ 30 et/ou n2 ≤ 30 hypothèse de normalité, variances
comparables)
Test Z de l’écart réduit
• Si n1 > 30 et n2 > 30
• Sous H0 : µ1 = µ2 → µ1 - µ2 = 0
• Sous H1 : µ1 ≠ µ2
1 2
n1 n 2
2 2
1 2
varm m
m1 m2 m1 m2Z
n1 n2
s2 s21 2
m1 m2Z
→ N (0, 1)
s² est un estimateur de σ² →
Si test bilatéral
Exemple
On compare la consommation de caféine
chez 112 cancéreux : moyenne 147,2 mg/jour - écart type estimé 101,8 mg/jour
à celle de
185 non cancéreux : moyenne 132,9 mg/jour - écart type 115,7 mg/jour.
On prend un risque à 5%.
Test bilatéral, grands échantillons
Z = 147,2 - 132,9
101,82
112+ 115,72
185
= 1,11
1,11 est inférieur à 1,96 => Différence non significative
Les cancéreux consomment la même quantité de cafeine que les
non cancéreux
Test t de Student
• Conditions d’application :
- La distribution de la variable continue est normale dans les 2
populations
- Les variances σ1² et σ2² sont comparables (égales)
• Sous H0 : µ1 = µ2 → µ1 - µ2 = 0
1 2
2
22
2
112
n n 2n 1n 1s s
Variance commune s
→ t(n1 + n2 - 2) ddl
Exemple: la tension artérielle
nA = nB = 16
on observe mA = 130,7 mB = 136,1
s²A = 23,2 s²B = 25,8
H0 : mA = mB
H1 : mA ≠ mB
nA = nB < 30 on réalise le test t de student
on calcule : s² commune
ddl = 16+16-2 = 30 t > t30 à 5% = 2.042
La tension artérielle diffère dans les deux groupes avec p < 0.001
(nA+nB-2) ddl = 30 ddl
Plan
I. Nature des variables
II. Comparaison de 2 moyennes observées sur 2
échantillons indépendants
• Test Z de l’écart réduit
• Test t de Student
III. Comparaison de 2 moyennes observées sur 2
échantillons appariés
• Test Z de l’écart réduit
• Test t de Student
III. Comparaison de deux moyennes observées (échantillons
appariés)
Obs1 1
Obs1 2
Obs13
…
Obs1 n1
Obs2 1
Obs2 2
Obs2 3
…
Obs2 n1
Obs 1
Obs 2
Obs 3
…
Obs n1
Obs1
Obs 2
Obs 3
…
Obs n2
m1 m2
échantillons indépendants
échantillons appariés
sujet pris comme son propre témoin
(n1 = n2 ou n1 ≠ n2) (n1 = n2 = n)
III. Comparaison de deux moyennes observées (échantillons
appariés)
PAS1 1
PAS1 2
PAS1 3
…
PAS1 n
PAS2 1
PAS2 2
PAS2 3
…
PAS2 n
Avant Après
Traitement anti-
hypertenseur
H0 : mPAS avant = mPAS
après
Les mesures PAS1 et PAS2 du sujet 1 ne
sont pas indépendantes
Les 2 mesures ont été effectuées sur le
même sujet : si PAS1 était très élevée, il
est probable que PAS2 restera élevée
1(mais moins que PAS si le traitement
est efficace)
Le test doit prendre en compte cette
dépendance des observations PAS1 et
PAS2
(En revanche, les mesures PAS2 du
sujet 1 et PAS2 du sujet 2 sont
indépendantes)
PAS = Préssion Artérielle systolique
Echantillons appariés
nd
n
di
m i 1• (m1 - m2) = md avec
n2
2
d
d m s
i di1
n1• var (md) = sd² / n, avec
md : moyenne des différences
s2
d
n
mdZo
α/2
(rejet de H0)
Test Z de l’écart réduit pour échantillons appariés
• H0 : µd = 0 (µ1 = µ2)
• H1 : µd 0 (µ1 µ2)
• Si n > 30 paires1 – α
(non-rejet de H0)
z α
|Zo| Zα |Zo| > Zα|Zo| > Zα
-z α
α/2
(rejet de H0)
On dispose d'un échantillon de n = 100 patients pour lesquels on a mesuré:
• le LDL avant Traitement (µ1 = 1,8)• le LDL après Traitement (µ2 = 1,6)
Exemple :évaluation d'un traitement contre le cholestérol
H0 : d = 0 (µ1 = µ2) le traitement n'a pas d‘effet
H1 : d 0 (µ1 µ2) le traitement a un effet
n > 30 on réalise le test z α= 5%
z > 1.96 donc le traitement a un effet (efficace)
Test t de Student pour échantillons appariés
• H0 : µd = 0 (µ1 = µ2)
• H1 : µd 0 (µ1 µ2)
• n ≤ 30
• Si la distribution des différences individuelles est normale :
n
ts2
o
d
md → t (n-1) ddl
Exemple : Traitement du diabète 1
Objectif : On désire étudier l'effet d'une nouvelle stratégie de traitement du
diabète en mesurant l'effet sur la glycémie. On dose la glycémie (g/L) chez
15 sujets avant le début du nouveau protocole et 3 mois après.
Dans la population de malades, on pose :
X1 la mesure de glycémie avant traitement
X2 la mesure de glycémie après traitement (3 mois après)
D = X1 - X2 est distribuée selon une loi normale de moyenne d et de
variance
Les mesures sont appariées car elles sont effectuées sur les mêmes
individus.
La moyenne des différences entre les mesures : d = 0.1
L‘écart-type des différences entre les mesures : sD = 0.091
H0 : d = 0 les glycémies sont identiques avant et après le nouveau
protocole
H1 : d 0 les glycémies sont différentes avant et après le nouveau
protocole
> t de la table = 2.145
donc on rejette H0 au risque = 5% de se tromper.
La glycémie est significativement plus basse après administration de
la nouvelle stratégie.
n < 30 on réalise le test t de student
α = 5% ddl = n-1 = 15 – 1 = 14
m1 m2 effectif test conditions
Z -Observée observée
(indépendantes)
n1, n2 > 30
n1, n2 ≤ 30 t (n1+n2 -2) ddlnormalité
σ² comparables pour
calculer s² commune
observée observée n > 30 paires Z -
(appariées) n ≤ 30 paires t (n-1) ddl normalité di
Comparaison de moyennes
résumé
Références bibliographiques