Tests paramétriques sur variabilités et moyennes
description
Transcript of Tests paramétriques sur variabilités et moyennes
TESTS PARAMÉTRIQUES
SUR VARIABILITÉS ET MOYENNES
Pierre MORETTO, Université Paul Sabatier, Toulouse
III.
UE 45.2 CHIV
Tests paramétriquesLe
s éta
pes Normalité de la distribution
(²) Comparaison des distributions
Test « F » de Fisher-Snedecor Comparaison des moyennes
Test « t » de Student Données appariées Données Non appariées
Si la distribution est normale à ±2 correspond 95.5% de la population.
Intervalle entre 2.28% et 95.5% correspond à 4.
Pente=(Q95-Q2.28)/ 4 PThéo=(95.5-2.28)%/4=0.23
Droite de Henry Calcul de la pente
Détermination graphique Anamorphose
Normalité d’une distribution /Indices Une distribution est normale si:
Les indices centraux sont confondus Mode=Médiane=Moyenne
68.25% de la population à ± 1 95.5% de la population à ± 2
Si ces faits sont retrouvés à partir des données expérimentales alors, la distribution peut être considérée comme « Normale »
Normalité d’une distribution
Normalité d’une distribution Détermination graphique Détermination / indices Test du ²
Test du ²
Le test du ² permet de comparer 2 distributions.
Si il est appliqué à la comparaison de la distribution de la donnée expérimentale et d’une distribution normale (au sens Gaussien), il permet de vérifier très précisément la normalité de la distribution expérimentale.
Test du ²
Comparer 2 fréquences Expérimentale (rouge) Normale (Bleu)
Quantifier la somme des différences/classes
Règle de décision / valeur théorique
Principe
Test du ²
Calculer l’écart centré réduit pour chaque centre de classe Xi
Trouver la probabilité associée dans la table de la Loi Normale Centrée Réduite
Quantifier la différence
141414
14
111
1
))(Pr()(
.....
))(Pr()(
Thx
x
Thx
x
fxmx
x
fxmx
x
Test du ²
Calculer l’écart centré réduit pour chaque centre de classe Xi
Trouver la probabilité associée dans la table de la Loi Normale Centrée Réduite
Quantifier la différence
141414
14
111
1
))(Pr()(
.....
))(Pr()(
Thx
x
Thx
x
fxmx
x
fxmx
x
Test du ²
Pour chaque classe, une fth et une fobs(ni/N)
Calculer la différence de ces fréquences pour chaque classe
Quantifier la différence
1414
11
.....
thobs
thobs
ff
ff
Test du ²
Calcul de l’indice
th
thobs
f
ff 2)(²
Carré des différences
Rapportée à Fth
Somme
« Surface entre les 2 courbes »
Test du ²
Règle de décision
th
thobs
f
ff 2)(²
Une table des valeurs de ²La valeur est lue pour un Degrès De Liberté (ddl=N-1)A un risque choisi (10%, 5%, 1%)
Test du ²
Règle de décision
th
thobs
f
ff 2)(²
Si ²Théorique> ²Calculé au risque choisi les distributions diffèrent significativement. Sinon elles sont statistiquement semblables.
Test du ²
Le ² calculé sur un échantillon de 19 sujets est de 32.5.
La distribution est-elle normale au risque 5% ?
La distribution est-elle normale au risque 1% ?
Exemple Table du ²
Test du ²
Le ²théorique à P=0.05 pour un ddl=18 est de 28.87
Correction Table du ²
32.5 > 28.87 donc ²calculé >²théorique
Les distributions observées (expérimentale) et théorique (Loi Normale) ne diffèrent pas à P<0.05
La distribution expérimentale est « normale » au risque P<5%
Test du ²
Le ²théorique à P=0.01 pour un ddl=18 est de 34.80
Correction Table du ²
32.5 < 34.8 donc ²calculé <²théorique
Les distributions observée (expérimentale) et théorique (Loi Normale) ne sont pas semblables à P<0.01
La distribution n’est pas normale au risque P<1% Risque inférieur entraîne une décision plus sévère
COMPARAISON D’ÉCHANTILLONS PARAMÉTRIQUES
Pierre MORETTO, Université Paul Sabatier, Toulouse
III.
UE 45.2 CHIV
Règles de décisions et orientations Les distributions des échantillons A et B
sont-elles normales (Gaussiennes) ? Si OUI, tests paramétriques Si NON,
Transformation (racine, log ..) et retour à Tests Non paramétriques (Ch V)
Comparaison d’échantillons
Comparaison d’échantillons paramétriques
Méthodologie générale: Distributions normales
Comparaison des variances des échantillons de distributions normales A (²A) et B (²B)
Comparaison d’échantillons paramétriques
Comparaison des variances
Echantillon A Echantillon B
AAA nm ,², BBB nm ,²,
Comparaison des variances
Le test est appelé « Test F de Fisher-Snedecor » Il est basé sur le rapport (F) des variances des
échantillons A et B Donc
si les variances sont semblables le rapport F est proche de 1
si les variances diffèrent le rapport F s’éloigne de 1
Dans les 2 cas … l’objectivité impose de savoir de combien et à quel risque ?
Test F de Fisher-Snedecor
Soit 2 échantillons :
L’hypothèse (H0) du test est que les
variances sont comparables donc que :
BBBAAA nmetnm ,²,____,²,
1²
²
B
AF
Test F de Fisher-Snedecor
La comparaisons de 2 variances (²A et ²B avec ²A> ²B ) d’échantillons d’effectifs nA et nB est basée sur le rapport F= ²A/ ²B.
F est comparé à une valeur théorique Fs donnée par la table du F à un seuil /2. La lecture se fait à l’intersection de la colonne (nA-1) et de la ligne (nB-1).
Si F<Fs les 2 variances ne diffèrent pas significativement au seuil
Test F de Fisher-Snedecor à /2 = 2.5%
La lecture se fait à l’intersection de la colonne (nA-1) et de la ligne (nB-1)
Test F de Fisher-Snedecor
Exemple:2 méthodes de dosage du Lactate (mmol/l) ont été répétées à partir d’un même échantillon sanguin, 25 fois avec la méthode A, 30 fois avec la méthode B
On trouve:
Dans la table de « F » au risque =2.5% ….. Fs,2.5%=2.15
Le rapport F= ²A/ ²B=5.16/1.96=2.63 et F> Fs
d’où …….
Les variances diffèrent significativement au risque 5%
30,96.1²,10.18
25,16.5²,08.18
BBB
AAA
nm
nm
Test F: comparaison de variance Intérêt:
Distributions différentes des échantillons A et B
Si A et B sont 2 méthodes de mesure La plus faible variabilité d’une mesure à l’autre
renseigne sur la précision de l’outil de mesure.
Comparaison des moyennes des échantillons de distributions normales A et B
Comparaison d’échantillons paramétriques
Comparaison de moyennes
Les échantillons sont de distributions normales Les variances ne diffèrent pas significativement Test « t » de Student permet la comparaison des
moyennes
Comparaison de moyennes
Si les échantillons A et B sont indépendants Test « t » adapté aux variables non
appariées
Si les échantillons A et B sont dépendants Test « t » adapté aux variables appariées
Ex: avant/après entraînement
Test « t » de StudentNon Apparié
Soit 2 variables distribuées selon la Loi Normale
Les moyennes diffèrent-elles ? Le test porte sur la différence des
moyennes
BBBAAA nmetnm ,²,____,²,
BA mmd
Test « t » de StudentNon Apparié
La comparaison entre 2 moyennes mA et mB observées sur nA et nB cas est basée sur l’écart réduit avec :
Si <1.96 la différence n’est pas significative au risque =5%
NB: cette formule est utilisable nA.nB>30
B
B
A
A
BA
nn
mm
²²
Test « t » de StudentNon Apparié
Exemple: Comparaison des notes obtenues en
statistique entre 2 groupes A (Relit ses cours) et B (Ne relit pas)
De sorte que: 73,7.5²,88.4
67,4²,85.5
BBB
AAA
nm
nm
Correction
Si <1.96 la différence n’est pas significative au risque =5%
Ici =2.6 >1.96 donc la différence de moyenne est significative à 5%
CCl: Relire ses cours avant d’arriver en TP semble significativement influencer le résultat à l’examen
6.2
737.5
674
88.485.5
²²
B
B
A
A
BA
nn
mm
Test « t » de StudentApparié
Soit 2 variables dépendantes distribuées selon la Loi Normale
Les moyennes diffèrent-elles ?
yyyxxx nmetnm ,²,____,²,
Test « t » de Student Apparié
Dans les cas où les données des séries X et Y sont dépendantes (Appariées; qui vont par paires), le test n’est pas construit sur la différence des moyennes mais sur les différences de chaque paire.
n
YX
YX
n
Y
Y
Yn
X
X
X
nn
y
n
x
n
,²
.
.
.
____,²
.
.
.
_,²
.
.
.1111
Test « t » de StudentApparié
La comparaison entre 2 moyennes appariées mA et mB observées sur nA et nB cas est basée sur l’écart réduit avec :
Si <1.96 la différence n’est pas significative au risque =5%
NB: cette formule est utilisable nA.nB>30
n
²