1
Constats - terminologie - concepts de base Tests concernant une moyenne
- variance connue / variance inconnue- courbe caractéristique - n = ?
Tests concernant 2 moyennes- variances connues / courbes caractéristiques / n = ?- variances inconnues : égales / inégales- échantillons appariés (= dépendants)
Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes ou plus 12.1 HMGB
Utilisation de STATISTICA
Autres tests- Test de Shapiro-Wilk: distribution normale - Test d’ajustement à une distribution: test du Khi-deux
Tests d’hypothèses (ch. 11 HMGB)
Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques
2Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques
Problèmes statistiques description / visualisation : données Y (ch8)
estimation : paramètres distribution (ch9/10)
tests statistiques : prise de décision avec Y (ch11/12)
modélisation Y = f(X) f = fonction de transfert f =? (ch13)
processussystème Y variable de réponsevariables X
Variable Y - plusieurs cas
- mesure : variable continue : distribution normale N(μ, σ2) … autre
- classement 0 ou 1 : variable qualitative : distribution Bernoulli Ber(θ)
- comptage 0,1,2,.. : variable entière : distribution Poisson Poi (λ)
Variables X - catégoriques / continues / une ou plusieurs
3
constats - terminologie – concepts de base
prendre des décisions à l’aide de données échantillonnalesprovenant d’observations passives ou de données expérimentales:- 2 appareils de mesure ont-ils la même justesse / précision?- traitement anti corrosion réduit – il la rouille de 50% après 4 ans?- un type de boulon peut-il être soumis à 100 000 cycles de
tension-compression sans se rompre par fatique? prendre une décision conjecture issue incertaine
formulation d’une hypothèse d’ordre statistique hypothèse statistique : affirmation concernant une population (distribution)
- elle est vraie jusqu’à preuve du contraire- on dispose d’un seul échantillon de taille n pour décider- RISQUES (probabilités ) de mauvaises décisions:
► rejeter une hypothèse vraie (erreur de type I , première espèce)► ne pas rejeter une hypothèse fausse (erreur de type II , deuxième espèce)
ne pas rejeter (réfuter) une hypothèse veut dire : les données del’échantillon n’indiquent pas clairement que l’on doive la rejeterc-s-d : statut quo est maintenu jusqu’à preuve du contraire
rejeter une hypothèse: les données témoigne fortement contre
Bernard CLÉMENT, PhDMTH2302 Probabilités et méthodes statistiques
4
Hypothèse nulle H0: hypothèse à tester (mettre à l’épreuve)
Contre hypothèse H1 : seule affirmation sensée lorsque que H0 est fausse
H0 est toujours formulée en termes d’une valeur exacte du paramètre statistique à tester - exemple : H0 : μ = 100
H1 prévoit toujours un ensemble de valeurs : ex. H 1 : μ < 100 test statistique : est définie par une région critique (région de rejet)
d’une statistique W = f(Y1, Y2,…, Yn) qui conduit au rejet de H0
erreur de type I : rejeter l’hypothèse nulle H0 alors qu’elle est vraie
erreur de type II : ne pas rejeter H0 alors qu’elle fausse
seuil (niveau) de signification: la probabilité de commettre erreur type 1
Région critique : W > cRégion de non rejet de H0 c
Bernard CLÉMENT, PhD
terminologie – concepts de base
W
MTH2302 Probabilités et méthodes statistiques
5
H0
VRAIE FAUSSE
REJETER H0 erreur type I pas d’erreur
NE PAS REJETER H0 pas d’erreur erreur type II
Risque de type I = P (erreur type I ) = α
Risque de type II = P (erreur type II ) = β
LA DÉCISION EST BASÉE SUR DES OBSERVATIONS Yi LE STATUT (VRAIE OU FAUSSE) DE H0 N’ EST JAMAIS CONNU
β EST UNE FONCTION COURBE D’ EFFICACITÉ
STATUTDÉCISION
Bernard CLÉMENT, PhD
constats - terminologie – concepts de base
MTH2302 Probabilités et méthodes statistiques
remarque ne jamais utiliser l’expression « accepter H0 »
mais toujours « ne pas rejeter H0 »
6
LES DÉCISIONS STATISTIQUES
La statistique n’est pas une discipline qui permet de décider de la vérité ou de la fausseté des questions qu’elle examine :c’est une science du comportement rationnel qui fournit des règlesde conduite pratiques dans des situations d’incertitude.il y a 2 cas possibles:
cas 1 si une hypothèse particulière (dite nulle) n’est pas rejetée :sur la base de données disponibles vous pouvez la tenir vraiejusqu’à preuve du contraire.
cas 2 si une hypothèse particulière (dite nulle) est rejetée : sur la base de données disponibles vous ne pouvez pas latenir pour vraie.
Dans les deux cas, vous aurez raison en moyenne, 19 fois sur 20, (95%), ou n’importe quel niveau de confiance ou niveau derisque (= 1- niveau de confiance) que l’on se fixe d’avance.
En moyenne, vos conclusions seront donc bonnes, mais on nepourra jamais savoir avec certitude si une décision particulièreest bonne ou non.
Bernard CLÉMENT, PhDMTH2302 Probabilités et méthodes statistiques
7
LISTE de TESTS STATISTIQUES
Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques
Cas A : moyenne μ = μ0 - variance σ2 connue
Cas B : moyenne μ = μ0 - variance σ2 inconnue
Cas C : égalité de 2 moyennes μ1 = μ2
cas C1 : variances connues cas C2 : variances inconnues égalescas C3 : variances inconnues inégalescas C4 : échantillons appariés
Cas D : variance σ2 = σ02
Cas E : égalité de 2 variances σ12 = σ2
2
Cas G : égalité k (k ≥ 3) moyennes μ1 = μ2 = … = μk chap. 12.1 HMGB
Cas F : proportion θ = θ0
autre cas : ajustement à des distributions
8
Cas A : test moyenne μ - population gaussienne - variance σ2 connue Y ~ N (μ, σ2 )
-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26
U
-0.02
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
GAUS
S
si H0 est vraie μ = μ0
Z = ( Y – μ0 ) / (σ / √ n ) ~ N ( 0, 1)
μ0
H0 : μ = μ0 vs H1 : μ > μ0
N ( μ, σ2 ) Y1, Y2, …, Yn : échantillon de Y
Y = ∑ Yi / n : moyenne échantillonnale
Y
Y
Z
0
c
σ
Région critique :rejeter H 0 si Y > c c = ?
P ( rejeter H0 quand elle est vraie ) = α P ( Y > c ) = P ( Y - μ0 > c - μ0 )
( Y – μ0 ) ( c - μ0 ) σ/√ n σ/√ n
= P ( Z > z0 ) = α
z0 = ( c - μ0 ) / σ/√ n = z 1-α
c = μ0 + z1-α ( σ /√ n )
σ/√ n
σz =1
z1 – α
aussi noté z α
α
= P >
Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques
9
Exemple 1 : un acier d’un alliage spécial a une tension de rupture Y (psi) dont la moyenne est de 25800 avec un écart type de 300. Un changement dans la composition de l’alliage devrait augmenter la tension moyenne sans changer l’écart type. Si le nouvel alliage ne produit aucun changement on voudrait pouvoir le dire avec une probabilité de 0.99. Par contre, si la tension moyenne est augmentéede 250, on veut que le risque de ne pas le détecter soit 0.10Questions(a) Définir l’hypothèse nulle , la contre hypothèse, le seuil du test, le risque de type II.(b) Poser les équations définissant les risques de type I et de type II; résoudre afin de trouver la taille de
l’échantillon à prélever et déterminer la région critique du test.(c) Un échantillon de 19 observations a donné une moyenne de 25970. Le nouvel alliage est-il supérieur ?
Solution (a)-(b)
Yμ0 = 25800
H0
μ1 = 25800 + 250 = 26050
H1 : μ > μ0 ( unilatérale )
c
Région critique
Y > c
σ/√n
α
P( erreur type I ) = P ( Y > c ) = α = 0.01P( erreur type II ) = P ( Y < c ) = β = 0.10
β
σ= 300
Bernard CLÉMENT, PhD
Cas A : test moyenne μ - population gaussienne - variance σ2 connue Y ~ N (μ, σ2 )
MTH2302 Probabilités et méthodes statistiques
10
Solution (a)-(b)
Yμ0 = 25800
H0
μ1 = 25800 + 250 = 26050
H1
c
Région critique
X > c
σ/√n
α
P( erreur type I ) = P ( Y > c ) = α = 0.01P( erreur type II ) = P ( Y < c ) = β = 0.10
β
Solution (a)-(b) P ( Y > c | si μ = 25800) = α = 0.01 (1)P ( Y < c | si μ = 26050) = β = 0.10 (2)2 équations avec 2 inconnus : n et c
n = ( z0.99 + z0.90 )2 σ2 / (26050 – 25800)2 = (2.33 + 1.28)2 (300 / 250 )2 = 18.8 ≈ 19
c = 25800 + 2.33 * 300 / (19)0.5 = 25960.36
( c ) puisque Y = 25970 > c = 25960.36 on rejette H0
σ= 300
Bernard CLÉMENT, PhD
Cas A : test moyenne μ - population gaussienne - variance σ2 connue Y ~ N (μ, σ2 )
H0
y = 25970
11
Courbe d’efficacité (caractéristique) du test
Définition: probabilité de ne pas rejeter H0 en fonction de la moyenne μ de la
populationβ ( μ ) = P ( Y < c = μ0 + z 1-α ( σ /√ n ) | μ )
= P [ ( Y - μ ) / σ /√ n < z 1-α + (μ0 - μ) / σ /√n ]
β ( μ ) = Φ (z 1-α + δ √ n ) ( * ) dépend de α, n, δoù δ = (μ0 - μ) / σ : paramètre de non centralité (écart par rapport à H0)
graphiques : page 12 avec α = 0.05, 0.01 / n = 1,2,3, … / -1 ≤ δ ≤ 3
Calcul de n : on veut que β (μ1) = β pour une valeur particulière μ1 de μ
n = ( z 1-α + z 1- β )2 σ2 / (μ1 – μ0)2
Exemple : page 9 avec α = 0.01 β = 0.10 σ = 300 μ0 = 25800 μ1 = 26050
Exemple : calcul de la fonction d’efficacité μ = 25800 26000 26050 26100
μ 25800 26000 26050 26100
β 0.99 0.28 0.10 0.02
avec la formule ( * ) ci haut
Bernard CLÉMENT, PhD
Cas A : test moyenne μ - population gaussienne - variance σ2 connue Y ~ N (μ, σ2 )
MTH2302 Probabilités et méthodes statistiques
12
courbe d’efficacité (caractéristique) du test Z: unilatéral
Bernard CLÉMENT, PhD
Cas A : test moyenne μ - population gaussienne - variance σ2 connue Y ~ N (μ, σ2 )
ProbdenepasrejeterHo
ProbdenepasrejeterHo
13
type de la CONTRE HYPOTHÈSE : unilatérale ou bilatérale
Exemple 1 : contre hypothèse H1 : μ > μ0 unilatéral droite (cas 1)
autres cas H1 : μ < μ0 unilatéral gauche (cas 2)
H1 : μ ≠ μ0 bilatéral (cas 3)
Formules
Cas 2 rejeter H0 si y < c = μ0 - z1-α ( σ /√ n ) note : - z1-α = zαn = ( z1-α + z1- β )2 σ2 / (μ1 – μ0) 2
β(μ) = Φ (z1-α - δ √ n ) δ = (μ0 - μ) / σ
Cas 3 rejeter H0 si y < c1 = μ0 - z1-α/2 ( σ /√ n ) ou si y > c2 = μ0 + z1-α/2 ( σ /√ n )
région critique bilatérale
équivalent à : rejeter H0 si │ y - μ0 │ / σ /√ n > z1-α/2
n = ( z1-α/2 + z 1- β )2 σ2 / (μ1 – μ0) 2
β(μ) = Φ (z 1-α/2 - δ √ n ) + Φ (z 1-α/2 - δ √ n ) - 1
Bernard CLÉMENT, PhD
Cas A : test moyenne μ - population gaussienne - variance σ2 connue Y ~ N (μ, σ2 )
14
courbe d’efficacité (caractéristique) du test Z : bilatéral
Bernard CLÉMENT, PhD
Cas A : test moyenne μ - population gaussienne - variance σ2 connue Y ~ N (μ, σ2 )
ProbdenepasrejeterHo
ProbdenepasrejeterHo
15
Cas B : test moyenne μ - population N ( μ, σ2) variance σ2 inconnue
Si σ2 est inconnue : on en fait l’estimation avec la variance échantillonnale s2
S2 = ∑ ( Y i – Y )2 / ( n - 1 ) et on utilise la statistique T de Student en place de Z
Les 2 cas sont résumés dans le tableau.
0: µµ =NH
2σ0
0yZ
nµ
σ−
=
0: µµ ≠AH
0: µµ <AH0: µµ >AH
210 α−> zZ
α−−< 10 zZ
α−> 10 zZ
0: µµ =NH
2σ0
0yTs n
µ−=
0: µµ ≠AH
0: µµ <AH
0: µµ >AH
21,10 α−−> ntT
α−−−< 1,10 ntT
α−−> 1,10 ntT
Remarque : le test est employé pour le cas de différences appariées
(2 échantillons dépendants) avec 1 2i i iy y y= −
Hypothèse nulleHN (H0)
Statistiquepour le test
Contre hypothèse(alternative) HA (H1)
Critère de rejet
connue
inconnue
Bernard CLÉMENT, PhD
Cas
A
Cas
B
16
courbe d’efficacité (caractéristique) du test T : unilatéral
Bernard CLÉMENT, PhD
Cas B : test moyenne μ - population N ( μ, σ2) variance σ2 inconnue
ProbdenepasrejeterHo
ProbdenepasrejeterHo
17
courbe d’efficacité (caractéristique) du test T : bilatéral
Bernard CLÉMENT, PhD
Cas B : test moyenne μ - population N ( μ, σ2) variance σ2 inconnue
18
Exemple 2 : étiquette sur un contenant 4 litres de peinture ‘’couvre
325 pi. ca’’ en moyenne dans des conditions normales d’utilisation.
Vous testez 6 contenants - données : 305, 285, 310, 300, 280, 290
( a ) Testez H0 : μ = 325 vs H1: μ < 325 au seuil α = 0,05
( b ) calculer le nombre d’observations nécessaire pour détecter
un écart de moyenne de 10 pi. car. avec un risque de type 2 de 0,10
Solution : ( a ) n = 6 y = 295 s = 11,83 ,
T5 = ( 295 – 325 ) / 11.83 √ 6 = - 6.21 < - t 5 , 0.95 = - 2,015
H0 est rejetée
( b ) δ = 10 / 11,83 = 0,84 noté d (page12)
on obtient une valeur de n = 15
Bernard CLÉMENT, PhD
Cas B : test moyenne μ - population N ( μ, σ2) variance σ2 inconnue
MTH2302 Probabilités et méthodes statistiques
19
-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26
U
-0.02
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
GAUS
S
-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26
U
-0.02
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
GAUS
S
Y11, Y12, … , Y1n1
Y1 ~ N ( μ1, σ12) Y2 ~ N ( μ2, σ2
2)
σ1 σ2
μ2
Y21, Y22, … , Y2n2
Cas C : test d’égalité de 2 moyennes
échantillonsindépendants
Y1 = ∑ Y1i / n1Y2 = ∑ Y2i / n2moyennes
H0 : μ1 = μ2
cas C1 : variances connues
cas C2 : variances inconnues égales
cas C3 : variances inconnues inégales
cas C4 : échantillons appariés
(échantillons dépendants)
Tableau page suivante
Bernard CLÉMENT, PhD
μ1
MTH2302 Probabilités et méthodes statistiques
XX= groupe 1
X: facteur input X= groupe 2
20
Cas C : tests d’égalité de 2 moyennes
0: 21 =− µµNH
22
21 ,σσ
1 20 2 2
1 2
1 2
( )y yZ
n nσ σ
−=
+
0: 21 ≠− µµAH
0: 21 <− µµAH
0: 21 >− µµAH
210 α−> zZ
α−−< 10 zZ
α−> 10 zZ
0: 21 =− µµNH
222
21 σσσ ==
1 20
1 2
( )1 1
P
y yTS
n n
−=
+0: 21 ≠− µµAH
0: 21 <− µµAH
0: 21 >− µµAH
21,2210 α−−+> nntT
α−−+−< 1,2210 nntT
α−−+> 1,2210 nntT
2)1()1(
21
222
2112
−+−+−
=nn
SnSnS p
0: 21 =− µµNH
22
21 σσ ≠
1 20 2 2
1 2
1 2
( )y yTS Sn n
−=
+
0: 21 ≠− µµAH
0: 21 <− µµAH
0: 21 >− µµAH
21,0 αν −> tT
αν −−< 1,0 tT
αν −> 1,0 tT
2221
21 , nsbnsa ==
)1()1()(
22
12
2
−+−
+=
nbnabaν
Hypothèse nulle HN Statistique pour le test Contre hypothèse Critère de rejet
connues
σ 2 inconnue
inconnuesinégales
Bernard CLÉMENT, PhD
C1
C2
C3
21
Exemple 3 : calculer un intervalle de confiance avec coefficient de confiance 0.95pour la différence de vie ( heures ) moyenne de deux types 1 et 2
d’ampoules électriques à l’aide des informations suivantes :échantillon 1 : n1 = 16 σ1 = 128 Y1= 1050échantillon 2 : n2 = 9 σ2 = 81 Y2 = 970
Intervalle de confiance avec coefficient de confiance 0.95
μ1 – μ2 : 1050 – 970 ± 1,96 ( 1282 / 16 + 812 / 9 )0.5 = 80 ± 82.1 = ( - 2.1, 162.9 )
Question : les ampoules de type 1 durent - elles (en moyenne) plus longtemps que les ampoules de type 2 ?
solution avec un test d’hypothèse : bilatéral - variances connues - alpha = 0.05
Z = ( 1050 – 970 ) / ( 1282 / 16 + 812 / 9 )0.5 = 80 / 41,87 = 1,91 < 1,96 = z0,975
conclusion: la durée moyenne ampoules type 1 n’est pas différente
de la durée moyenne des ampoules de type 2
Bernard CLÉMENT, PhD
Cas C1 : tests d’égalité de 2 moyennes - variances connues
MTH2302 Probabilités et méthodes statistiques
22
-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26
U
-0.02
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
GAUS
S
Résultat ( Y1 – Y2 ) - (μ1 - μ2)
Sp√ 1/ n1 + 1 / n2
-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26
U
-0.02
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
GAUS
S
Y11, Y12, … , Y1n1
Y1 ~ N ( μ1, σ2 ) Y2 ~ N ( μ2, σ2 )
σσ
μ1 μ2
Y21, Y22, … , Y2n2
Cas C2 : différence entre 2 moyennes avec variances inconnues égales
échantillons indépendants
Y1 = ∑ Y1i / n1 Y2 = ∑ Y 2i / n2moyennes
S12 = ∑ ( Y1i – Y1 ) 2 / ( n1 - 1 ) S2
2 = ∑ ( Y2i – Y2 ) 2 / ( n2 – 1) variances
Sp2 = [ ( n1 -1 ) S12 + ( n2 – 1) S22 ] / ( n1 + n2 - 2) ‘ pooled ’
= T ~ Student avec n1 + n2 - 2 ddl
Bernard CLÉMENT, PhD
X
X = groupe1
X =groupe2
23
Exemple 4 : comparaison de l’épaisseur : heure 1 VS heure 2
Heure 1 : 10.0-11.2- 8.1- 8.3- 10.8- 10.3- 9.5- 8.2- 10.0- 10.1- 9.2- 8.4- 6.4- 8.3- 8.2- 7.0- 10.8- 7.5 7.4- 9.5- 9.7- 9.4-8.6-10.4-8.3-8.0-8.7-9.6-8.9-8.9
Heure 2 : 12.4-10.9- 10.4- 10.3- 10.6- 9.6- 9.7- 9.6- 9.8- 10.3- 7.7- 12.7- 10.2- 10.2- 8.6- 8.4- 9.5- 7.8 11.5- 10.0- 10.0- 8.4-10.0-11.5-11.4-11.7-10.7-10.8-9.4-10.7
Solution : avec Statistica / Statistiques élémentaires / test t échantillons indépendants
épaisseur
No
of o
bs
HEURE: x
5 6 7 8 9 10 11 12 13 140
2
4
6
8
10
12
HEURE: y
5 6 7 8 9 10 11 12 13 14
Test T avec variances
inconnues et égales
sp = 1,20
T = - 3,77 ddl = 58p- value = 0,0004
égalité moyennes rejetée
groupe n moy écart type
1 30 8,99 1,18
2 30 10,16 1,22
Bernard CLÉMENT, PhDMTH2302 Probabilités et méthodes statistiques
24
Cas C4 : Test d’égalité de 2 moyennes : échantillons appariés (pairés)
Contexte : lorsque les 2 séries de mesures proviennent des mêmes unités expérimentales.Par exemple, lorsque que l’on fait une comparaison AVANT-APRÈS :
groupe 1 : y11, y12, …, y1n mesures avant sur n unités expérimentalesgroupe 2 : y21, y22, …, y2n mesures après sur les mêmes unités expérimentales
l’indépendance des 2 échantillons n’est pas vérifiée car les mêmes unités expérimentalessont utilisées pour faire la comparaison. Le test est basé sur les différences :
Di = y1i - y2i i = 1, 2, …, nLe problème est ramené à un test de la nullité d’une moyenne avec variance inconnue.Remarque: il est important de reconnaître le cas d’échantillons appariés (= dépendants)
afin d’exécuter le bon test : échantillons indépendants ou échantillons dépendants?
Exemple 5 : 15 composants électroniques sont testés à 2 niveaux de température : N normale (20 deg C) et E élevée (100 deg C)
Une mesure de qualité importante Y fut mesurée à ces 2 niveaux de températureComposant : 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
N (normale) : 7.6 - 10.2 - 9.5 - 1.3 - 3.0 - 6.3 - 5.3 - 6.2 - 2.2 - 4.8 - 11.3 - 12.1 - 6.9 - 7.6 - 8.4
E (élevée) : 7.3 - 9.1 - 8.4 - 1.5 - 2.7 - 5.8 - 4.9 - 5.3 - 2.0 - 4.2 - 11.0 - 11.0 - 6.1 - 6.7 - 7.5
D = YN – YE : 0.3 1.1 1.1 -0.2 0.3 0.5 0.4 0.9 0.2 0.6 0.3 1.1 0.8 0.9 0.9
test : D = 0.61 sD = 0.39 T = D / (s D/√ 15) = 6.02 > t14, 0.995 = 2.977
On rejette l’égalité des 2 moyennes avec risque de type 1 de 0.001
Bernard CLÉMENT, PhD
25
Cas D : test sur une variance H0 : σ2 = σ02
Exemple 6 : n = 75 données de poids donne s2 = ( 0,101 )2 = 0,010
test de H0 : σ2 = 0,015 vs H1 : σ2 < 0,015
W = 74 ( 0,01) / 0,015 = 50,3
p-value = P ( W ≤ 50,3 ) = 0,016
on rejette H0 si on utilise un risque de type I de 0,05
Statistique du test rejet de H0 au seuil α
contre hypothèse σ2 < σ02 σ2 > σ0
2 σ2 ≠ σ02
W = ( n – 1 ) s2 / σ02 W < χ2 n – 1, α W < χ2 n – 1, 1- α W < χ2 n – 1, α / 2 ou W < χ2 n – 1, 2- α/ 2
Bernard CLÉMENT, PhD
MTH2302 Probabilités et méthodes statistiques
26
Courbes
d’efficacité du
test Khi-deux
---------------------
Application :
Calcul de n
Bernard CLÉMENT, PhD
27
-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26
U
-0.02
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
GAUS
S
Résultat s12 / s2
2 suit distribution Fisher Fn1-1 , n2-1
-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26
U
-0.02
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
GAUS
S
Y11, Y12, … , Y1n1
Y1 ~ N ( μ1, σ12 ) Y2 ~ N ( μ2, σ1
2 )
σ1 σ2
μ1 μ2
Y21, Y22, … , Y2n2échantillons indépendants
Y1 = ∑ Y1i / n1 Y2 = ∑ Y 2i / n2moyennes
S12 = ∑ ( Y1i – Y1 ) 2 / ( n1 - 1 ) S2
2 = ∑ ( Y2i – Y2 ) 2 / ( n2 – 1) variances
Bernard CLÉMENT, PhD
X
X = 1 X = 2
Cas E : test d’égalité de 2 variances H0 : σ12 = σ2
2
Exemple 7 : n1 = 16 s1 = 1,93 et n2 = 10 s2 = 1,00test bilatéral F = 1,932 / 1,00 2 = 3,72loi de Fisher avec (15, 9) ddl F15 ,9, 0,975 = 3,77H0 non rejetée car 3,72 inférieur à 3,77
TEST BILATÉRAL H0 vs H1 : σ12 ≠ σ2
2 s1 = max (s1, s2) rejeter H0 si s1
2 / s22 ≥ Fn1-1 , n2-1, 1 – (α/2)
autres cas:
tests
Unilatéral
Voir
formulaire
28
Bernard CLÉMENT, PhD
Cas F : proportion p = p0
Cas F : calcul de β et n - test unilatéral Cas F : calcul de β et n - test bilatéral
29
Bernard CLÉMENT, PhD
Exemple 8 : test sur une proportion p
30
Bernard CLÉMENT, PhD
Tests de moyennes et variances avec STATISTICA
Test T pairé - 2 échantillons dépendants
Test 2 moyennes - échantillons indépendants
Test plusieurs moyennes (2 et plus)
One-way ANOVA
classification simplek groupes k ≥ 3
Test T - 1 moyenne
31Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques
Tests de moyennes et variances avec STATISTICAExemple 2
1new
2Y
123456
exemple 2 305test 285une 310
moyenne 300280290
Hypothèse H0 : μ = 325
rejetée car p-value = 0,001581 ≤ 0,05
Mean
Std.Dv.
N
Std.Err.
Reference Constant
t-value
df
p
Y
295,0 11,8 6 4,83 325 - 6,21 5 0,001581
32Bernard CLÉMENT, PhD
MTH2302 Probabilités et méthodes statistiques
Tests de moyennes et variances avec STATISTICA
Exemple 4 : comparaison de l’épaisseur : heure 1 VS heure 2Heure 1 : 10.0-11.2- 8.1- 8.3- 10.8- 10.3- 9.5- 8.2- 10.0- 10.1- 9.2- 8.4- 6.4- 8.3- 8.2- 7.0- 10.8- 7.5
7.4- 9.5- 9.7- 9.4-8.6-10.4-8.3-8.0-8.7-9.6-8.9-8.9
Heure 2 : 12.4-10.9- 10.4- 10.3- 10.6- 9.6- 9.7- 9.6- 9.8- 10.3- 7.7- 12.7- 10.2- 10.2- 8.6- 8.4- 9.5- 7.8 11.5- 10.0- 10.0- 8.4-10.0-11.5-11.4-11.7-10.7-10.8-9.4-10.7
1new
2Y
3heure
123456789
10
exemple 4 10,0 1test 11,2 1
2 8,1 1moyennes 8,3 1
10,8 1. .
8,9 112,4 2
. .10,7 2
Fichier Statistica
33Bernard CLÉMENT, PhD
Tests de moyennes et variances avec STATISTICA
Conclusion
moyennes inégales et variances égales
T-tests; Grouping: heure Group 1: 1 Group 2: 2 Mean
1
Mean 2
t-value
df
p
N1
N2
8,99 10,16 -3,77 58 0,00038 30 30
T-tests; Grouping: heure Group 1: 1 Group 2: 2
Std.Dev 1
Std.Dev 2
F-ratio Variances
p Variances
1,182 1,22 1,065 0,866832
34
Bernard CLÉMENT, PhD
Tests de moyennes et variances avec STATISTICA
MTH2302 Probabilités et méthodes statistiques
Test de moyennes avec variances inégales
35
Bernard CLÉMENT, PhD
Exemple 9 : n = 10
Y : 4050 - 4185 - 4080 - 4100 - 4160 - 4230 - 4350 - 4290 - 4320 - 4710
W calculée = 0.85 et P ( W ≤ 0.85) = 0.06 = p-value
on ne rejette pas la loi normale pour ces données.
36
Cas G : test d’ajustement à une loi normale - procédure de Shapiro-Wilk
BUT : vérifier si une série de données x1 , x2 , x3 , …….. xn provient d’unepopulation distribué selon une loi gaussienne.
H0 : Y ~ N ( μ, σ2 ) vs H1 : Y ~ autre distribution
Plusieurs tests : Khi2, Kolmogorov-Smirnov (D ), Lilifors, Shapiro-Wilk (W)Statistique W du test de Shapiro-Wilk :
W = [ ∑ an, i y( i ) ] 2 / [ ∑ ( yi - y ) ] 2a n, i coefficients spéciaux ( table non disponible dans le manuel du cours ).La statistique W mesure la corrélation entre la série ordonnée des observationset les quantiles théoriques d’une loi N( 0,1 ). 0.70 ≤ W ≤ 1
Décision : rejeter H0 si W est ‘’petite’’
Mise en oeuvre avec le logiciel Statistica : p-value = P ( W < Wcalculée )
Si le p-value est petite (disons inférieure à 0.05 ) on rejette loi normale
comme modèle acceptable pour les observations.
Exemple 9 : n = 10
Y : 4050 - 4185 - 4080 - 4100 - 4160 - 4230 - 4350 - 4290 - 4320 - 4710
W calculée = 0.85 et P ( W ≤ 0.85) = 0.06 = p-value
on ne rejette pas la loi normale pour ces données.
Bernard CLÉMENT, PhD
37
Exemple 9 : graphique quantile – quantile W = 0.85 et P (W ≤ 0.85) = 0.06 = p-value
Bernard CLÉMENT, PhD
Quantile-Quantile Plot of EX3_Y ( 6v*60c)Distribution: Normal
EX3_Y = 4247,5+187,1784*x
-2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0
Theoretical Quantile
0,05 0,10 0,25 0,50 0,75 0,90 0,95
4000
4100
4200
4300
4400
4500
4600
4700
4800
Obs
erve
d V
alue
Histogram: EX3_YK-S d=.19683, p> .20; Lilliefors p> .20
Shapiro-Wilk W=.85334, p=.06364
3900 4000 4100 4200 4300 4400 4500 4600 4700 4800
X <= Category Boundary
0
1
2
3
No. of obs.
Test Shapiro-Wilk
W = 0,85 p = 0,06
on ne rejette pas la distribution normale pour ces données
38Bernard CLÉMENT, PhD
Cas H : test d’ajustement à une loi de probabilité - test du Khi-deux
H0 : X suit loi fx (x; θ) exemple: X suit loi Weibull (θ1= b, θ2= c)
H1 : X ne suit pas loi fX(x; θ)
Statistique
pour le test ∑=
−=
k
i i
ii
een
D1
22 )(données : tableau d’effectifs n i
n i : effectifs observése i : effectifs calculés sous H0
Test : H0 rejetée si D2 > χ2ν, 1-α ν = k – p - 1 k = nombre classes
p = nombre paramètres estimés de la distribution
Condition d’application : e i > 5 α = seuil (niveau) du test)
Exemple 10 : données : n = 100 présentées en ordre croissant63.12 65.90 67.99 68.68 72.51 72.89 73.16 76.67 76.82 77.22 79.80 80.16 82.09 83.13 84.03
84.19 85.56 85.60 85.68 86.06 86.08 86.81 86.87 88.47 89.89 90.23 90.48 90.64 91.39 91.80
92.53 92.93 93.84 93.90 94.02 94.06 94.26 94.60 95.24 95.97 96.71 97.39 97.96 98.50 99.72
99.88 99.89 100.30 100.46 100.51 101.03 102.00 102.37 103.20 103.64 103.96 104.12 104.35 105.22 105.34
105.49 106.99 107.08 107.20 107.72 108.57 108.65 108.85 109.17 109.54 109.60 109.78 110.55 110.75 111.23
111.45 112.41 113.19 113.45 113.54 115.45 115.46 116.21 116.41 118.24 118.27 118.72 119.05 119.76 121.28
121.37 121.47 124.33 126.32 126.96 128.28 128.44 134.69 136.77 138.57
H0 : X suit une loi N(μ, σ2)
39
Bernard CLÉMENT, PhD
Cas H : test d’ajustement à une loi de probabilité - test du Khi-deux
Histogram ( 11v*100c)X = 100*7,5448*normal(x; 100,7308; 16,3745)
4%
6%
9%
13%
18%
15%
17%
10%
5%
3%
63,118570,6633
78,208185,7530
93,2978100,8426
108,3875115,9323
123,4771131,0220
138,5668
X
0
2
4
6
8
10
12
14
16
18
20
No
of o
bs
4%
6%
9%
13%
18%
15%
17%
10%
5%
3%
X: SW-W = 0.9938; p = 0.9292; N = 100; Mean = 100.7308; StdDv = 16.3745; Max = 138.5668; Min = 63.1185
Quantile-Quantile Plot of X ( 11v*100c)Distribution: Normal
X = 100,7308+16,5245*x
-3 -2 -1 0 1 2 3
Theoretical Quantile
0,01 0,05 0,25 0,50 0,75 0,90 0,99
60
70
80
90
100
110
120
130
140
150
Obs
erve
d Va
lue
Normal Probability Plot of X ( 11v*100c)
60 70 80 90 100 110 120 130 140 150
Observed Value
-3
-2
-1
0
1
2
3
Expe
cted
Nor
mal
Val
ue
40
Bernard CLÉMENT, PhD
Cas H : test d’ajustement à une loi de probabilité - test du Khi-deux
<= 64.5 1 1 1.00 1.00 1.35 1.35 1.35 1.3 -0.35
74.0 6 7 6.00 7.00 3.78 5.13 3.78 5.1 2.22
83.5 7 14 7.00 14.00 9.50 14.63 9.50 14.6 -2.50
93.0 18 32 18.00 32.00 17.21 31.84 17.21 31.8 0.79
102.5 21 53 21.00 53.00 22.46 54.30 22.46 54.3 -1.46
112.0 23 76 23.00 76.00 21.13 75.43 21.13 75.4 1.87
121.5 16 92 16.00 92.00 14.33 89.77 14.33 89.8 1.67
131.0 5 97 5.00 97.00 7.01 96.77 7.01 96.8 -2.01
140.5 3 100 3.00 100.00 2.47 99.24 2.47 99.2 0.53
infinity 0 100 0.00 100.00 0.76 100.00 0.76 100.0 -0.76
Procédure : « distribution fitting » de STATISTICA
Variable: X Distribution: Normal
Chi-Square = 2.31985 = D2 df = 4 (adjusted) p = 0.67716
loi normale n’est pas rejetée
Intervalle ni cum ni ni (%) cum ni (%) ei cum ei ei (%) cum ei (%) ni - ei
ni : observés
ei : attendus
sous H0
Top Related