Pub Quiz Eindhoven Atletiek vrijdag 14 maart Ronde 4 uitspraken.
Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één...
-
Upload
lodewijk-geerts -
Category
Documents
-
view
212 -
download
0
Transcript of Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één...
Statistische uitspraken overonbekende populatiegemiddelden
Uitspraken over één populatiegemiddelde Het vergelijken van twee populatiegemiddelden Gepaarde waarnemingen Het vergelijken van meer dan twee populatiegemiddelden
Toets van de hypothese µ = µ0
Vraag: Is een aselecte steekproef van n elementen met gemiddelde van de meting <x> en spreiding s, afkomstig uit een normaal verdeelde populatie met populatiegemiddelde µ 0 en met onbekende spreiding sigma ?
Toetsing: toets van Student (Gosset)
NB toetsingsgrootheden: gestandaardiseerd verschil NB vrijheidsgraden
Statistische uitspraken overonbekende populatiegemiddelden
Voorbeeld
Vier onafhankelijke bepalingen van haemoglobinegehalte van een standaard bloedmonster.Het gehalte bedraagt 14,0 g%
Resultaten:14,114,414,214,2
Verkrijgt de analyst resultaten die systematisch ( # toeval) van het werkelijke gehalte verschillen ?
Aanname: Meetresultaten normaal verdeeld, dus steekproef van een normaal verdeelde populatie
Statistische uitspraken overonbekende populatiegemiddelden
Uitspraken over één populatiegemiddelde
Statistische uitspraken overonbekende populatiegemiddelden
Geen reden om te veronderstellen dat eventuele niet-toevallige afwijkingen een bepaalde richting zouden uitgaan
tweezijdig toetsen
Nulhypothese: H0 : µ = 14,0 (g%)Alternatieve hypothese: H1 : µ # 14,0 (g%)
Kies onbetrouwbaarheidsdrempel:(meestal) p = 0,05
Toetsingsgrootheid:t = (<x> - 14,0)/ (S/sqrt4) = ...
Vrijheidsgraden:n-1 = 3
Tabel
Uitspraken over één populatiegemiddelde
Meestal is niet gekend en wordt dan geschat als de steekproef-standaarddeviatie
voor toetsting wordt
vervangen door de ‘standard error of the mean’
s n
i 1
(X i X)2
n 1
sd(X)n
se(X)s
n
Statistische uitspraken overonbekende populatiegemiddelden
Uitspraken over één populatiegemiddelde
Dit leidt tot de toetsingsgrootheid
Het 1-alfa betrouwbaarheidsinterval voor µ wordt in het algemeen gegevendoor:
t X µ
0
se(X)X µ
0
s
n
X t .s
n< µ < X t .
s
n
nb. bij df =< 30 is de spreiding van t sterker dan van Z
Statistische uitspraken overonbekende populatiegemiddelden
Het vergelijken van twee populatiegemiddelden
Veronderstel twee populatiegemiddelden die normaal verdeeld zijnµX en µY
X1,….Xn zijnde uitkomsten in een steekproef (grootte n) van de meet-waarden in de eerste populatie
Y1,….Ym zijnde uitkomsten in een steekproef (grootte m) van de meet-waarden in de tweede populatie
Gemiddelden X en Y normaal verdeeld, dan ook X-Y normaal verdeeldmet
sd(X Y) 2
X 2
Y
2X
n
2Y
m
Statistische uitspraken overonbekende populatiegemiddelden
Het vergelijken van twee populatiegemiddelden
Meestal zijn de populatieparameters niet gekend. Als we mogenveronderstellen dat beide ‘s gelijk zijn, dan is
en kan deze geschat worden door
de toetsting gebeurt door
sd(X Y) 1n
1m
se(X Y) s1n
1m
t X Y
se(X Y)
X Y
s1
n
1
m
Statistische uitspraken overonbekende populatiegemiddelden
Het vergelijken van twee populatiegemiddelden
Het 1-alfa betrouwbaarheidsinterval voor het verschil bedraagt:
(X Y) t s1n
1m
< µX µY < (X Y) t s1n
1m
Statistische uitspraken overonbekende populatiegemiddelden
Het vergelijken van twee populatiegemiddelden
Voorbeeld:
Vergelijking van fosfaatexcretie in twee groepen
Statistische uitspraken overonbekende populatiegemiddelden
Group Statistics
24 115,5000 20,39608 4,16333
9 133,0000 21,00000 7,00000
GROEP,00
1,00
FOSFAATN Mean Std. Deviation
Std. ErrorMean
Independent Samples Test
,005 ,942 -2,178 31 ,037 -17,5000 8,03375 -33,88495 -1,11505
-2,149 14,049 ,050 -17,5000 8,14453 -34,96251 -,03749
Equal variancesassumed
Equal variancesnot assumed
FOSFAATF Sig.
Levene's Test forEquality of Variances
t df Sig. (2-tailed)Mean
DifferenceStd. ErrorDifference Lower Upper
95% ConfidenceInterval of the
Difference
t-test for Equality of Means
Het vergelijken van gepaarde populatiegemiddelden
Statistische uitspraken overonbekende populatiegemiddelden
Typisch voorbeeld:
Is Captopril effectief bij de behandeling van hypertensie?
Studieopzet:15 patiënten met hypertensie worden behandeld.Wat ons interesseert is de systolische blooddruk voor en na de behandeling met CAPTOPRIL
Het vergelijken van gepaarde populatiegemiddelden
Statistische uitspraken overonbekende populatiegemiddelden
Is Captopril effectief bij de behandeling van hypertensie?
Dataset:
patient SBPbef DBPbef SBPafter DBPafter1 210 130 201 1252 169 122 165 1213 187 124 166 1214 160 104 157 1065 167 112 147 1016 176 101 145 857 185 121 168 988 206 124 180 1059 173 115 147 103
10 146 102 136 9811 174 98 151 9012 201 119 168 9813 198 106 179 11014 148 107 129 10315 154 100 131 82
Het vergelijken van gepaarde populatiegemiddelden
Statistische uitspraken overonbekende populatiegemiddelden
Systolische bloeddruk
Blo
ed
dru
k (m
m H
g)
120
140
160
180
200
220
voor na
Grafische voorstelling:
Veel variatie in interceptWeinig variatie in slope
Het vergelijken van gepaarde populatiegemiddelden
Voorbeeld voor-na metingen
Cave metingen sterk gecorreleerd (hoog voor hoog na)Stuk van de variantie in de data niet relevant, m.n. de variantie van deeerste meting
Onderzoeksvraag: wat is het verschil tussen de voor- en na- meting?
H0: er is geen verschil m.a.w. meting voor - meting na = 0
Nota bene: het verschil is de richtingscoëfficiënt van de rechte die de voor- en na- meting verbindt. We zijn niet geïnteresseerd in de verklaring van de variantie van de intercepten van die rechten, wel in de beschrijving van de richtingscoëfficiënt (en van de mate waarin het toeval een rol speelt in de grootte van die coëfficiënt)
Statistische uitspraken overonbekende populatiegemiddelden
Systolische bloeddruk
blo
ed
dru
k (m
mH
g)
120
140
160
180
200
220
voor na
Het vergelijken van gepaarde populatiegemiddelden
Statistische uitspraken overonbekende populatiegemiddelden
Grafische voorstelling:
Veel variatie in interceptVeel variatie in slope
Het vergelijken van gepaarde populatiegemiddelden
Voorbeeld voor-na metingen
Meest eenvoudig voorbeeld van longitudinale data
Testing: Bereken voor elk paar het verschil (nieuwe ‘variabele’)Verschil van twee normaal verdeelde kenmerken is ook normaal verdeeldVoer een één steekproef t-test uit met als test waarde 0…Statistische software: doet alles in één keer (black box)
Statistische uitspraken overonbekende populatiegemiddelden
Paired Samples Statistics
176,93 15 20,565 5,310
158,00 15 20,004 5,165
SBPBEF
SBFAFTER
Pair1
Mean N Std. DeviationStd. Error
Mean
Het vergelijken van gepaarde populatiegemiddelden
Voorbeeld voor-na metingen
Statistische uitspraken overonbekende populatiegemiddelden
Paired Samples Correlations
15 ,901 ,000SBPBEF & SBFAFTERPair 1N Correlation Sig.
Paired Samples Test
18,93 9,027 2,331 13,93 23,93 8,123 14 ,000SBPBEF - SBFAFTERPair 1Mean Std. Deviation
Std. ErrorMean Lower Upper
95% ConfidenceInterval of the
Difference
Paired Differences
t df Sig. (2-tailed)
p=0,00000115
Het vergelijken van gepaarde populatiegemiddelden
Voorbeeld voor-na metingen
Wat zouden de resultaten zijn als we i.p.v. een gepaarde t-test een gewone (niet gepaarde) t-test zouden hebben uitgevoerd?
Statistische uitspraken overonbekende populatiegemiddelden
Het vergelijken van gepaarde populatiegemiddelden
Voorbeeld voor-na metingen
Statistische uitspraken overonbekende populatiegemiddelden
GROUP
2,22,01,81,61,41,21,0,8
SB
PB
EF
220
200
180
160
140
120
Group Statistics
15 176,93 20,565 5,310
15 158,00 20,004 5,165
GROUP1
2
SBPBEFN Mean Std. Deviation
Std. ErrorMean
t-test: variatie van beide metingen van belang
nn
YX
YXse
YXt
YX
22)(
Het vergelijken van gepaarde populatiegemiddelden
Voorbeeld voor-na metingen
Statistische uitspraken overonbekende populatiegemiddelden
Independent Samples Test
,021 ,886 2,556 28 ,016 18,93 7,408 3,760 34,107
2,556 27,979 ,016 18,93 7,408 3,759 34,107
Equal variancesassumed
Equal variancesnot assumed
SBPBEFF Sig.
Levene's Test forEquality of Variances
t df Sig. (2-tailed)Mean
DifferenceStd. ErrorDifference Lower Upper
95% ConfidenceInterval of the
Difference
t-test for Equality of Means
p=0,016
Niet-parametrische toetsen
Tot zover: uitgangspunt normaal verdeelde populatiekenmerken
Cave: Deze aanname is net altijd gewettigd
Hoe de gewettigdheid bepalen ?
Hetzij uit eigen data
Hetzij uit eerder onderzoek of uit literatuur
Indien niet gewettigd:
NIET-PARAMETRISCHE METHODEN
Statistische uitspraken overonbekende populatiegemiddelden
Niet-parametrische toetsen
Statistische uitspraken overonbekende populatiegemiddelden
Parametrische methoden en hun niet-parametrische alternatieven
parametrische methode niet-parametrische methode
t-toets voor twee steekproeven Wilcoxon’s twee-steekproeventoetsMann-Whitney
t-toets voor gepaardewaarnemingen
Wilcoxon’s rangtekentoets
Niet-parametrische toetsen
Statistische uitspraken overonbekende populatiegemiddelden
Ranks
24 14,94 358,50
9 22,50 202,50
33
GROEP,00
1,00
Total
FOSFAATN Mean Rank Sum of Ranks
Test Statisticsb
58,500
358,500
-2,001
,045
,044a
Mann-Whitney U
Wilcoxon W
Z
Asymp. Sig. (2-tailed)
Exact Sig. [2*(1-tailedSig.)]
FOSFAAT
Not corrected for ties.a.
Grouping Variable: GROEPb.
t-test: p = 0,037
fosfaat studie
Niet-parametrische toetsen
Statistische uitspraken overonbekende populatiegemiddelden
t-test: p = 0,00000115
Ranks
15a 8,00 120,00
0b ,00 ,00
0c
15
Negative Ranks
Positive Ranks
Ties
Total
SBFAFTER - SBPBEFN Mean Rank Sum of Ranks
SBFAFTER < SBPBEFa.
SBFAFTER > SBPBEFb.
SBPBEF = SBFAFTERc. Test Statisticsb
-3,410a
,001
Z
Asymp. Sig. (2-tailed)
SBFAFTER -SBPBEF
Based on positive ranks.a.
Wilcoxon Signed Ranks Testb.
Captopril studie
Voorbeelden
Statistische uitspraken overonbekende populatiegemiddelden
ExpectedNormal
COUNT
Shapiro-Wilk W=,97032, p<,1493
Upper Boundaries (x <= boundary)
No
of
ob
s
0
5
10
15
20
25
30
35
40
45
-100 0 100 200 300 400 500 600
Voorbeelden
Statistische uitspraken overonbekende populatiegemiddelden
STAT. Grouping: SARCOMA (sarc.sta) BASIC Group 1: G_1:0 STATS Group 2: G_2:1 Mean Mean Valid N Valid N Std.Dev. Variable G_1:0 G_2:1 t-value df p G_1:0 G_2:1 G_1:0 COUNT 239,0385 279,1781 -1,62382 97 ,107660 26 73 135,0432
STAT. Grouping: SARCOMA (sarc.sta)
±1.96*Std. Err.
±1.00*Std. Err.
Mean
Box & Whisker Plot: COUNT
SARCOMA
CO
UN
T
160
180
200
220
240
260
280
300
320
0 1
Voorbeelden
Statistische uitspraken overonbekende populatiegemiddelden
ExpectedNormal
DIAM
Shapiro-Wilk W=,94295, p<,0005
Upper Boundaries (x <= boundary)
No
of
ob
s
0
5
10
15
20
25
30
5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5
Voorbeelden
Statistische uitspraken overonbekende populatiegemiddelden
STAT. Mann-Whitney U Test (sarc.sta) NONPAR By variable SARCOMA STATS Group 1: 0 Group 2: 1 Rank Sum Rank Sum Z variable Group 1 Group 2 U Z p-level adjusted p-level DIAM 919,0000 4031,000 568,0000 -3,02948 ,002452 -3,03011 ,002447
STAT. Mann-Whitney U Test (sarc.sta)
t-test: p = ,004596t-test: p = ,004596
±1.96*Std. Err.
±1.00*Std. Err.
Mean
Box & Whisker Plot: DIAM
SARCOMA
DIA
M
6,3
6,5
6,7
6,9
7,1
7,3
7,5
0 1