Von der Fragestellung zu den eigenen Ergebnissen –
Einführung in die Statistik Antje & Dominik
Kurze Geschichte der Statistik
G. Achenwall (Göttingen 1719-1747)
„Wissen, das ein Staatsmann besitzen sollte“
Datensammlung durch die Länder (statistische Ämter)
Meilensteine John Graunt
(1661-1662) entdeckte, dasmehr Knaben als Mädchen geboren wurden
Adolphe Quetelet (1798-1874) führte das Konzept des Durchschnittsmenschen ein, dessen Gedanken und Taten mit dem Verhalten der Gesellschaft übereinstimmen
Bedeutung der Konstanz grosser Zahlen
Neben dem blossen Sammeln von Daten gewinnen die Interpretation und das Ziehen von Schlussfolgerungen an Bedeutung.
Verknüpfung von Statistik und Wahrscheinlichkeitsrechnung
Durch das Glücksspiel - Galileo Galilei soll herausgefunden haben, daß mit 3 Würfeln häufiger die Zahl „10“ als die Zahl „9“ gewürfelt wird (um 1600)
Weitere Meilensteine
Karl Friedrich Gauß (1777-1855) -Umlaufbahn von „Ceres“ mit
Methode der kleinsten Quadrate -Normalverteilung
Weitere Meilensteine
Thomas Bayes (1702-1763) A-priori Wahrscheinlichkeit A-posteriori Wahrscheinlichkeit
Weitere Meilensteine
Karl Pearson (1857-1936) Chi-Quadrat
Ronald A. Fisher (1890-1962) Varianz, Planung, Zufallsanordnung und Signifikanztests
Zwischenfazit
Statistik sollte nicht nach „Kochbuch“ durchgeführt werden.
Hintergründe und Voraussetzungen der verschiedenen Methoden sind wichtiger als mathematische Formeln
Beschreibende Statistik
Population und Stichprobe
CAVE Selection BIAS
„Statistisches Handwerkszeug“
1. Therapiestudien
2. Diagnosestudien
„Statistisches Handwerkszeug“
Therapiestudien: Zweck: Nachweis einer Wirksamkeit, Vergleich
zweier therapeutischen Maßnahmen
wichtig: messbare „Outcomes“z.B. Überlebenszeit, binäre Zielgrößen (geheilt/nicht geheilt) oder stetige Zielgrößen (FEV1)
einzelne Messungen müssen voneinander unabhängig sein(Ergebnisse der Therapie bei einem Patienten unabhängig vom Ergebnis des anderen Patienten)
Binäre Zielgrößen
Beispiel: Auftreten einer akuten Otitis media in bestimmter Hochrisikogruppe (Simoes 1996)
Auftreten = negatives Ergebnis/TherapieversagenVierfeldertafel:
Therapieversagen
Therapie ja nein
neu a b a + b
Standard c d c + d
a + c b + d a+b+c+d
WahrscheinlichkeitenTherapieversagen
Therapie ja nein
neu a b a + b
Standard c d c + d
a + c b + d a+b+c+d
Wahrscheinlichkeit Pn für eine Otitis media bei einem Kind in Gruppe „Neue/Experimentelle Therapie“ läßt sich schätzen durch: Pe = a/(a + b)
Ps = c/(c + d)
RisikodifferenzTherapieversagen
Therapie ja nein
neu a b a + b
Standard c d c + d
a + c b + d a+b+c+d
RD = Pe – Ps
RD = 0 bedeutet, dass Wahrscheinlichkeit in beiden Gruppen für Therapieversagen gleich groß ist.
RD < 0 : experimentelle Gruppe/“NeueTherapie“ besser
Relatives Risiko
Verhältnis beider WahrscheinlichkeitenRR = Pe : Ps
bei Pe = Ps RR = 1
RR<1in experimenteller Gruppe bessere Prognose
RR = (a/(a+b)) / (c/(c+d))
Odds-Ratio
odds = chance (Sportwetten!) Bei Fall-Kontroll-Studien (hier kann ein Therapieversagen
nicht geschätzt werden) Odds = P / 1 – P P = Wahrscheinlichkeit
Beispiel: Odds von 3 : 1 = 75 % Eintritt und 25% gegen Eintritt des Ereignisses
Odds-Ratio = Odds für den Eintritt eines Ereignisses in der exp.Gruppe
Odds in der Kontrollgruppe Odds = 1 : Wahrscheinlichkeit eines Ereignisses in beiden
Gruppen gleich RR<1 in experimenteller Gruppe bessere Prognose
Number needed to treat (NNT)
In EBM häufig gebraucht Wieviele Patienten muss ich behandeln, um im
Vergleich zu einer anderen Therapie ein positives Ergebnis herbeizuführen
Voraussetzung: experimentelle Gruppe besser! Pe < Ps
NNT = 1/ARR = 1/RDARR = Absolute Risikoreduktion
Vergleichende Maßzahlen
Absolute Maßzahlen: RD (Risikodifferenz), ARR (Absolute Risikoreduktion)
Relative M.: RR (Relatives Risiko), RRR (Relative Risikoreduktion), OR (Odds Ratio)
Beispiel: RD 0,5 % → bei Risiko von 1 auf 0,5%0,005 : 0,01 = 0,5 RR
→ bei Risiko von 48 auf 47,5%47,5 : 48 = 0,99 RR
Stetige Zielgrößen
Beispiel: Therapie Atemwegsobstruktion, Zielgröße: Änderung FEV1
Wichtig: Annahme über die zugrunde liegende Verteilung des Merkmals
Wenn annähernd normalverteilt bzw. symmetrisch: Mittelwertdifferenz MD = xE – xS
MD = 0 : beide Gruppen unterscheiden sich im Mittelwert nicht
Modelle zur Beschreibung des Zufalls
•Binomialverteilung
•Poissonverteilung
•Normalverteilung
•Log-Normalverteilung
•Exponentialverteilung...
Überlebenszeiten Zeit bis zum Eintritt des Todes Schätzung der Überlebenszeit in 2 Therapiegruppen
mittels Kaplan-Meyer-Methode
Vergleich zweier Gruppen mittels Log-Rank-Tests (sind die Unterschiede in beiden Gruppen signifikant??)
Hazard-Funktion: Wahrscheinlichkeit, an einem bestimmten Zeitpunkt zu versterben
Vergleichende Messzahlen: Differenz der Überlebenszeiten oder Hazard-RatioHR > 1 : Risiko zu versterben in exp.Gruppe größer als in standard.Gruppe
„Statistisches Handwerkszeug“
1. Therapiestudien
2. Diagnosestudien
„Statistisches Handwerkszeug“
2. Diagnosestudien Zweck: Beurteilung einer (neuen) Maßnahme
zur Diagnose einer Erkrankung
Vorhersage der neuen Methode wird mit Goldstandard verglichen (=gegenwärtig zuverlässigste Methode)
Binäre Outcomes: Krankheit erkannt oder nicht
Binäre Zielgrößen
Beispiel: Röntgendiagnostik mit klinisch-neurologischer Beurteilung für Diagnose intrakranieller Verletzungen bei Kindern mit SHT (Lloyd 1997)
Goldstandart: CCTVierfeldertafel:Krankheit liegt
vorKrankheit liegt nicht vor
Testergebnis positiv
a b a + b
Testergebnis negativ
c d c + d
a + c b + d N
Prävalenz, Vortestwahrscheinlichkeit
Vortestwahrscheinlichkeit = (a + c) / N
Krankheit liegt vor
Krankheit liegt nicht vor
Testergebnis positiv
a b a + b
Testergebnis negativ
c d c + d
a + c b + d N
Sensitivität und Spezifität
Sensitivität = a / (a + c)Wahrscheinlichkeit, dass ein Erkrankter durch eine
diagnostischeMethode auch als krank erkannt wird
Spezifität = d / (b + d) Wahrscheinlichkeit, dass ein Gesunder durch eine diagnostischeMethode auch als gesund erkannt wird
Krankheit liegt vor
Krankheit liegt nicht vor
Testergebnis positiv
a b a + b
Testergebnis negativ
c d c + d
a + c b + d N
Wahrscheinlichkeitsverhältnis
Krankheit liegt vor
Krankheit liegt nicht vor
Testergebnis positiv
a b a + b
Testergebnis negativ
c d c + d
a + c b + d N
engl. likelihood ratio (LR):Verhältnis der Wahrscheinlichkeiten, dass bei einer erkrankten Person das entsprechende Testergebnis beobachtet wird im Vergleich dazu, dass es bei einer gesunden Person beobachtet wird.
LR + = Sensitivität / (1 – Spezifität)wenn LR+ = 1: Wahrscheinlichkeiten bei positivem
Test gleich großje größer LR +, ums so verlässlicher das positive
Testergebnis
Wahrscheinlichkeitsverhältnis
Krankheit liegt vor
Krankheit liegt nicht vor
Testergebnis positiv
a b a + b
Testergebnis negativ
c d c + d
a + c b + d N
LR - = (1 – Sensitivität) / Spezifitätwenn LR- = 1: Wahrscheinlichkeiten bei negativem
Test gleich großje kleiner LR -, ums so verlässlicher das negative
Testergebnis
Prädiktive Werte
Krankheit liegt vor
Krankheit liegt nicht vor
Testergebnis positiv
a b a + b
Testergebnis negativ
c d c + d
a + c b + d N
Positiver Prädiktiver Wert (PPW)Wahrscheinlichkeit, dass ein Patient bei positivem
Testergebnis tatsächlich erkrankt istPPW = a / (a + b)
abhängig von Vortestwahrscheinlichkeit
• Von Sox e.a. (Stanford University) entwickelt• 211 eigene Patienten mit Angina pectoris
standardisiert nach Angina pectoris Symptomen befragt → Koronarangiographie → logistische Regression
Bsp. Angina pectoris-Score zur Diagnostik der KHKNach SOX HC e.a. (1990) Am J Med 89:7-14
Angina pectoris-Score Nach SOX HC e.a. (1990) Am J Med 89:7-14
Attribut Exakter Koeffizient (n=211) Gerundeter Koeffizient ( (Score 0-25)
Alter über 60 + 2,85 + 3
Belastungsangina + 4,26 + 4
Infarktverdacht in der Anmanese
+ 3,9 + 4
Belastungsabbruch wegen AP
+ 2,76 + 3
Nitratpositiv + 1,93 + 2
Raucher (20 pack-years)
+ 3,93 + 4
Männliches Geschlecht
+ 5,37 + 5
Maximale Punktzahl 25
Angina pectoris-Score Nach SOX HC e.a. (1990) Am J Med 89:7-14
Attribut Exakter Koeffizient (n=211) Gerundeter Koeffizient ( (Score 0-25)
Alter über 60 + 2,85 + 3
Belastungsangina + 4,26
Infarktverdacht in der Anmanese
+ 3,9
Belastungsabbruch wegen AP
+ 2,76
Nitratpositiv + 1,93
Raucher (20 pack-years)
+ 3,93 + 4
Männliches Geschlecht + 5,37 + 5
Maximale Punktzahl 25
+ 4
+ 4
+ 3
+ 2
13
Prävalenz der KHK vor Anamnese(pretest probability nach Sox HC e.a. (1990) Am J Med 89:7-14)
• Kardiologische Universitätsklinik = ca 75 %(n=170, Stanford University + Palo Alto VA Medical Centre)
• Kardiologische Ambulanz = ca 33 %(n=404, Palo Alto Veterans Administration Medical Centre)
• Allgemeinmedizinische Ambulanz = ca 8 %(n=289, Kaiser-Permanente Medical Centre)
Aussagekraft einer Standardisierten Anamnese nach Versorgungsbereichen
Wie lassen sich diese Unterschiede erklären????
Aussagekraft einer standardisierten Anamnese nach Versorgungsbereichen
Ätiologie des akuten Brustschmerzes(Erhardt e.a. (2002) Task force on the management of chest pain. Eur Heart Journ 23:1153-1176)
Ätiologie Allgemein-praxis (in%)
Notfall-Zentrale (in%)
Rettungs-dienst (in%)
Notfallauf-nahme (in%)
Kardial 20 60 69 45
muskulo-skelettal
43 6 5 14
pulmonal 4 4 4 5
gastro-intestinal
5 6 3 6
psychiatrisch
11 5 5 8
and.Ursachen
16 19 18 26
• Wenn ein/e Arzt/Ärztin bei einem Patienten eine typische Symptomatik feststellt,dann weisen die klinischen Befunde mit einer quantifizierbaren Wahrscheinlichkeit auf das Vorliegen einer definitiven Erkrankung hin, die von der Prävalenz dieser Erkrankung unter allen Patienten dieses Arztes abhängt, welche die gleiche Symptomatik haben.
→in allgemeinärztlichen Praxen andere Verhältnisse als in spezialisierten Ambulanzen
Folgerungen (I)Nach SOX HC e.a. (1990) Am J Med 89:7-14
• Die Nachtestwahrscheinlichkeit lässt sich mit Hilfe des Bayes-Theorems erklären und errechnen.Dafür muss neben der Sensitivität und Spezifität eines Testes zwingend auch die Vortestwahrscheinlichkeit (Prävalenz) bekannt sein.
→praxisepidemiologische Studien erforderlich
Folgerungen (II)Nach SOX HC e.a. (1990) Am J Med 89:7-14
Thomas Bayes
• Bayes-Theorems Berechnung der Nachtestwahrscheinlichkeit
PPW (+) = se · pse · p + (1 – sp) ( 1 – p)
PPW (+) = positiver prädiktiver Wert (Nachtestwahrscheinlichkeit)se = Sensitivitätsp = Spezifitätp = Prävalenz
Folgerungen (II)Nach SOX HC e.a. (1990) Am J Med 89:7-14
Statistischer Test
Mit statistischen Tests kann man prüfen, ob sich die beobachteten Daten durch zufallsbedingte Abweichungen erklären lassen – weichen nur zufällig von Null ab = Nullhypothese
Oder ob die erhobenen Daten für die Vermutung, dass es einen wahren Effekt gibt, sprechen = Alternativhypothese.
P – Wert, Signifikanz
P-Wert gibt die Wahrscheinlichkeit an, die vorliegenden Studienergebnisse zu beobachten, wenn die Nullhypothese zutrifft.
Ein Testergebnis heißt statistisch signifikant, wenn der p-Wert unterhalb des vorgegebenen Fehlers 1.Art (meist 0,05) liegt (p< )
Signifikant bedeutet, dass das Ergebnis nicht durch den Zufall allein erklärbar ist (Vorbehalt Fehler der 1.Art). Fehlentscheidungen beim Testen
• Fehler 1.Art (Signifikanzniveau):– Das unberechtigte Ablehnen der
Nullhypothese– P=
• Fehler 2.Art:– Das unberechtigte Beibehalten der
Nullhypothese– P=ß
Prinzipielle Vorgehensweise
Formulierung der Hypothesen Wahl des Signifikanzniveaus (üblich =5%) Wahl des Testverfahrens Durchführen des Tests und Entscheidung
Auswahl der Testverfahren
Merkmalsart: qualitativ/quantitativ Verteilungstyp: parametrisch
(Normalverteilung), nicht-parametrisch (verteilungsunabhängig)
Anzahl der Stichproben (1, 2, >2) Unabhängige oder abhängige
Stichproben
Weitere Fragestellungen und die entsprechenden Analysen
Wodurch kann man zwei Gruppen am besten unterscheiden? unter Verwendung verschiedener Variablen Diskriminanzanalyse
Durch welche Variablen lassen sich Probanden in sich unter-scheidende Gruppen einteilen? Clusteranalyse
Welche Struktur hat ein Fragebogen und wie gut ist diese? Faktorenanalyse Reliabilitätsanalyse: Interne Konsistenz; Trennschärfe…
So geht es immer los! – Deskriptive Statistik
das Datenniveau ist entscheidend!!!
Skala Daten Erfassung
Nominal alternativ =>
kategorial =>
2 Mengen/Klassenmehr als 2
Mengen/Klassen
Ordinal ordinal Ordnen von KategorienRangreihen
Intervall Verhältnis
metrisch Messen
Als nächstes folgend die Kennwerte!
Alternative / Kategoriale Daten:Mittelwert: ModalwertStreuungswerte: relativer Infogehalt
Ordinale Daten:Mittelwert: MedianStreuungswerte: Quartile
Metrische Daten:Mittelwert: arithmetisches
MittelStreuungswerte:
Standardabweichung
Die weitere Auswertung hängt von der Fragestellung ab! Die häufigsten Fragen betreffen:
UnterschiedeZusammenhänge
zwischen Gruppen zwischen Variablen
=> Unterschiedstests => Korrelationen
=> Regression
Einordnung der Unterschiedstests
abhängig vom Datenniveau
abhängige oder unabhängige Stichproben
abhängig von Anzahl der Gruppen
Unterschiedstests für Nominale Daten
zwei abhängige Stichproben:Chi- Quadrat – Test von Mc Nemar
zwei unabhängige Stichproben: Chi – Quadrat – Test nach Pearson
> zwei abhängige Stichproben Unterschied zwischen den Häufigkeiten der
Merkmals-ausprägung?: Binomial – Test Unterschied zwischen erwarteten und beobachteten
Häufigkeiten?: Chi – Quadrat – Einzeltest > zwei unabhängige Stichproben: Chi – Quadrat –
Test
Unterschiedstests für Ordinale Daten oder Metrische Daten ohne Normalverteilung
zwei abhängige Stichproben: Wilcoxon – Test
zwei unabhängige Stichproben: Mann-Whitney U – Test
> zwei abhängige Stichproben: Friedman- Test
> zwei unabhängige Stichproben: H - Test nach Kruskal-
Wallis
Unterschiedstest für Metrische Daten mit Normalverteilung
zwei abhängige Stichproben: t- Test bei abhängigen Stichproben
zwei unabhängige Stichproben: t- Test bei unabhän- gigen Stichproben
> zwei abhängige Stichproben: einfaktorielle Varianz- analyse mit Meßwieder- holung
> zwei unabhängige Stichproben: einfaktorielle Varianz- analyse
+ Post hoc – Test
Einordnung von Korrelationen
Korrelationskoeffizient (r); Signifikanz (p) ausgehend von linearem Zusammenhang!!! Richtung der Beziehung: +...positiv vs.
-...negativ Stärke des Zusammenhanges (- 1 bis + 1)
Bis 0,2 sehr geringer ZusammenhangBis 0,5 geringer ZusammenhangBis 0,7 mittlerer ZusammenhangBis 0,9 hoher ZusammenhangÜber 0,9 sehr hoher Zusammenhang
Scheinkorrelation!!! => Partielle Korrelation
Verschiedene Korrelationskoeffizienten
Nominale Daten Korrelationskoeffizinent nach Spearman (bei
Kreuztabellen) bei dichotomer vs. ordinaler Variable Chi – Quadrat – Test + Assoziationsmaße für
Nominalskalierte Variablen => z.B. Kontingenzkoeffizient
Ordinale Daten oder metrische Daten ohne Normalverteilung
Korrelationskoeffizienten nach Spearman Korrelationskoeffizienten nach Kendall (gut bei
Ausreißern)
Metrische Daten + Normalverteilung Korrelationskoeffizient nach Pearson
Regressionsanalyse
immer erst nach Korrelation!!! Variablenauswahl: theoriegeleitet
neue Fragestellungen unterschiedliche Methoden: Einschluss
VorwärtsRückwärtsSchrittweise
Hierarchische Regression
entscheidend: R2…BestimmtheitsmassBeta…Betagewichte (z-
transformiert) B…Koeffizienten für Gleichung
Beispiel für Darstellung einer linearen Regression
PsychischeLebensqualit
ät
Fehl-anpassung
SAD
VermeidungSAD
-1,18*
,36*
,69*
-,32*
R2 = ,67
Anzahl Schocks
ÜbererregungIES-R
Beispiel für die Darstellung einer hierarchischen Regression
Körperliche LQ Psychische LQ
Block Ri2 R2 Ri
2 R2
1. Demographische Variablen
,00 ,00 ,00 ,00
2. Medizinische Variablen ,06 ,06 ,04 ,04
3. Angst/Depressivität ,19 ,25 ,30 ,34
4. Anpassungsstörung ,24 ,49 ,31 ,65
5. Posttraum.Belast. (IES-R)
,06 ,55 ,08 ,73
6. Posttraum.Belast. (PTSS)
,00 ,56 ,01 ,74
7. Herzangst ,00 ,56 ,00 ,74Ri2 … Inkrement von R2
R2… kumuliertes Bestimmtheitsmaß
Vielen Dank für Eure Aufmerksamkeit!
Noch Fragenzur Statistik?!
Top Related