19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten...
-
Upload
fritz-naiser -
Category
Documents
-
view
105 -
download
0
Transcript of 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten...
19.05.2009 Präsentation Seminararbeit - Tobias Byland
Mosaikplots
• Einführung
• Kategoriale Daten
• Schrittweiser Aufbau eines Mosaikplotes
• Erweiterte Mosaikplots
• Probleme bei Mosaikplots
1
19.05.2009 Präsentation Seminararbeit - Tobias Byland
1. Einführung
Anwendungsbereich von Mosaikplots:
• Analyse von kategorialen Daten
• Grafische Darstellung von (komplexen) Kontingenztafeln
• Qualitative Zusammenhänge zwischen mehreren Variablen aufzeigen
2
19.05.2009 Präsentation Seminararbeit - Tobias Byland
2. Kategoriale Daten
Unterscheide Daten nach Informationsgehalt:
• Nominal Unterscheidung(Geschlecht, Farben)
• Ordinal Unterscheidung und Ordnung(Schulnoten, Präferenzen)
• Metrisch Unterscheidung, Ordnung und Abstand(Temperatur, BIP)
Informationsgehalt bestimmt mögliche Rechenoperationen.
Kategoriale Daten
3
19.05.2009 Präsentation Seminararbeit - Tobias Byland
3. Schrittweiser Aufbau eines Mosaikplotes
53‘182 Beobachtungen
Datensatz Suicide
method2 poison gas hang drown gun knife jump other
sex age.group male 10-20 1160 335 1524 67 512 47 189 464 25-35 2823 883 2751 213 852 139 366 775 40-50 2465 625 3936 247 875 183 244 534 55-65 1531 201 3581 207 477 154 273 294 70-90 938 45 2948 212 229 105 268 147female 10-20 921 40 212 30 25 11 131 100 25-35 1672 113 575 139 64 41 276 263 40-50 2224 91 1481 354 52 80 327 305 55-65 2283 45 2014 679 29 103 388 296 70-90 1548 29 1355 501 3 74 383 106
4
19.05.2009 Präsentation Seminararbeit - Tobias Byland
3. Schrittweiser Aufbau eines Mosaikplotes
1
1
5
19.05.2009 Präsentation Seminararbeit - Tobias Byland
3. Schrittweiser Aufbau eines Mosaikplotes
method2 poison gas hang drown gun knife jump othersex male 8917 2089 14740 946 2945 628 1340 2214female 8648 318 5637 1703 173 309 1505 1070
6
19.05.2009 Präsentation Seminararbeit - Tobias Byland
3. Schrittweiser Aufbau eines Mosaikplotes
7
19.05.2009 Präsentation Seminararbeit - Tobias Byland
4. Erweiterte Mosaikplots
Mosaikplots zeigen also Zusammenhänge auf, aber sind diese auch statistischrelevant?Mass für Abhängigkeit zwischen kategorialen Daten: Chi-Quadrat-Statistik
Unter Unabhängigkeit würde man erwarten
Daraus folgt Teststatistik
Idee: Mosaikplot unter Unabhängigkeit als Benchmark oder die Pearson-Residuen direkt im Mosaikplot zeigen
8
19.05.2009 Präsentation Seminararbeit - Tobias Byland
4. Erweiterte Mosaikplots
Daten unter UnabhängigkeitVorhandene Daten
9
19.05.2009 Präsentation Seminararbeit - Tobias Byland
4. Erweiterte Mosaikplots
Nur einzelne Residuen sichtbar => kein Testauf Unabhängigkeit!
10
19.05.2009 Präsentation Seminararbeit - Tobias Byland
5. Probleme eines Mosaikplots
• Mehrere Mosaikplots für den selben Datensatz
• Viele Variablen / Ausprägungen
• Kleine oder fehlende Werte
11
19.05.2009 Präsentation Seminararbeit - Tobias Byland
5. Probleme eines Mosaikplots
Mehrere Mosaikplots für den selben Datensatz
Kein eindeutiges Verfahren zur Erstellung von Mosaikplots !
12
19.05.2009 Präsentation Seminararbeit - Tobias Byland
5. Probleme eines Mosaikplots
Ziel: Erkläre die Art der Selbstmorde (method2)
Vorgehen:
• Mit einer Variablen mit möglichst wenig Ausprägungen beginnen, im Idealfall dichotom.
• Den Mosaikplot für neue Variablen immer abwechslungsweise splitten.
• Die zu erklärende Variable als Letztes einfügen, und durch Einfärben hervorheben.
13
19.05.2009 Präsentation Seminararbeit - Tobias Byland
5. Probleme eines Mosaikplots
14
19.05.2009 Präsentation Seminararbeit - Tobias Byland
5. Probleme eines Mosaikplots
Viele Variablen / Ausprägungen
(A Mosaic of Television Ratings, J. A. Hartigan and Beat Kleiner, 1984)
15
19.05.2009 Präsentation Seminararbeit - Tobias Byland
5. Probleme eines Mosaikplots
Lösung: Subplots
16
19.05.2009 Präsentation Seminararbeit - Tobias Byland
5. Probleme eines Mosaikplots
Kleine oder fehlende Werte
17
19.05.2009 Präsentation Seminararbeit - Tobias Byland
5. Probleme eines Mosaikplots
Kleine oder fehlende Werte
• Mosaikplots eignen sich weniger für Kontingenztabellen mit kleinen Zelleinträgen
• Beliebig grosse Zelleinträge sind hingegen kein Problem.
18
19.05.2009 Präsentation Seminararbeit - Tobias Byland
6. Fairs Affairs
affairs gender age age2 yearsmarried 0: 451 female: 315 1: 6 1: 276 1: 52 1: 150 male : 286 2: 270 2: 259 2: 193 3: 203 3: 66 3: 356 4: 79 5: 43 children religion education rating no : 171 1: 212 1: 205 1: 82 yes: 430 2: 319 2: 316 2: 93 3: 70 3: 80 3: 426
> summary(Affairs_mp)
19
19.05.2009 Präsentation Seminararbeit - Tobias Byland
6. Anwendungsbeispiel: Fairs Affairs
19.05.2009 Präsentation Seminararbeit - Tobias Byland
6. Anwendungsbeispiel: Fairs Affairs