Methoden der Politikwissenschaft
Faktorenanalyse
Siegfried Schumann
2
Organisatorische Vorbemerkungen:
• Für Sozialwissenschaften meist irrelevant:– Vorgeschaltete Mittelwertbildung (Hausfrauen-Urteile)
• Nicht behandelt:– Eignung der Korrelationsmatrix– Graphische Interpretation der Faktoren
3
Übersicht zur Faktorenanalyse (FA)
1. Korrelationsmatrix:
2. Grundgleichung der FA: Ladung · Score
3. Durch Einsetzen:
Korrelationsmatrix der Faktoren „C“
Falls Faktoren unkorreliert: C = Einheitsmatrix: (Fundamentaltheorem d. FA)
4. Erweiterung: (spez. Varianz + Messfehler; wird festgelegt; Ladungen
werden so gewählt, dass 1. Faktor max. Varianz erklärt)
5. Berechnung der Faktorwerte: Gleichung nicht immer lösbar; Ergebnis: Faktorscores
ZZ1K
1R
PAZ
PAPA1K
1R
ACAAPP1K
1AR
AAR
UAAR
ZAP 1 PAZ
Beobachteter Wert ↔ Linearkombination mehrerer (errechneter) Faktoren
4
Vorarbeiten: Berechnung der Standardabweichung
Vitamingehalt Haltbarkeit Preis
(x-AM) (x-AM)2 (x-AM) (x-AM)2 (x-AM) (x-AM)2
-1,66667
2,77779 -2,500
006,25000 -
2,66667
7,11113
-0,66667
0,44445 -0,500
000,25000 -
0,66667
0,44445
0,33333
0,11111 0,50000 0,25000 0,33333 0,11111
2.33333
5,44443 -1,500
002,25000 -
1,66667
2,77779
-0,66667
0,44445 1,50000 2,25000 2,33333 5,44443
0,33333
0,11111 2,50000 6,25000 2,33333 5,44443
SAQ: 9,33334
SAQ: 17,50000
SAQ: 21,33334
SD: 1,36626
SD: 1,87083 SD: 2,06559
Anteil unges. Fettsäuren:
AM = 2,83333
(S. 193)
SD = 1,47196 (S. 199)
Kaloriengehalt: AM = 4,16667
(S. 193)
SD = 1,94079 (S. 199)
Vitamingehalt: AM = 3,66667
(S. 193)
SD = 1,36626 (Tabelle)
Haltbarkeit: AM = 3,50000
(S. 193)
SD = 1,87083 (Tabelle)
Preis: AM = 4,66667
(S. 193)
SD = 2,06559 (Tabelle)
5
z-standardisierte Ausgangswerte transponierte MatrixRama Sanell
aBecel Du
darfstHoll.
ButterWeihn
. Butter
AF Ka Vi Ha Pr
AF -1,2455
0
-0,5661
4
0,79260
1,47196
-0,5661
4
0,11323
-1,2455
0
-1,6316
4
-1,2198
8
-1,3363
1
-1,2910
0Ka -
1,63164
0,94463
0,42938
0,94463
-0,6011
3
-0,0858
8
-0,5661
4
0,94463
-0,4879
5
-0,2672
6
-0,3227
5Vi -
1,21988
-0,4879
5
0,24397
1,70782
-0,4879
5
0,24397
0,79260
0,42938
0,24397
0,26726
0,16137
Ha -1,3363
1
-0,2672
6
0,26726
-0,8017
8
0,80178
1,33631
1,47196
0,94463
1,70782
-0,8017
8
-0,8068
7Pr -
1,29100
-0,3227
5
0,16137
-0,8068
7
1,12962
1,12962
-0,5661
4
-0,6011
3
-0,4879
5
0,80178
1,12962
0,11323
-0,0858
8
0,24397
1,33631
1,12962
KorrelationsmatrixAF Ka Vi Ha Pr
AF (Anteil unges. Fetts.)
1,00000
0,71176
0,96134 0,10894
0,04385
Ka (Kaloriengehalt) 0,71176
1,00000
0,70397 0,13771
0,06652
Vi (Vitamingehalt) 0,96134
0,70397
1,00000
0,07825
0,02362
Ha (Haltbarkeit) 0,10894
0,13771
0,07825 1,00000
0,98334
Pr (Preis) 0,04385
0,06652
0,02362 0,98334
1,00000
Errechnung der Korrelationsmatrix aus z-Werten
ZZ1K
1R
yx
xyxy ss
sr
1nSAPsxy
Zur Erinnerung:
6
Konstellation (Demonstrationsbeispiel nach Bortz):
• Untersucht werden 6 „Objekte“ (Personen):– Karin, Heinz, Sonja, Kurt, Eva, Karl
• Die „Objekte“ haben Ausprägungen bei den „Merkmalen“ (Testergebnisse):– Bi: Bilderrätsel– Ma: Mathematikaufgabe– Pu: Puzzle– Re: Reproduktions (Gedächtnis-) Aufgabe– Kr: Kreuzworträtsel
• Es ergeben sich folgende korrelative Zusammenhänge (schematisch): F1: praktische Intelligenz F2: theoret. Intelligenz + F3 + F4 + F5
Bi Pu Re Ma Kr
• Vermutung:– Scheinkorrelation! Nur wenn diese Vermutung zutrifft, ist eine FA
sinnvoll!
7
Zur Grundgleichung der FA (Bortz-Beispiel)
• Bildung von 5 neuen orthogonalen Variablen (bei n = 5 „Merkmalen“)– F1 + F2 + F3 + F4 + F5– Schritt für Schritt nacheinander – rein rechnerisch!– Restriktion: jeweils maximale (Rest-)Varianzerklärung– bei n = 5 Faktoren: gesamte Ausgangsvarianz erklärt!
• Korrelation der neuen Variablen (Faktoren) mit den ursprünglichen Variablen– F1 F2 F3 F4 F5 ∙ Bi Ma Pu Re Kr – Ladungen: a
• Für die neuen Variablen (Faktoren) gilt: – Für jedes „Objekt“ wird eine Ausprägung auf jedem Faktor errechnet.– Faktorscore: p
• Beispiele zum Fundamentaltheorem der Faktorenanalyse (S. 207 / 208)– X(Bilderrätsel, Eva) = a(Bilderrätsel, F1) ∙ p(F1, Eva) + a(Bilderrätsel, F2) ∙ p(F2, Eva) + …
+ a(Bilderrätsel, F5) ∙ p(F5, Eva)
– X(Puzzle, Heinz) = a(Puzzle, F1) ∙ p(F1, Heinz) + a(Puzzle, F2) ∙ p(F2, Heinz) + … + a(Puzzle, F5) ∙ p(F5, Heinz)
Nutzen der „Umrechnung“?Abbruchmöglich
keit!
Beobachteter Wert ↔ Linearkombination mehrerer (errechneter) Faktoren
8
• Untersucht werden 6 „Objekte“:– Rama, Sanella, Becel, Du darfst, Holländische Butter, Weihnachtsbutter
• Die „Objekte“ haben Ausprägungen bei den „Merkmalen“ (Variablen):– AF: Anteil ungesättigter Fettsäuren– Ka: Kaloriengehalt– Vi: Vitamingehalt– Ha: Haltbarkeit– Pr: Preis
• Es ergeben sich folgende korrelative Zusammenhänge (schematisch):
F1: Gesundheit F2: Wirtschaftlichkeit + F3 + F4 + F5
AF Ka Vi Ha Pr
• Vermutung:– Scheinkorrelation! Nur wenn diese Vermutung zutrifft, ist eine FA
sinnvoll!
Konstellation (Backhaus u.a.):
9
Zur Grundgleichung der FA (Backhaus u.a.)
• Bildung von 5 neuen orthogonalen Variablen (bei n = 5 „Merkmalen“)– F1 + F2 + F3 + F4 + F5– Schritt für Schritt nacheinander – rein rechnerisch!– Restriktion: jeweils maximale (Rest-)Varianzerklärung– bei n = 5 Faktoren: gesamte Ausgangsvarianz erklärt!
• Korrelation der neuen Variablen (Faktoren) mit den ursprünglichen Variablen– F1 F2 F3 F4 F5 ∙ AF Ka Vi Ha Pr – Ladungen: a
• Für die neuen Variablen (Faktoren) gilt: – Für jedes „Objekt“ wird eine Ausprägung auf jedem Faktor errechnet.– Faktorscore: p
• Beispiele zum Fundamentaltheorem der Faktorenanalyse (S. 207 / 208)– X(Kalorien, Becel) = a(Kalorien, F1) ∙ p(F1, Becel) + a(Kalorien, F2) ∙ p(F2, Becel) + …
+ a(Kalorien, F5) ∙ p(F5, Becel)
– X(Preis, Du darfst) = a(Preis, F1) ∙ p(F1, Du darfst) + a(Preis, F2) ∙ p(F2, Du darfst) + … + a(Preis, F5) ∙ p(F5, Du darfst)
Nutzen der „Umrechnung“?Abbruchmöglich
keit!
10
Weitere Schritte der Faktorenanalyse I
• Kommunalitätenproblem– R = A ∙ A´ + U– Explizite Unterscheidung in gemeinsame Faktoren: A – spezifische
Faktoren: U– U beschreibt spezifische Varianz einer Variablen + Meßfehler– Der Teil der Gesamtvarianz einer Variablen, der durch die Faktoren erklärt
werden soll, muss festgelegt werden (Kommunalität)
• Schätzung der Kommunalitäten– Gesamte Varianz soll erklärt werden → Hauptkomponentenanalyse (PC)– Schätzung nach inhaltlichen Vorgaben → Hauptachsenanalyse (PAF)
Kriterium oft: r2max mit anderer Variablen; multiples Bestimmtheitsmaß
– Bestimmung durch Iterationsprozeß → Hauptachsenanalyse (PAF) keine Eingriffsmöglichkeit; Kriterium: Konvergenz der Iterationen; Startwert oft: Multiples Bestimmtheitsmaß
Items: keine Einzelrestvarianz!(spez. Varianz + Fehlervarianz)
SPSS
11
Weitere Schritte der Faktorenanalyse II
• Festlegung der Zahl der zu extrahierenden Faktoren– Kaiser-Kriterium– Scree-Test
• Meist (oblique/rechtwinklige) Rotation der Faktoren (Varimax)– „gleichwertige Lösungen“– Ziel meist: möglichst gute Annäherung an Einfachstruktur– Gelegentlich: schiefwinklige Rotation
eigentlich wäre jetzt neue FA nötig!
• Interpretation der Faktoren!– erster Schritt: Ladungen!
1 2 3 4 5 6 7 8 9 10 11 12 13
Faktornummer
0
1
2
3
4
5
6
Eige
nwer
t
Screeplot
12
Weitere Schritte der Faktorenanalyse III
• Bestimmung der Faktorwerte (Scores)– Z = A ∙ P (Grundgleichung der FA; Z ist bekannt; A wurde
bestimmt)
– Auflösung nach P: Z = A ∙ P │mult. von links mit inverser MatrixA-1 ∙ Z = A-1 ∙ A ∙ P │ A-1 ∙ A = E (Einheitsmatrix)A-1 ∙ Z = E ∙ P │ E ∙ P = P A-1 ∙ Z = P
– Problem:i.d.R. nicht quadratische Faktorenmuster A (Ziel: weniger Faktoren als Variablen!)→ Matrix-Inversion nicht möglich!
– Lösung:Schätzverfahren (s. S. 232)
13
Beispiel: SPSS-Kommando
FACTOR/VARIABLES fr10_1 fr10_2 fr10_3 fr10_4 fr10_5 fr10_6 fr10_7 fr10_8
fr10_9 fr10_10 fr10_11 z11.1 z11.3 /MISSING LISTWISE /ANALYSIS fr10_1 fr10_2 fr10_3 fr10_4 fr10_5 fr10_6 fr10_7 fr10_8
fr10_9 fr10_10 fr10_11 z11.1 z11.3
/PRINT UNIVARIATE CORRELATION EXTRACTION ROTATION /FORMAT SORT /PLOT EIGEN /CRITERIA MINEIGEN(1) ITERATE(25) /EXTRACTION PAF /CRITERIA ITERATE(25) /ROTATION VARIMAX /METHOD=CORRELATION .
14
Mittelwe
rt
Standardabweich
ungAnalyse
Nfr10_1 Institutionenvertrauen: Bundestag 4,85 2,397 1239fr10_2 Institutionenvertrauen:
Bundesverfassungsgericht 6,35 2,475 1239
fr10_3 Institutionenvertrauen: Verwaltung 4,80 2,286 1239fr10_4 Institutionenvertrauen:
Bundesregierung 4,31 2,529 1239
fr10_5 Institutionenvertrauen: Gerichte 5,92 2,371 1239fr10_6 Institutionenvertrauen: Parteien 3,77 2,202 1239fr10_7 Institutionenvertrauen: Polizei 6,40 2,240 1239fr10_8 Institutionenvertrauen: Bundeswehr 6,04 2,264 1239fr10_9 Institutionenvertrauen: katholische
Kirche 4,37 2,741 1239
fr10_10 Institutionenvertrauen: evangelische Kirche 4,82 2,483 1239
fr10_11 Institutionenvertrauen Gewerkschaften 4,26 2,327 1239
z11.1 Vertrauen - Kirchen 4,61 2,875 1239z11.3 Vertrauen -
Wirtschafts-/Arbeitgeberverbände 3,94 2,370 1239
Deskriptive Statistiken
15
1 2 3 4 5 6 7 8 9 10 11 12 13
Faktornummer
0
1
2
3
4
5
6
Eig
enw
ert
Screeplot
Screeplot
16
Faktor1 2 3
fr10_1 Institutionenvertrauen: Bundestag ,769 -,303 ,186fr10_3 Institutionenvertrauen: Verwaltung ,752 -,125 ,015fr10_5 Institutionenvertrauen: Gerichte ,738 -,162 -,221fr10_2 Institutionenvertrauen:
Bundesverfassungsgericht ,709 -,214 -,178fr10_6 Institutionenvertrauen: Parteien ,705 -,204 ,277fr10_7 Institutionenvertrauen: Polizei ,703 ,007 -,536fr10_4 Institutionenvertrauen:
Bundesregierung ,688 -,342 ,360fr10_10 Institutionenvertrauen: evangelische
Kirche ,647 ,501 ,113fr10_9 Institutionenvertrauen: katholische
Kirche ,624 ,593 ,142fr10_8 Institutionenvertrauen: Bundeswehr ,584 ,044 -,401z11.1 Vertrauen - Kirchen ,498 ,496 ,115fr10_11 Institutionenvertrauen:
Gewerkschaften ,469 -,083 ,171z11.3 Vertrauen -
Wirtschafts-/Arbeitgeberverbände ,372 ,119 ,010
Faktormatrix (unrotiert!)
Extraktionsmethode: Hauptachsen-Faktorenanalyse.3 Faktoren extrahiert. Es werden 12 Iterationen benötigt.
17
Extraktionfr10_1 Institutionenvertrauen: Bundestag ,717fr10_2 Institutionenvertrauen: Bundesverfassungsgericht ,581fr10_3 Institutionenvertrauen: Verwaltung ,581fr10_4 Institutionenvertrauen: Bundesregierung ,719fr10_5 Institutionenvertrauen: Gerichte ,619fr10_6 Institutionenvertrauen: Parteien ,616fr10_7 Institutionenvertrauen: Polizei ,781fr10_8 Institutionenvertrauen: Bundeswehr ,504fr10_9 Institutionenvertrauen: katholische Kirche ,761fr10_10 Institutionenvertrauen: evangelische Kirche ,683fr10_11 Institutionenvertrauen: Gewerkschaften ,256z11.1 Vertrauen - Kirchen ,508z11.3 Vertrauen - Wirtschafts-/Arbeitgeberverbände ,153
Kommunalitäten
Extraktionsmethode: Hauptachsen-Faktorenanalyse.
18
Faktor
Summen von quadrierten Faktorladungen für Extraktion
Rotierte Summe der quadrierten Ladungen
Gesamt% der Varianz
Kumulierte % Gesamt
% der Varianz
Kumulierte %
1 5,424 41,726 41,726 2,973 22,871 22,871
2 1,210 9,305 51,031 2,311 17,777 40,648
3 ,845 6,501 57,532 2,195 16,884 57,532
Erklärte Gesamtvarianz – unrotiert / rotiert
Extraktionsmethode: Hauptachsen-Faktorenanalyse.
Eigenwerte
19
Faktor1 2 3
fr10_4 Institutionenvertrauen: Bundesregierung ,828 ,132 ,127
fr10_1 Institutionenvertrauen: Bundestag ,769 ,315 ,161fr10_6 Institutionenvertrauen: Parteien ,723 ,194 ,234fr10_3 Institutionenvertrauen: Verwaltung ,574 ,426 ,265fr10_11 Institutionenvertrauen:
Gewerkschaften ,447 ,134 ,197fr10_7 Institutionenvertrauen: Polizei ,180 ,835 ,228fr10_8 Institutionenvertrauen: Bundeswehr ,153 ,653 ,232fr10_5 Institutionenvertrauen: Gerichte ,459 ,615 ,173fr10_2 Institutionenvertrauen:
Bundesverfassungsgericht ,490 ,570 ,126fr10_9 Institutionenvertrauen: katholische
Kirche ,179 ,172 ,837fr10_10 Institutionenvertrauen: evangelische
Kirche ,228 ,218 ,764z11.1 Vertrauen - Kirchen ,131 ,133 ,688z11.3 Vertrauen -
Wirtschafts-/Arbeitgeberverbände ,190 ,189 ,284Extraktionsmethode: Hauptachsen-Faktorenanalyse. Rotationsmethode: Varimax mit Kaiser-Normalisierung.a Die Rotation ist in 5 Iterationen konvergiert.
Rotierte Faktorenmatrix
20
Zusammenfassung der Ergebnisse
Ladung (unrotierte Lösung)
Kommu-
Ladung (rotierte Lösung)
Kommu-
1 2 3 nalität 1 2 3 nalitätfr10_4 ,688 -,342 ,360 ,719 ,828 ,132 ,127 ,719fr10_1 ,769 -,303 ,186 ,717 ,769 ,315 ,161 ,717fr10_6 ,705 -,204 ,277 ,616 ,723 ,194 ,234 ,616fr10_3 ,752 -,125 ,015 ,581 ,574 ,426 ,265 ,581
fr10_11 ,469 -,083 ,171 ,256 ,447 ,134 ,197 ,256fr10_7 ,703 ,007 -,536 ,781 ,180 ,835 ,228 ,781fr10_8 ,584 ,044 -,401 ,504 ,153 ,653 ,232 ,504fr10_5 ,738 -,162 -,221 ,619 ,459 ,615 ,173 ,619fr10_2 ,709 -,214 -,178 ,581 ,490 ,570 ,126 ,581fr10_9 ,624 ,593 ,142 ,761 ,179 ,172 ,837 ,761
fr10_10 ,647 ,501 ,113 ,683 ,228 ,218 ,764 ,683z11.1 ,498 ,496 ,115 ,508 ,131 ,133 ,688 ,508z11.3 ,372 ,119 ,010 ,153 ,190 ,189 ,284 ,153
Σ Ladung2 5.424
1.210 0.845 Σ 7.479
2.973 2.311 2.195
Σ 7.479
%erkl. Var.
41.726
9.305 6.501 Σ 57.532
22.871
17.777
16.884
Σ 57.532
erklärte Varianz insgesamt: 57.532%
erkl. Varianz = Eigenwerte : 13
Eigenwerte
21
SPSS-Ergebnis für: PC, NFACTORS = 13
Kommunalitäten
1,0001,0001,0001,0001,0001,0001,0001,0001,0001,0001,0001,0001,000
fr10_1 Inst.vertrauen: Bundestagfr10_2 Inst.vertrauen: Bundesverfassungsgerichtfr10_3 Inst.vertrauen: Verwaltungfr10_4 Inst.vertrauen: Bundesregierungfr10_5 Inst.vertrauen: Gerichtefr10_6 Inst.vertrauen: Parteienfr10_7 Inst.vertrauen: Polizeifr10_8 Inst.vertrauen: Bundeswehrfr10_9 Inst.vertrauen: katholische Kirchefr10_10 Inst.vertrauen: evangelische Kirchefr10_11 Inst.vertrauen: Gewerkschaftenz11.1 Vertrauen - Kirchenz11.3 Vertrauen - Wirtschafts-/Arbeitgeberverb.
Extraktion
Extraktionsmethode: Hauptkomponentenanalyse.
Erklärte Gesamtvarianz
5,806 44,664 44,6641,567 12,052 56,7171,210 9,307 66,024,915 7,041 73,065,724 5,566 78,631,609 4,683 83,314,431 3,318 86,632,377 2,897 89,530,360 2,773 92,302,302 2,323 94,625,257 1,976 96,601,241 1,850 98,451,201 1,549 100,000
Kompo-nente12345678910111213
Gesamt % der Varianz Kumulierte %
Summen von quadrierten Faktorladungenfür Extraktion
Extraktionsmethode: Hauptkomponentenanalyse.
!
22
Vielen Dank für IhreAufmerksamkeit!
Top Related