Multivariate Analysemethoden, Dozent: Dr. Thomas … · 2012-05-30 · Grundlagen...
Transcript of Multivariate Analysemethoden, Dozent: Dr. Thomas … · 2012-05-30 · Grundlagen...
Multivariate Analysemethoden,
Dozent: Dr. Thomas Schäfer
29.05.2012Alexander Allnoch, Markus Burkhardt & Vivien Röder
1. Einführung
2. Grundlagen – Faktorenanalyse
3. Nutzungsdimensionen von Musik - unsere
Untersuchung
4. Explorative Faktorenanalyse mit SPSS am Beispiel
unserer Musik-Erhebung
5. Konfirmatorische Faktorenanalyse
Faktorenanalyse…
� Was wisst ihr schon?
(aus Vorlesungen, Bachelorarbeit, eigenem
Literaturstudium aus intrinsischem
Interesse heraus…)
Ziele der Faktorenanalyse:
- datenreduzierendes Verfahren
-> viele Variablen zu wenigen hypothetischen
Faktoren zusammenfassen
- Prüfung von Theorien
- Testentwicklung
-> Ursprung: Spearman: Intelligenzstrukturtheorien
1. Einführung
2. Grundlagen – Faktorenanalyse
3. Nutzungsdimensionen von Musik - unsere
Untersuchung
4. Explorative Faktorenanalyse mit SPSS am Beispiel
unserer Musik-Erhebung
5. Konfirmatorische Faktorenanalyse
1. Einführung
2. Grundlagen 2. Grundlagen 2. Grundlagen 2. Grundlagen –––– FaktorenanalyseFaktorenanalyseFaktorenanalyseFaktorenanalyse
a) Korrelationsmatrix
b) Hauptachsenbestimmung
c) Faktorenextraktion
d) Rotation
e) Ergebnisinterpretation
3. …
� Variable (oder Item) besteht aus:
� 1… spezifischem Anteil
� 2… Teil, den sie mit anderen Variablen gemeinsam hat
� 3… Messfehler / unerklärten Teil
Ich höre Musik, … weil sie Trost spendet
Messfehler
„Trost“- Teil (spezifisch)
Emotionaler – Teil (gemeinsam)
unerklärter
Teil
gemein-
samer Teil
spezifischer
Teil
M1
Interessant ist der (Varianz-) Anteil, den verschiedene Variablen gemeinsam haben...
... denn der geht auf einen gemeinsamen, „dahinter-liegenden“ Faktor zurück
Ich höre Musik, Ich höre Musik,
…weil sie Trost spendet … weil sie mir Mut macht
unerklärter
Teil
gemein-
samer Teil
spezifischer
Teil
unerklärter
Teil
gemeinsamer
Teil
Mut
Bei einer großen gemeinsamen Anteil korrelieren beide Variablen (Items)______ miteinander.
Ich höre Musik, Ich höre Musik,
…weil sie Trost spendet … weil sie mir Mut macht
unerklärter
Teil
gemein-
samer Teil
spezifischer
Teil
unerklärter
Teil
gemeinsamer
Teil
Mut
Merke:
Die Grundlage für eine FA bildet die (empirische) Produkt - Moment – Korrelationsmatrix
…denn hier werden die linearen Zusammenhänge (also der gemeinsame Anteil der Variablen) sichtbar
� Im Folgenden Bsp. mit 3 Variablen da dies noch darstellbar.
FA i.d.R. mit sehr viel mehr Variablen!
� Korrelation aller 3 Variablen als Streudiagramm in einem 3-Dimensionalen Koordinatensystem.
� Beschreibung der 3D- Punktewolke mittels Hauptachsen (≙ Faktoren)
� 3 Geraden entsprechen mathematisch 3 mathematisch 3 mathematisch 3 mathematisch 3 Vektoren,Vektoren,Vektoren,Vektoren, die senkrecht aufeinander stehen
in diesen Vektoren muss natürlich auch die Korrelation „drin stecken“
Kor (x;y) = cos ∢ xy
Ziel der FA ist es Informationen zu reduzieren.
Es müssen also einige wenige Faktoren ausgewählt werden (genaueres später).
- Verschiedene Analyseformen- Verschiedene Entscheidungskriterien
z.B. - Screeplot- Kaiserkriterium
Die Anzahl der Faktoren bestimmt letztlich der Forscher!
- Statistik als Entscheidungs- und Begründungshilfe
Merke:
Je weniger Faktoren umso geringer die erklärte Varianz aller Variablen
„Wie die Erfahrung gezeigt hat, wird ein kreativer Sozialwissenschaftler für fast jede Faktorenstruktur eine scheinbar plausible Erklärung finden.“ (Diehl & Kohr, 1994 S.373)
Statistik-Programme „suchen“ selbst die günstigste Faktorenstruktur
Drehung des n-dimensionalen-Koordinatensystems zur Optimierung.
PS: in der Prä-SPSS-Ära haben die Psychologen dafür wochenlang gerechnet!
Merke:
Rotation dient dazu, dass eine Variable möglichst hoch mit einem Faktor korreliert (und nicht gleichmäßig mit allen Faktoren)
� Einfachstruktur
Verschiedene Verfahren:
- rechtwinklige Rotation -> häufigstes Verfahren
(Faktoren sind unkorreliert) „VARIMAX“
- schiefwinklige Rotation
(Faktoren sind korreliert)
-> schwer zu interpretieren „Oblimin-Rotation“
Merke:
Faktorladung: Korrelation einer Variable v mit dem Faktor f
Die Berechnung der Faktorladungen macht das Statistik-Programm, da sehr komplex…
Faktorladung ² ergibt das Bestimmtheitsmaß…
Wie lässt sich das interpretieren?
.019² = .0004 .608²= .39
.019² + .608²= .3904
->39,04% der Varianz im Item „gefühlewiederfinden“ können mit den 2 Faktoren erklärt werden = Kommunalität des Items
² ²
Merke:
Kommunalität
Ist der Anteil der Varianz EINER Variable der durch ALLE Faktoren erklärt werden kann
… uns interessiert aber auch die Güte der Faktoren
.019² + .043² + … + .522² + .593² = 1,500
= Eigenwert des Faktors 1
Problem: Je mehr Items, umso größer der Eigenwert
- daher : Erklärungskraft das Faktors an Gesamtvarianz
= Eigenwert ∑ (max. Faktorladungen²)
= EigenwertAnzahl der Variablen
Merke:
Die Bedeutsamkeit eines Faktors ergibt sich aus dem Anteil des Eigenwertes an der Gesamtvarianz (Erklärbare Varianz).
-> Aussage zur Güte und Bedeutung des Faktors
Merke:
Die Varianzaufklärung der Faktorenanalyse ist
= SUMME (Eigenwerte/ Anzahl der Items)
= SUMME (Kommunalitäten / Anzahl der Items)
Selten angegeben
Faktorwert: Ausprägung eine Person (i) auf dem Faktor (f).
(Im Gegensatz zum Summenscore gewichtet)
1. Einführung
2. Grundlagen – Faktorenanalyse
3. Nutzungsdimensionen von Musik - unsere
Untersuchung
4. Explorative Faktorenanalyse mit SPSS am Beispiel
unserer Musik-Erhebung
5. Konfirmatorische Faktorenanalyse
� Warum hören Menschen Musik?
Das Warum ist auch eine Frage nach den Funktionen von Musik
- viele theoretische Arbeiten - wenig empirische Arbeiten
� Funktionen von Musik (z.B. Schäfer & Sedlmeier, 2009; Behne, 2009)
� Wieso ist bietet sich hier eine Faktorenanalyse an?
Itempool aus 139 Items von Schäfer und Städtlerbereitgestellt
23 augenscheinvalide Items der Faktoren
zum Thema - Aktivation / Beruhigung
- Gefühlsregulation
Fragen im Format:
Ich höre Musik, … weil sie mich beruhigt.
… weil ich mich dann fitter fühle.
Wie sehr würden Sie dieser Aussage zustimmen?
0 überhaupt nicht--- bis --- 6 voll und ganz
(+ Demografische Variablen)
N = 68
Alter M=23.46 (SD= 7.04, Range: 13-48)
Geschlecht w= 61.8% m= 38.2%
2 Erhebungen; a) Psychologie Studenten
b) Diskothek
1. Einführung
2. Grundlagen – Faktorenanalyse
3. Nutzungsdimensionen von Musik - unsere
Untersuchung
4. Explorative Faktorenanalyse mit SPSS am Beispiel
unserer Musik-Erhebung
5. Konfirmatorische Faktorenanalyse
� Exploratorische Exploratorische Exploratorische Exploratorische FAFAFAFAFaktoren auf Grundlage empirischer Daten herausfinden (‚probieren‘)� hypothesen-/ modellgenerierend� SPSS
� KonfirmatorischeKonfirmatorischeKonfirmatorischeKonfirmatorische FAFAFAFAgründliche theoretische Überlegungen �Überprüfung einer Faktorstruktur (SGM)� hypothesen-/ modelltestend� AMOS
a) lineare Zusammenhänge zwischenItems
b) intervallskalierte Daten
c) Stichprobengröße ausreichend groß
d) Hinreichend gute Werte in KMO, Bartlett & MSA
a) lineare Zusammenhänge zwischen Items
einzelne Streudiagramme oderStreudiagrammmatrix- beides hat Vor- & Nachteile…
d) Hinreichend gute Werte bei KMO, Bartlett, MSA
KMO nicht unter 0.5 (Werte zw. 0 & 1 mgl)
MSA (Measure of sampling adequacy) ≈ KMO
BartlettH0:Korrelationsmatrix R = Einheitsmatrix Emit Nullkorrelation � wollen wir nicht! Test sollte signifikant werden!
d) Hinreichend gute Werte bei KMO, Bartlett, MSA
Unsere SP:
� KMO .725
� Bartlett: p<.001
� MSA zw. .502 & .861
KMO bzw. MSA …> .9……sehr gut> .8……gut> .7……mittel> .6……mäßig> .5……schlecht< .5……von FA wird abgeraten
(Bühner, 2004; S. 170)
a) Korrelationsmatrix erstellen
b) Faktoren extrahieren
c) Kommunalitäten bestimmen
d) Faktorenanzahl bestimmen
e) Faktoren interpretieren
f) Faktorwerte bestimmen
Bühner, 2004; Zöfel, 2003
� Idee: hoch miteinander korrelierende Variablen
entstammen einem übergeordneten Faktor
� sofern keine hohen Korrelationen � FA nicht
sinnvoll
� Schauen, ob Zusammenhänge linear sind
(Voraussetzungsprüfung)
� Extraktionsmethoden:
◦ Hauptachsenanalyse (PFA)
◦ Maximum-Likelihood-Analyse (ML)
◦ Hauptkomponentenanalyse (PCA)
(nur Datenreduktion & Beschreibung der Items)
Bühner, 2004; Zöfel, 2003
Faktorenanalytische Methoden (wollen Zusammenhänge zw. Items ursächlich erklären)
� In der Praxis nicht so bedeutsam (spuckt SPSS
automatisch mit aus)
� Wichtig, ob Hauptachsenanalyse (PFA) oder
Hauptkomponentenanalyse (PCA)
PFA: gibt einen Fehler � hj² < 1
PCA: kein Fehler � hj² = max. 1
Bühner, 2004; Zöfel, 2003
� Eigenwerte � Kriterium für Anzahl der zu
extrahierenden Faktoren
� Zur Beantwortung der Frage „Wie viele Faktoren“
existieren verschiedene Verfahren:
◦ Kaiser Kriterium
◦ Scree Plot
◦ Parallelanalyse
Bühner, 2004; Zöfel, 2003
Kaiser Kriterium
◦ Extrahiert werden alle Faktoren mit einem
Eigenwert > 1
?? Warum ??
� erklärt mehr Varianz als eine einzelne Variable
◦ Problem: häufig Überschätzung der
Faktorenanzahl
Scree Plot = Geröllplot
◦ Faktoren nach Größe der Eigenwerte geordnet �
asymptodische Annäherung an x-Achse
◦ Steiles Stück:
wichtige Faktoren
Parallelanalyse
◦ Um Problem zu lösen, dass Eigenwerte > 1 per Zufall
entstehen können
◦ Generierung von Zufallsdaten � Faktoren extrahieren
◦ Faktoren aus Originaldaten mit größeren Eigenwerten
als bei Zufallsdaten werden extrahiert
� Inhaltliche Begründung der Zusammenfassung
einzelner Items
� Faktoreninterpretation liegt beim Forscher
Bsp. Funktionen von Musik � F1: entspannen/
Aktivation, F2: Gefühle verarbeiten …
Bühner, 2004; Zöfel, 2003
� Kann standardisierte Werte der Personen auf den
einzelnen Faktoren berechnen
bei Hauptachsenanalyse � Schätzverfahren
� In SPSS: erhalte neue Variablen
Bühner, 2004; Zöfel, 2003
� Blinder Empirismus – theoretische
Überlegungen??
� Ähnlichkeit der Itemantworten durch SP
mitbestimmt � ☺ FA mit Daten verschiedener
SP � Ergebnisvergleich
1. Einführung
2. Grundlagen – Faktorenanalyse
3. Nutzungsdimensionen von Musik - unsere
Untersuchung
4. Explorative Faktorenanalyse mit SPSS am Beispiel
unserer Musik-Erhebung
5. Konfirmatorische Faktorenanalyse
� Theoretische Annahmen bezüglich ◦ Anzahl & Bedeutung der Faktoren◦ Zuordnung der Items zu Faktoren◦ Beziehung zw. den Faktoren
� ?? Wenn ich alles schon weiß – wieso mache ich dann überhaupt noch eine FA ??
� modell-/ hypothesentestendEmpirie = theoretische Annahmen?Welches Modell hat den besseren Fit
� Mit SPSS nicht möglich◦ ?? Aber ich kann doch die Anzahl an zu
extrahierenden Faktoren bestimmen ??◦ Ja, aber nicht die Zuordnung der Variablen zu den
Faktoren & auch nicht die Beziehung der Faktoren untereinander
� ??Per Hand rechnen??◦ Nein – bspw. mit AMOS
� So sieht das dann aus:
� ?? Woran erinnert euch das??
� SGMSGMSGMSGM � nächste Woche
Item 7
Faktor 1
Item 1 Item 3Item 2 Item 6 Item 4 Item 5
Faktor 2
e1 e2 e3 e4 e5 e7e6
EFAEFAEFAEFA CFACFACFACFA
Datenreduktion Ziel Datenreduktion
Hypothesengenerierend Zweck Hypothesenprüfend
Basierend auf Daten Zuordnung Item-Faktor Theoriegeleitet
Basierend auf Daten Faktorenanzahl Theoriegeleitet
Je nach Rotation (orthogonal, oblique)
Korrelation der Faktoren
Theoriegeleitet
Post hoc Faktoreninterpretation Theoriegeleitet a-priori
Habe nur das eine gefundene Modell
Vergleich verschiedener Modelle
Mittels Gütemaßen (X²,CFI, RMSEA …)
� Ziel FA: Datenreduktion � mit möglichst wenig
Dimensionen möglichst viel Varianz erklären können
� EFA zur Hypothesengenerierung, CFA zur -
überprüfung
� Grundlage: Korrelationsmatrix zw. den Variablen
� Subjektiver Anteile des Verfahrens (u.a. bei
Interpretation des Verfahrens)
Backhaus, K., Erichson, B., Plinke, W. & Weiber, R. (2006). Multivariate Analysmethoden. Berlin: Springer. Kap. 5
Behne, K., E. (2009). Musikerleben im Jugendalter. Köthen: Conbrio.
Bühner, M. (2004). Einführung in die Test- und Fragbogenkonstruktion. München: Pearson. Kap. 5 & 6
Diehl, J., M., & Kohr, H., U. (1994). Deskriptive Statistik. Eschborn: Klotz.
Leonhart, R. (2009). Lehrbuch Statistik. Bern: Horgefe.
Schäfer, T., & Sedlmeier, P. (2009). From the functions of music to music preference. Psychology Of Music, 37(3), 279-300. doi:10.1177/0305735608097247
Zöfel, P. (2003). Statistik für Psychologen im Klartext. München: Pearson Studium. Kap. 13