ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA...
Transcript of ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA...
![Page 1: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/1.jpg)
ANALIZA CZYNNIKOWA
... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych uwarunkowań, ktore wyjaśniają ich występowanie.
Pozwala na sprowadzenie dużej liczby badanych zmiennych do znacznie
mniejszej liczby wzajemnie niezależnych (nieskorelowanych) czynników.
Wyodrębnione czynniki mają inną interpretację merytoryczną jednocześnie
zachowując znaczną część informacji zawartych w zmiennych pierwotnych.
![Page 2: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/2.jpg)
ANALIZA CZYNNIKOWA
Przykład 1.
Ocena nowej czekolady za pomocą zestawu 20 pytań, w których
badani oceniali wiele jej różnych cech (smak, zapach, konsystencja,
kolor, kształt, opakowanie itp.)
Wykorzystując analizę czynnikową można sprawdzić, czy możliwe
jest wyodrębnienie kilku ogólnych, ukrytych czynników,
warunkujących stosunek respondentów do nowego produktu (np.
wymiary "łącznej oceny smaku i zapachu" czy wyglądu).
![Page 3: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/3.jpg)
ANALIZA CZYNNIKOWA
Przykład 2.
kwestionariusz dotyczący satysfakcji klientów danej firmy
zwykle zawiera wiele pytań dotyczących różnych aspektów działania
firmy – analizowanie każdego pytania osobno pozwala uzyskać wiele
szczegółowych informacji
Zastosowanie analizy czynnikowej pozwala zaś na uzyskanie
ogólnego, syntetycznego obrazu powodów wpływających na
satysfakcję klientów / identyfikujących generalne nastawienie
klientów.
![Page 4: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/4.jpg)
CELE ANALIZY CZYNNIKOWEJ
Redukcja liczby zmiennych bez istotnej straty zawartych w nich informacji Transformacja układu zmiennych w jakościowo nowy układ
czynników głównych Tworzenie skal i miar złożonych z kilku pytań Ustalanie wag określających znaczenie, jakie należy przypisać
poszczególnym zmiennym i czynnikom w trakcie analiz Ortogonalizacja przestrzeni, w której rozpatrywane są obiekty,
będące przedmiotem badań
![Page 5: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/5.jpg)
CELE ANALIZY CZYNNIKOWEJ
Wykrywanie ukrytych związków między zmiennymi – formułowanie i weryfikacja hipotez dotyczących istnienia i charakteru prawidłowości kształtujących związki między zjawiskami Opis zjawisk w kontekście nowych kategorii zdefiniowanych przez
czynniki Prezentacja graficzna zbioru obserwacji wielowymiarowych
![Page 6: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/6.jpg)
CELE ANALIZY CZYNNIKOWEJ
Kiedy stosować? cel eksploracyjny – rozpoznanie struktury zbioru danych
gdy nie dysponujemy potencjalnym modelem „głębokiej” struktury
czynników wyjaśniających związki między danymi
dla zastosowania wykrytych czynników w dalszych analizach
wielowymiarowych
dla jednoznacznego wyliczenia wartości skal reprezentujących
wymiary mierzone przez zestaw zmiennych
![Page 7: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/7.jpg)
OGÓLNY PODZIAŁ METOD ANALIZY CZYNNIKOWEJ
A. Model "klasyczny" analizy czynnikowej (podział wariancji całkowitej zmiennych na dwie części: wariancję wspólną i wariancję specyficzną) klasyczna analiza czynnikowa analiza kanoniczna
B. Model "komponentowy" analizy czynnikowej (nieuwzględnianie
struktury wariancji) metoda głównych składowych analiza współzależności
![Page 8: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/8.jpg)
PROCEDURA ANALIZY CZYNNIKOWEJ
Kroki:
1. wyodrębnienie czynników
2. rotacja czynników w celu łatwiejszej interpretacji
Analiza czynnikowa to metoda modelowania liniowego
Wymaga danych mierzonych na skali interwałowej, ale mogą być
też skale Likerta (min. 5-cio punktowe)
Bazuje na korelacji i kowariancji między zmiennymi.
![Page 9: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/9.jpg)
PROCEDURA ANALIZY CZYNNIKOWEJ
Przedmiot analizy: macierz danych, zawierająca n realizacji m zmiennych:
W wyniku standaryzacji wartości zmiennych uzyskujemy zmienne o wartości oczekiwanej równej zero i jednostkowym odchyleniu standardowym:
[ ]nimj
xxX ijij ,...,2,1,...,2,1
,0,==
≥=
Z=[ zij ]
![Page 10: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/10.jpg)
PROCEDURA ANALIZY CZYNNIKOWEJ
Zakładamy, że pomiędzy zmiennymi Xj zachodzą związki, których siłę i kierunek określają współczynniki korelacji liniowej Pearsona zawarte w macierzy korelacji:
[ ] ( )mjpzzn
ZZn
rR ij
n
iipij ...1,1'1
1==== ∑
=
![Page 11: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/11.jpg)
PROCEDURA ANALIZY CZYNNIKOWEJ
W analizie czynnikowej przyjmuje się, że źródłem wzajemnych zależności między zmiennymi są ukryte wspólne czynniki, które można uznać za nośniki tej samej informacji.
Możliwe jest zatem ich wyodrębnienie i zastąpienie nowymi,
syntetycznymi zmiennymi.
Ale zakładamy też, że nie cała wariancja zmiennych jest
powodowana tymi ukrytymi czynnikami – każda zmienna pierwotna
charakteryzuje się też pewnymi specyficznymi właściwościami.
![Page 12: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/12.jpg)
PROCEDURA ANALIZY CZYNNIKOWEJ
Podstawą identyfikacji składników wspólnych i specyficznych jest w analizie czynnikowej podział wariancji poszczególnych zmiennych na wariancję wspólną i specyficzną:
h j2 - zasób zmienności wspólnej - część wariancji objaśniona
przez czynniki wspólne
- zasób zmienności swoistej - pozostałość po odjęciu zasobu zmienności wspólnej od wariancji całkowitejw j
2
![Page 13: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/13.jpg)
PROCEDURA ANALIZY CZYNNIKOWEJ
Dalsze założenia:
- czynniki wspólne nie są skorelowane ze sobą
- czynniki specyficzne również nie są ze sobą skorelowane
- czynniki wspólne nie są skorelowane z czynnikami
specyficznymi
- czynniki wspólne są zestandaryzowane,
E(Fj)=0 i Var(Fj)=1
![Page 14: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/14.jpg)
PROCEDURA ANALIZY CZYNNIKOWEJ
Model analizy czynnikowej można zapisać w postaciw postaci układu równań liniowych:
Z = AF + BUgdzie:
Z - macierz j standaryzowanych zmiennych pierwotnych
A - macierz ładunków czynnikowych czynników wspólnych
F - macierz czynników wspólnych
B - macierz ładunków czynnikowych czynników specyficznych
U - macierz czynników specyficznych
![Page 15: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/15.jpg)
PROCEDURA ANALIZY CZYNNIKOWEJ
Zatem każda z obserwowalnych zmiennych Z jest funkcją liniową zmiennych nieobserwowalnych (czynników wspólnych) oraz pojedynczej zmiennej specyficznej:
Z j=∑l=1
k
a jl F lb jU j
gdzie:m - liczba zmiennych pierwotnychk - liczba czynników głównych (wspólnych)Zj - j-ta zmienna standaryzowana (pierwotna)Fl - l-ty czynnik wspólnyUj - j-ty czynnik swoistyajl – ładunek czynnikowy l-tego czynnika Fl w j-tej zmiennej obserwowalnej
![Page 16: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/16.jpg)
PROCEDURA ANALIZY CZYNNIKOWEJ
W celu wyznaczenia współczynników modelu – ładunków czynnikowych – w kolejnym kroku zastępuje się w macierzy R elementy głównej przekątnej zasobami zmienności wspólnej (usuwamy z równania składnik reprezentujący wariancję specyficzną)
~ ~~Rr r dla i jr h dla i j
ij ij
ij j=
= ≠= =
2
i otrzymujemy tzw. zredukowaną macierz korelacji R
![Page 17: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/17.jpg)
PROCEDURA ANALIZY CZYNNIKOWEJ
hj2 ustala się na poziomie:
średniej arytmetycznej najwyższego co do modułu współczynnika korelacji j-tej zmiennej
z pozostałymi hj2 = max [|rij |], i <> j
korelacji przeciętnej hj2 = 1
1 1mrij
i
k
− =∑
![Page 18: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/18.jpg)
PROCEDURA ANALIZY CZYNNIKOWEJ
Zatem podstawowe zadanie analizy czynnikowej sprowadza się do rozwiązania równania:
ze względu na macierz A, czyli wyznaczenia ładunków czynnikowych składników wspólnych.
TAAR =~
![Page 19: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/19.jpg)
PROCEDURA ANALIZY CZYNNIKOWEJ
Uporządkowane malejąco wartości własne macierzy ~R
oraz odpowiadające im wektory własne V:
posłużą do wyznaczenia ładunków czynnikowych l-tego czynnika w zmiennych pierwotnych:
∑=
= m
jjl
jljl
v
va
1
2/121
][λ
][ jll vV = )...1( mj =
1...m)(l ][ == lλλ
![Page 20: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/20.jpg)
PROCEDURA ANALIZY CZYNNIKOWEJ
Kolejne wartości i wektory własne posłużą do uzyskania ładunków czynnikowych kolejnych czynników.
Ładunki te odzwierciedlają korelację pomiędzy j-tą zmienną
pierwotną i l-tym wspólnym czynnikiem.
Znalezienie tego rozwiązania kończy właściwą analizę czynnikową.
![Page 21: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/21.jpg)
ROTACJA CZYNNIKÓW
Uzyskana macierz ładunków czynnikowych A nie jest jednym możliwym rozwiązaniem analizy czynnikowej.
Poprzez obrót układu wzajemnie ortogonalnych osi - czynników
głównych - można wygenerować nieskończenie wiele różnych
macierzy ładunków.
Dokonanie takiej rotacji pozwala często na takie ustalenie osi, aby
odpowiadająca mu macierz ładunków zapewniła możliwie
najłatwiejszą interpretację czynników.
![Page 22: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/22.jpg)
ROTACJA CZYNNIKÓW
Rotacja polega na znalezieniu ortogonalnej macierzy S (macierzy transformacji) spełniającej warunek:
A1
T = S A0
T
gdzie:
A0 ,A1 - to wyjściowa i końcowa macierz ładunków,
![Page 23: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/23.jpg)
ROTACJA CZYNNIKÓW
Elementy macierzy transformacji S określają kąty, o jakie należy obrócić układ osi - czynników wspólnych tak, aby:
- zmaksymalizować liczbę ładunków zerowych w każdej kolumnie
macierzy czynników
- zmaksymalizować korelacje między jak najmniejszą liczbą
zmiennych, a każdym wyodrębnionym czynnikiem głównym
![Page 24: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/24.jpg)
ROTACJA CZYNNIKÓW
Innymi słowy - rotacja polega na sprowadzeniu struktury ładunków czynnikowych do prostej struktury, w której punkty reprezentujące zmienne skupiają się wokół osi czynników.
Istotne jest, że wskutek rotacji zasoby zmienności wspólnej hj2
określające udział wszystkich czynników wspólnych w wyjaśnianiu
wariancji zmiennej Xj nie ulegają zmianie.
![Page 25: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/25.jpg)
ROTACJA CZYNNIKÓW
Najczęściej stosuje się procedury rotacji ortogonalnej, z których najbardziej znanymi są varimax i quartimax.
VARIMAX upraszcza interpretację czynników (minimalizuje liczbę
zmiennych potrzebnych do wyjaśnienia danego czynnika)
QUARTIMAX upraszcza interpretację zmiennych (minimalizuje liczbę
czynników potrzebnych do wyjaśnienia danej zmiennej).
![Page 26: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/26.jpg)
WYZNACZENIE WARTOŚCI CZYNNIKÓW
Na koniec najczęściej potrzebny jest sposób wyznaczenia wartości poszczególnych czynników dla kolejnych obserwacji. Obliczanie realizacji czynników wspólnych odbywa się w oparciu o formułę:
F = AT Z
![Page 27: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/27.jpg)
ILE CZYNNIKÓW?
Problemem w stosowaniu analizy czynnikowej jest określenie liczby czynników głównych
Najczęściej spotykane techniki określania liczby czynników
wspólnych to:
a/ metoda "wartości własnej (lambda) większej od jedności"b/ metoda procentu wariancji tłumaczonej przez czynniki głównec/ metoda testu osypiska
![Page 28: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/28.jpg)
ILE CZYNNIKÓW?
a/ metoda "wartości własnej (lambda) większej od jedności"
najczęściej spotykana – jej podstawą jest to, że każdy czynnik
powinien wyjaśniać zmienność co najmniej jednej zmiennej
pierwotnej. Metoda ta powinna być stosowana gdy ilość zmiennych
jest większa od 20. Gdy liczba zmiennych jest mniejsza istnieje
tendencja wyodrębniania zbyt małej ilości czynników.
![Page 29: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/29.jpg)
ILE CZYNNIKÓW?
b/ metoda procentu wariancji tłumaczonej przez czynniki główne
do ogólnej liczby wybranych czynników zalicza się te czynniki, które
w sumie wyjaśniają 75%, 80% lub 90% wariancji, a żaden następny
nie tłumaczy więcej niż 5% wariancji.
![Page 30: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/30.jpg)
ILE CZYNNIKÓW?
c/ metoda testu osypiska
polega na sporządzeniu wykresu, na którym na osi poziomej
wyznaczana jest ilość czynników a na osi pionowej - uzyskane
wartości własne. Podstawowym zadaniem jest znalezienie "punktów
załamania", w których rozpoczynają się kolejne "rumowiska" (w tych
punktach zmienia się kąt załamania krzywej). Punkty te określają
liczbę czynników kwalifikujących się do dalszej analizy. Metoda ta
jest nieco bardziej "liberalna" niż metoda >1, pozwala włączyć do
dalszej analizy nieco większą liczbę czynników.
![Page 31: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/31.jpg)
NAZWY CZYNNIKÓW
Nadawanie nazw nowym zmiennym (czynnikom)
– na bazie ładunków czynnikowych:
należy wyodrębnić zmienne o najwyższych ładunkach czynnikowych
względem danych czynników i poprzez analizę nazw zmiennych
znaleźć wspólne ich odniesienie do danego, głębszego wymiaru
![Page 32: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/32.jpg)
METODA GŁÓWNYCH SKŁADOWYCH
A n al i z a g ó w n y c h sk ad o w y c h ł ł (ang. principal components analysis)
j est m et o d t r an sf o rm ac j i zm i en n y c h p i er w o tn y c h w e w zaj em n i e ą
o r t o g o n a l n e, n o w e zm i en n e, t zw . główne składowe.
![Page 33: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/33.jpg)
METODA GŁÓWNYCH SKŁADOWYCH
Redukcja wymiaru przestrzeni cech, uporządkowanie ich na
podzbiory (główne składowe) jest przydatna głównie ze względu na
możliwość zinterpretowania relacji między składowymi, graficznej
prezentacji konfiguracji porównywanych zmiennych, a wreszcie
uporządkowania tych zmiennych według przyjętych cech.
![Page 34: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/34.jpg)
METODA GŁÓWNYCH SKŁADOWYCH
W analizie głównych składowych rozwiązywany problem można
przedstawić następująco:
![Page 35: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/35.jpg)
METODA GŁÓWNYCH SKŁADOWYCH
Wszystkie zmienne pierwotne są poddane standaryzacji, a to
oznacza, że ich wariancje są równe jedności (koła reprezentujące
zmienne pierwotne mają jednakową średnicę). Nowa zmienna
powinna wyjaśniać maksymalną ilość wariancji zmiennych
pierwotnych (jej wariancja jest przedstawiona na rysunku obszarem
zacieniowanym).
Wariancja tej nowej zmiennej wyjaśniającej pewną ilość zmienność
zmiennych pierwotnych jest nazywana jej wartością własną
(eigenvalue).
![Page 36: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/36.jpg)
PROCEDURA METODY GŁÓWNYCH SKŁADOWYCH
Przedmiot analizy – jak poprzednio:
macierz danych, zawierająca n realizacji m zmiennych:
W wyniku standaryzacji wartości zmiennych uzyskujemy zmienne o wartości oczekiwanej równej zero i jednostkowym odchyleniu standardowym:
[ ]nimj
xxX ijij ,...,2,1,...,2,1
,0,==
≥=
Z=[ zij ]
![Page 37: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/37.jpg)
PROCEDURA METODY GŁÓWNYCH SKŁADOWYCH
Zakładamy, że pomiędzy zmiennymi Xj zachodzą związki,
których siłę i kierunek określają współczynniki korelacji liniowej
Pearsona zawarte w macierzy korelacji:
[ ] ( )mjpzzn
ZZn
rR ij
n
iipij ...1,1'1
1==== ∑
=
Przy czym punkt wyjścia stanowi nieprzekształcona macierz
korelacji
![Page 38: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/38.jpg)
PROCEDURA METODY GŁÓWNYCH SKŁADOWYCH
Podstawowe równanie metody głównych składowych można zapisać
w postaciw postaci układu równań liniowych:
ZT = AGT
G = AT Zgdzie:
Z - macierz j standaryzowanych zmiennych pierwotnych
A - macierz ładunków czynnikowych składowych głównych
G - macierz składowych głównych
![Page 39: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/39.jpg)
PROCEDURA METODY GŁÓWNYCH SKŁADOWYCH
Zatem każdy z wyodrębnionych czynników głównych Gl jest liniową kombinacją obserwowalnych zmiennych Z:
Gl=∑i=1
k
∑j=1
m
a i j Z j
gdzie:m – liczba zmiennych pierwotnychk – liczba składowych głównych (wszystkich skłądowych jest tyle ile zmiennych pierwotnych)
Zj – j-ta zmienna standaryzowana (pierwotna)Gl – l-ta skłądowa głównaajl – ładunki czynnikowe
![Page 40: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/40.jpg)
PROCEDURA METODY GŁÓWNYCH SKŁADOWYCH
Rozwiązanie polega, podobnie jak poprzednio, na wyznaczeniu
ładunków ajl, tak aby składowa główna wyjaśniała maksymalną
część wariancji zmiennych pierwotnych.
Każda l-ta główna składowa jest liniowa kombinacją zmiennych
pierwotnych i wyjaśnia i-tą część całkowitej zmienności.
![Page 41: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/41.jpg)
METODA GŁÓWNYCH SKŁADOWYCH
Pierwsza główna składowa G1 jest taką kombinacją dla której
wariancja próbkowa jest największa i wyraża się wzorem:
ijj1i11 1
2G1 S a a = S ∑ ∑
= =
m
i
m
j
i jest największa wśród wszystkich kombinacji liniowych takich, że: a1
Ta1=1(warunek jednoznacznego wyznaczenia wektora współczynników).
![Page 42: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/42.jpg)
METODA GŁÓWNYCH SKŁADOWYCH
Druga główną składową można przedstawić w sposób analogiczny.
Jest ona kombinacja liniową zmiennych pierwotnych
maksymalizującą wariancję przy warunkach:a1
Ta1=1 oraz a1Ta2 = 0
Drugi z nich zapewnia ortogonalność powstałych składowych.
Konsekwencją tego jest sumowanie się kolejnych wariancji głównych
składowych do wariancji całkowitej.
![Page 43: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/43.jpg)
METODA GŁÓWNYCH SKŁADOWYCH
Znaczenie i użyteczność składowej głównej jest mierzona wielkością
wyjaśnianej przez nią całkowitej zmienności. I tak, jeśli w układzie
sześciu zmiennych pierwsza składowa wyjaśnia np. 85% zmienności,
to znaczy to, że prawie cała zmienność tego układu da się
przedstawić na prostej zamiast w sześciu wymiarach.
![Page 44: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/44.jpg)
METODA GŁÓWNYCH SKŁADOWYCH
W efekcie powstaje nam tyle głównych składowych, ile było
początkowo zmiennych (podobnie jak czynników w klasycznej
analizie czynnikowej): nadal mamy układ m-wymiarowy. Ale w
praktyce ograniczamy się do kilku pierwszych głównych
składowych, które wyjaśniają z góry ustaloną część wariancji
całkowitej, np. 75%.
![Page 45: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/45.jpg)
Własności głównych składowych
- są liniową kombinacją obserwowalnych zmiennych
- są ortogonalne względem siebie
- kolejne składowe wyjaśniają malejącą ilość łącznej wariancji zmiennych
- suma wariancji składowych jest równa sumie wariancji zmiennych pierwotnych
![Page 46: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/46.jpg)
PCA / FA
Obie służą sprowadzaniu informacji zawartych w wielu
zmiennych do stosunkowo niewielkiej liczby wyjaśniających
je wymiarów.
Pomimo że w praktyce wyniki uzyskiwane przy pomocy obu z
nich są zbliżone, to nie są to warianty tej samej metody, ale
różne metody oparte na odmiennych założeniach.
![Page 47: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani](https://reader033.fdocument.pub/reader033/viewer/2022041820/5e5d95e7b936b302a62ccf15/html5/thumbnails/47.jpg)
PCA / FA
Analiza czynnikowa Analiza głównych składowych
Ch. Spearman (1904), L.L. Thurstone (1913) H. Hotteling (1933)
Obejmuje wariancję całkowitą zmiennych
Główne składowe są zawsze niezależne
Obejmuje pewną część wariancji zmiennych, zwaną wariancją wspólną
orientacja kowariancyjna: punktem wyjścia jest zredukowana macierz korelacji
orientacja wariancyjna: punktem wyjścia jest zwykła macierz korelacji
Zmienna pierwotna jest funkcją czynników wspólnych i swoistych
Główna składowa jest funkcją zmiennych pierwotnych
Celem analizy jest identyfikacja ukrytych zmiennych
Celem analizy jest uproszczenie struktury danych
Czynniki mogą być zarówno niezależne, jak i skorelowane