Download - 9강_요인분석(2)

Transcript
Page 1: 9강_요인분석(2)

- 1 -

: 사 SPSS (2)

9차 강 : (2)

1. 차 숙지 다.

2. 결과(output) 게 다.

3. 실 료 가지고 실시 다.

<1차시>

지 지 개 과 원리, 개 , 주 과 차 등에

살펴보았다. 강 에 는 앞에 살펴본 개 과 원리

실 차 실 , 결과 등에 살펴볼 것 다.

1. 차

다 과 같 과 거쳐 실시 다.

1. 립 다.

2. 든 변 들에 상 계 수 는 료 지 검 야

다. 변 간 상 계수 는 지고 지도 않아야 다. 다

공산 , 변 간 상 커 독립 지 않다는 것 고, 변 들 간

상 낮다 것 공통 갖 어 다는 것 미 에

에 상 계 검 가 다. 또 결 (missing value)가 많 료

지, 많 료라 보 찾아야 다.

3. 결 다. , 주 에 낼 것 지, 그 다 단계 공통 과 특수

여 는 공통 지 결 야 다. 주

수 산 고 변 들 지닌 보 극 고 , 변

그 체가 사 는 , 공통 변 들 통 쉽게 악 지

않는 재 공통 악 고 사 다. 그러 연 에

다고 공통 지 간다.

* 주 과 (공통 ) 차

보통 변량 “ 체변량=공통변량+특수변량+ 차변량” 다. 공통변량 변

다 변 과 공 고 는 변량 미 고, 특수변량 특 변 만 가지고 는 변

량 다. 차변량 집 차 포 차 알 지지 않 변량 다. 주

Page 2: 9강_요인분석(2)

- 2 -

가지 변량 포 는 체변량 사 변량 극 는 ‘ ’

지만, 공통 변 들 공 는 변량 , 공통변량만 재 ‘ ’

다. 주 변량 극 는 주 체 변량 얼마 는지 알아보

는 것 에 별 득 없다. 라 주 질과 수가 어 가 알고

는 비단계에 주 사 다.

주 각 변 변량 1 고 시 지만, 공통변량 공

사 다. 상 에 주 1 지만, 에 는 각 에 공

가 들어가고, 각 에 누 량 주 과 달리 다.

4. 다. 주 (principal axis factoring), 주 (principal

factor analysis), 우도 (maximum likelihood estimation) 등 에

수 는 , 컴퓨 그램에 거 사

에 근거 에 수 수도 다. 여 는 량과

각 변 공 가 산 다.

* 량(loading)

각 변 과 간 상 계라고 볼 수 는 앞 듯 직 경우 간

상 0 에 량 에 변 상 계수 수 다. 그러 사

경우 간 상 재 다고 가 에 각 변 에 가

과 변 간 상 계수가 다 값 가지게 고, 라 ( 과 변

간 상 계)과 ( 에 변 가 ) 다 값 가진다. 량

수 당 변 그 다고 보는 보통 ±0.3 ±0.4 량

미 다고 본다.

* 공 (communality)

공 는 들에 는 각 변 변량비 다. 수 는 공 는

독립변 고 찰변 각각 변 여 얻어지는 개별 변

다상 승(SMC; multiple ) 다. 공 가 는 변

20개 상 어야 에 는 어도 20개 상

다.

* 고 (eigenvalue)

각 에 변 량 승 여 값 고 다. 값 변 수

누 변량 산 는 들어 고 가 1.5라고 고, 변 수가 5개

1.5/5=0.3 30% 변량 다고 볼 수 다. 고 는 개별 변

량비 에 1.0보다 당 변 변량도 지 못 다

Page 3: 9강_요인분석(2)

- 3 -

고 볼 수 다. 라 삼 ‘고 =1’ 고 가 1보다

라는 미 다.

5. 보다 들 다. 에

만 게 고 다 에는 낮게 어 편 진다.

90° 지 는 직 움직 는

사 등 에 는 , 가 안 수

는 리맥스 많 다.

사실 사 과 야에 는 다루는 개 들 독립 라고 가 어

에 사 야 는 경우가 많다. 그러 사 간 다 공산

어 고 후 에 가 어 게 다. 라 에

다 독립 라고 가 고 직 수

다.

6. 통 들 산 마지막 다. 에

각 에 변 들 특 에 라 여 야 고 뒷 수

는 근거가 어야 다.

7. 결과 보고 다 리 고, 그 결과 다.

- 변 간 상 (correlation matrix)

- 주 결과(initial statistics; 변 별 고 , 변량 등). 스 리 (Scree

plot)

- 결과(final statistics; 후 고 , 변량 등)

- 후 (Rotated factor matrix), (factor plot)

- 수(factor coefficient matrix), 수 간 상 (correlation matrix for

estimated regression factor score)

* 가

양병 (1998)에 가 다 과 같다.

1) 본 는 200 상 어야 다. 찰 변 간 상

에 상 에 민감 다. 특 50 사 수 사 는 경우에는

상 계수 신뢰 수 없 에 통 산 타당 게 수

없다. 결과 신뢰 게 는 사 수에 는 100개에

200개 상 사 야 , 사 수가 많 수 보다 신뢰 운 결과 얻 수

다.

Page 4: 9강_요인분석(2)

- 4 -

2) 다변량 규 포 라야 다. 재 악에 고

에 든 변 가능 규 포 룬다는 다변량 규 포가

어야 다.

3) 변 들 든 계가 는지 악 야 다. 에 는

변 간 상 에 변 간 직 계 가 다. 라 변

들 갖지 못 결과 신뢰 수 없다. 다변량 규

포가 가 계가 다고 본다.

4) 다 공산 (multicollinearity) 는지 악 야 다. 지 다 공산 경우,

들 변 복 보 갖는다는 것 에 에 야 다.

시에는 상 식 값 0에 가 거 고 가 0에 근 다 공산

변 복 다고 단 수 다.

5) 변 간 상 계수가 수 는지 에 악 야 다.

는 변 간 상 당 가 야 가능 다. 상 지

게 다는 것 공통 갖지 않는다는 것 말 에 수

미가 없다. 체 ±0.3 과 야 가능 상 다. SPSS에 변 간 상

지 악 는 다 과 같다.

- 공통 갖고 다 다 변 들 과 통 변 상 계수는 낮

다. SPSS에 는 상 계수(anti-image correlation coefficient) 에 각

계수들 값 가지고 에 다고 본다.

- KMO(Kaiser-Meyer-Olkin) 본 결과, 값 1에 가 울수 본

상 는 다는 것 말 다.

- Bartlett 검 (sphericity test) 결과, 값 고 그에 수

본 상 에 다고 본다.

<2차시>

2. 결과

□ 실

실 과 여 주 어 료든

악 는 어 다는 다. 들어 어 사람 생 상

만 도 알아보 개 다고 가 보 . 여 만

경, 수․ 습, 사 계, 계 등 여러 가지 누고, 각 에

맞춰 여러 개 개 다고 . 개 에는 가 검

등 통 안 타당도 보 고, 내 검 통 여러 가지 당 만

개 고 다.

Page 5: 9강_요인분석(2)

- 5 -

그러 실 보 찰변 연 가 도 각각 에 지

않고, 매우 복 고 규 습 보 게 다. 경우 연 는 량 매우

낮 경우에는 수 거 삭 것 가 결 야 다. 변

에 연 가 어 경우 많 도움 수 다. 또 에

변 공 가 안 는 는 다 강 공통 없다

는 것 미 다. 경우에는 변수에 공 가 그 변

고 지 변 들만 가지고 상 야 다.

게 삭 수 여 다시 검사 도 에 근거 여 검사 보다

많 험 보 여 검사 다시 시 고, 통 다시 악, 검

가 다. 처럼 검사 개 과 에 는 본 검사 에 비검사 도 타당

단 는 게 사 수 다. 라 검사 개 단

개 벽 게 악 수는 없 , 가

는 비검사 단계 드시 거 가 다.

또 미 게 산 었지만 개 개 변 만 는 경우도 다.

러 다 변 과 다상 승(SMC) 낮고 과도 낮 상 보

변량도 고 안 지 않 에 수에 라 여러 변동 수

다. 라 개 변 는 비 미 다고 지라도 에

는 것 람직 다.

□ 결과

결과 는 직 과 사 다 에

가 다.

직 경우, 량 에 량 과 원래 변 들 간 상 계수

므 과 동 다. 라 량 ,

에 주어진 에 여 량 값 가 루는 변 들

엇 지 살펴 수 다.

컨 , 10개 변 가지고 다고 가 보 . 변 1, 3, 5, 7 첫 째

에 0.6 상 량 가지고 다 에 변 들 공통

특 엇 지 고 여 루어질 수 다. 참고 량 값 양수가 아닌 수

가 여 다 경우, 양수, 수에 계없 값 량 가진 변 들 엇

Page 6: 9강_요인분석(2)

- 6 -

지 고 미 야 다. 러 “양극 ”(bipolar

factor) 라고 는 들어 격 내 과

다 가 는 양극 라고 수 다.

그러 사 경우에는 직 과 달리 량 과 변 간 상 계

타 지 않 에 과 달리 타 다. 특 들 간

상 계가 수 과 차 가 게 에 어

미 것 가는 연 가 결 야 다.

□ 결과 실

여 는 신뢰도 강 에 살펴본 연 료 고 다. 연 결

과 에 는 주 포 결과 살펴볼 것 다.

료 는 는 첫째 료에 는 50개 는 변 간

상 통 는 악 어 에 개 여 그 특 악 수

어 도 타당 악 수 다. 또 결과 지수 여 차후에

다양 통계 ( : 귀 ) 여 험 특 게 악 수 게

다.

여 는 가 차 고 1.0 산 고 다.

그러 개 산 것 라고 연 가 가 수 수도

다. 또 게 결과에 리 지 못 갖거

견 삭 거 수 다시 검사 시 수 다.

□ 변 간 상

50개 변 간 상 결과는 다 과 같다. 여 볼 수 듯 50개 변 간 상 매우

복 게 에 험 들 어 특 갖 고 는지 는 매우 어 다. 그

러 상 계수가 ±0.3 상 야 간 공통 가 수 는 , 본 료에 는 ±0.3

값도 많 므 지 않 변 도 수 다. 참고 a1, a2, …, a50

각 별 변 타낸 것 다. 본 연 에 약 500 상 험 사 수가 므

엔 사 수라고 볼 수 다.

Page 7: 9강_요인분석(2)

- 7 -

a1 a2 a3 a4 a5 a6 a7 a8 a9 a10 … a50

a1 1.00 0.27 0.18 0.44 0.15 0.24 0.42 0.19 0.40 0.25 … 0.09

a2 0.27 1.00 0.16 0.38 0.11 0.11 0.26 0.25 0.30 0.28 … 0.07

a3 0.18 0.16 1.00 0.20 0.17 0.25 0.21 0.23 0.24 0.18 … 0.12

a4 0.44 0.38 0.20 1.00 0.20 0.18 0.30 0.16 0.31 0.17 … 0.09

a5 0.15 0.11 0.17 0.20 1.00 0.29 0.29 0.28 0.12 0.15 … 0.11

a6 0.24 0.11 0.25 0.18 0.29 1.00 0.28 0.32 0.29 0.36 … 0.02

a7 0.42 0.26 0.21 0.30 0.29 0.28 1.00 0.35 0.41 0.33 … 0.13

a8 0.19 0.25 0.23 0.16 0.28 0.32 0.35 1.00 0.39 0.45 … 0.04

a9 0.40 0.30 0.24 0.31 0.12 0.29 0.41 0.39 1.00 0.39 … 0.12

a10 0.25 0.28 0.18 0.17 0.15 0.36 0.33 0.45 0.39 1.00 … 0.06

… … … … … … … … … … … … …

a50 0.09 0.07 0.12 0.09 0.11 0.02 0.13 0.04 0.12 0.06 1.00

□ 검

KMO(Kaiser-Meyer-Olkin Measure of Sampling Adequacy) Bartlett 검

결과, KMO가 약 0.90 에 료 수 었 , 사 수

가 료 가 에 지 알아보 Bartlett 검 결과 수

0.00 α=0.05보다 므 역시 에 료 수 다.

KMO 지수 .90

Bartlett's Test

chi-square 근사 6600.65

도 465

도 .000

□ 주

다 주 결과 시 는 주 (component)별 고 (initial eigenvalue)

량(loading) 다. 여 값(initial) 1 공 (communality) 주 에 는

공 가 1.0 고 다는 것 억 가 다. 각 변 별 변량 1.0 고, 체

수는 50개 에 체 변량 50 다. 라 체 변량 첫 째 주

11.36/50=0.2271 체 변량 약 22.71% 다고 볼 수 다. 또 주 별

살펴보 첫 째 주 가 것 타났 , Scree plot에 도 볼 수 듯 2 째

주 는 상 낮 고 가지는 것 타 첫 째 주 고는

체 산 득 게 수 는 없는 것 타났다. 는 주 50

개 는 변 포 약, 수 는 찾아내 어 다는 사실

고 다.

Page 8: 9강_요인분석(2)

- 8 -

또 고 1 상 주 13개 어 상당 많 것 타났 13개 주

변량 60.83% 타났다. 만약 고 가 1 상 것 주 삼는 Kaiser

식 경우 상당 많 주 게 에 료 미가 별 없다.

라 량 낮 변 경우 수 삭 통 개 시킬

가 다. 또 게 개 검사 도 가지고 검사 다시 시 야 뿐 아니라 공통

가 고 수 는 수 가 다. 그래야 수많 변

약 여 시 수 는 악 수 것 다.

Total Variance Explained

Component Initial Eigenvalues Extraction Sums of Squared Loadings

Total% of

VarianceCumulative

%Total

% of Variance

Cumulative %

1 11.36 22.71 22.71 11.36 22.71 22.71

2 2.93 5.87 28.58 2.93 5.87 28.58

3 2.38 4.76 33.33 2.38 4.76 33.33

4 2.18 4.36 37.69 2.18 4.36 37.69

5 1.69 3.38 41.07 1.69 3.38 41.07

6 1.54 3.08 44.16 1.54 3.08 44.16

7 1.41 2.82 46.98 1.41 2.82 46.98

8 1.32 2.65 49.63 1.32 2.65 49.63

9 1.30 2.61 52.23 1.30 2.61 52.23

10 1.16 2.32 54.55 1.16 2.32 54.55

11 1.10 2.20 56.75 1.10 2.20 56.75

12 1.04 2.08 58.82 1.04 2.08 58.82

13 1.01 2.01 60.83 1.01 2.01 60.83

14 1.00 2.00 62.83

15 0.94 1.88 64.71

… … … …

50 0.18 0.35 100.00

Extraction Method: Principal Component Analysis.

Page 9: 9강_요인분석(2)

- 9 -

□ 자료의 수정

연 에 는 50개 변 언어 , , 신체 3개

다고 가 고 개 었다. 548 생 상 1차 사 결과

탕 결과, 고 가 1 상 13개 타났다. 연

가 3개 에 지 않는 들 상당 많 었 에 검사 도 수 ․

보 여 다시 료 수집 었다.

새로운 자료 수집 시에 수정․보완할 은 다음과 같았다.

1) 분석 결과, 언어 괴롭힘, 특히 신체 괴롭힘에서는 부분 ‘ 아니다‘로 체크한 피

험자가 많았으므로 이 두 괴롭힘에 해당되는 학생들 표집을 늘릴 필요가 있다.

2) 문항 자체에서도 이 두 괴롭힘에 해당되는 진술을 다시 진술할 필요가 있다. 즉 진술이

실에서는 거의 일어나기 어려운 경우( : 할큄)가 많이 있어 수정할 필요가 있었다.

3) 이 두 괴롭힘에 해당하는 문항 수를 늘릴 필요가 있다. 두 괴롭힘에 해당하는 소외 괴

롭힘에 해당하는 문항을 여 체 으로 균등한 수의 문항 수로 조정할 필요가 있음.

4) 각 별 여진 연 에 도 결과 지 보고, 수

다.

같 진단 탕 량 낮 20개 삭 여 검사

Page 10: 9강_요인분석(2)

- 10 -

다. 다 에 시 는 수 가지고 결과 다.

직 (orthogonal rotation)에 리맥스 ,

량 체 ±0.5에 근 게 다. ±0.5 에 도 Hair (1995)는

게 체 미 훼 지 않고, 량 ±0.3 상

다고 볼 수 있다고 보았기 때문에 선택하여 사용하 다. 일반 으로 사교회 은 두 요인 간

독립성을 가정할 수 없을 때 사용되는데, 이 연구에서는 요인 간의 독립성을 어느 정도

제하고 베리맥스 방법을 사용하 다. 사교회 베리맥스(Varimax) 회 결과 요인 1에는

문항13, 문항,11 문항 22 등이 부하되었으며(부하량 0.360~0.757), 요인 2에는 문항 25, 문항

24, 등이 부하된 것(부하량 0.329~0.774)으로 나타났다.

2개 내 과 연 결과에 라 1 ‘신체 ’ 2는

‘비신체 ’ 체 < 1>과 같 여

에 공 도 같 시 다. 는 연 가 었

많 도움 변 미 가지고 재 는 업 다. [그림 1]

후 스 리 에 도 1과 2에 15개 들 각각 뉘어 여

수 다. 척도가 내에 처 안 어 사 것 감안 어느

도 안 갖 고 다고 볼 수 다.

Page 11: 9강_요인분석(2)

- 11 -

문항번호 내용요인

공유치1 2

13 는 들 진 다. .755 .157 .590

11 는 살 다. .750 .136 .580

16 는 주 맞 경험 다. .701 .137 .510

10 는 귀 맞아본 다. .692 .103 .490

12 는 쳐진 경험 다. .664 .242 .499

8 는 들겨 맞 경험 다. .648 .130 .437

14 는 귀 리가 아 당겨 다. .641 .183 .444

15 는 거운 건에 맞았다. .610 .145 .393

9 는 집 다. .608 .107 .381

7 는 가벼운 건( :책 또는 지우개)에 맞았다. .530 .356 .408

17 는 에 걸 어진 다. .525 .188 .311

6 누 가 내가 실에 가는 것 다. .484 .230 .287

18 는 단단 다. .470 .192 .258

19 는 사 실에 갇 다. .434 .228 .241

22 는 스 도 강 당 다. .362 .081 .138

25 는 가 었다. .164 .767 .616

24 주변에 에게 말 걸어 지 않았다. .165 .752 .593

30 는 겨진 었다. .116 .712 .520

35 내가 도움 아 도 도 주지 않았다. .130 .682 .482

27 는 동 시 맨 에 택 었다. .174 .641 .441

29 는 간질 당 다. .167 .556 .337

26 에 거짓 다. .129 .550 .319

40 누 가가 내 가 에 게 말 다. .106 .549 .313

38 누 가가 내 야 꾸 냈다. .076 .544 .302

45 내가 맞고 , 다 사람들 척 다. .249 .526 .338

44 누 가가 또는 에 못살게 었다. .251 .507 .320

39 누 가가 내 러 엉망 만들었다. .124 .459 .226

5 내가 동에 참여 지 못 게 다. .236 .441 .250

28 사귀고 싶 가 었 는 거 당 다. .308 .419 .270

42누 가가 내 지 못 게 고 께 지 못

게 다..116 .334 .125

아이겐 값 8.62 2.80

설명 변량 28.75% 9.33%

누적 변량 28.75% 38.08%

< 1> 척도

Page 12: 9강_요인분석(2)

- 12 -

[그림] Plot

<3차시>-실습

■ Analyze->Data Reduction->Factor Analysis

1. 고 는 변 들 택 Variables 창 다.

2. 술통계 계산 Descriptive 택 여 고 는 통계 택 다.

Statistics

Univariate Descriptive 평균, 편차, 사 수 계산

Initial Solution 공 , 고 , 변량 비 계산

Correlation Matrix

Coefficient 상 계수

Inverse 역 상 계수 과 공변량

Significance levels 상 계 에 계수에 수

Reproduced에 상 계 , 상 계수

Determinant 식 값 계산

KMO and Bartlett's

test of sphericityKaise-Meyer-Olkin 도 Barlett 검

3. 식 Extraction 택 여 식 다.

Page 13: 9강_요인분석(2)

- 13 -

Method

Principal components 주

Unweighed least squares 비가 승

Generalized least squares 승

Maximum likelihood 우도

Principal-axis factoring 주

Alpha factoring 알

Image factoring 다 귀

*주 Principal components는 Default값 어 에

다고 고 아 것도 여 지 지 않 주 만 게 다. 라 연 가

주 아닌 고 다 다 식 야 다.

4. 지 Rotation 택 여 지 다.

Method

None 지 않

Varimax 리맥스

Quartimax 쿼 맥스

Equamax 쿼맥스

Direct Oblimin 사

Promax 사 상

Display

Rotated solution 후 값들 계산

Loading plots 각 간 변 량 계산

Maximum Iteration for

Convergence 결 지 계산 복 수 지

5. 값 거 결과 에 타내 Scores 택 다.

6. 타 지 Option 택 다. 여 는 재량 순

태내 Sorted by size 택 다.

Missing Values

Exclude cases listwise 든 변수가 경우만 사

Exclude cases pairwise 든 변수 경우만 사

Replace with mean 답 경우 변 평균 사

Coefficient Display Format

Sorted by size 량에 라 내림차순

Suppress absolute values

less than지 값보다 경우 보 지 않게

7. 든 마 리 OK 릭 다.

Page 14: 9강_요인분석(2)

- 14 -

■ 리

- 차는 다 과 같다.

1. 립 다.

2. 든 변 들에 상 계 수 는 료 지 검 다.

3. , 주 지, 공통 지 결 다.

4. 다.

5. 보다 들 다.

6. 통 들 산 다.

1. 다 차 다. 지 않 것 ? ③

① 1단계- 다.

② 2단계- 든 변 들 상 계 에 료 지 검 다.

③ 3단계- 과 결 다.( 결 다)

④ 4단계- 다.

2. 다 가 다. 지 않 것 ? ④

① 본 는 200 상 어야 다.

② 다변량 규 포 라야 다.

③ 변 들 든 계여야 다.

④ 다 공산 (multicollinearity) 갖아야 다.(변 간 다 공산 야 다)

3. 다 시 는 사 다. 지 않 것 ? ③

① 변 간 상 계수가 수 는 료 지 알아보 KMO

(Kaiser-Meyer-Olkin) 본 결과, 값 1에 가 울수 본 상

는 다는 것 말 다.

② 실 보 찰변 연 가 도 각각 에 지 않

보 경우, 연 는 량 매우 낮 경우에는 수 거 삭

것 가 결 야 다.

③ 변 간 상 계수가 ±0.5 상 야 간 공통 가 수 다.(±0.3 상 )

④ Bartlett 검 (sphericity test) 결과, 값 고 그에 수

수 본 상 에 다고 본다.