SPSS을 이용한 데이터요약 -...
Transcript of SPSS을 이용한 데이터요약 -...
3주
SPSS을 이용한 데이터요약
1.SPSS 사용법(간단히) 2.Data 파일의 작성
3.Data의 변환 4.빈도분석 5.기술통계
6.데이터탐색
1. SPSS 사용법(간단히)
☞ 데이터 입력 1. 자료 입력 ☞ 변수명 입력
2. 화면 하단에 있는 [변수보기]탭을 클릭
2
①
②
[예제 2.18] 커피자판기 고장횟수
3. 변수명: “고장횟수” 4. 소수점 이하자리: 0 5. 하단에 있는 [데이터보기]탭을 클릭
③ ④
⑤
3
6. 데이터 저장(.sav) 저장 단추를 클릭한 후 파일명을 입력 후 “저장” 버튼 클릭
☞ 데이터 저장
⑥
4
☞ 도수분포표와 막대도표 작성 7. 분석▶기술통계량▶빈도분석
8. “고장횟수”를 오른쪽 창으로 이동
⑧ ⑦
5
9. “도표” 버튼을 클릭
10. “도표” 창에서 도표 유형: 막대도표 도표 값: 퍼센트 “계속” 버튼을 클릭
⑩
⑨
6
11. “빈도분석” 창에서 “확인” 버튼 클릭
⑪
7
☞ SPSS 분석결과 저장(.spv) 12. 빈도분석 결과가 나타나면 표준도구모음에 있는 “저장” 버튼을 클릭
8
13. 파일명을 입력하고 “저장” 버튼 클릭
9
☞ SPSS 분석 결과를 다른 파일로 저장(.htm .pdf .ppt 등)
14. SPSS 출력 결과 창에서 마우스 오른쪽 버튼클릭▶ 내보내기 선택 혹은 화면 상단의 을 클릭
10
15. 원하는 유형을 선택하여 저장 * 한글2007에서 불러오기 위해서는 HTML(.htm) 형식으로 저장함
11
2. Data 파일의 작성
자료 입력 변수와 변수 값 라벨 결측값 정의(9 혹은 999 로 정의) 자료의 입력,편집,저장
자료 불러오기 SPSS 자료(.sav), SPSS결과(.spv) EXCEL 자료(.xlsx) 텍스트 파일(.dat 혹은 .txt)
12
• 엑셀 데이터 불러오기, SPSS 파일로 저장
13
엑셀에서 파일저장 (통계학수강실태.xls)
[출처: 사회여론조사]
14
SPSS화면에서 [파일]-[열기]-[데이터] 에서 파일유형을 .xlsx로 변경하여 통계학수강실태.xlsx 엑셀 파일을 불러옴
15
[파일-[저장] : SPSS파일로 저장( .sav)
<변수보기>탭을 클릭하여 “값”에서 각 변수의 변수값 을 입력한다.
[성별]
[학년] [계열]
③ ① ②
④ ⑤
⑥
⑦
3. Data의 변환과 생성
데이터의 변환 [변환]-[코딩변경]
같은 변수로의 변환
다른 변수로의 변환
새로운 변수의 생성 [변수]-[변수계산]
빈도변수 생성 [변환]-[빈도변수 생성]
16
17
예) “계열” 변수의 입력값을 ‘1’ → ‘4’ ‘2’ → ‘3’ ‘3’ → ‘2’ ‘4’ → ‘1’ 로 역 코딩 할 때
변환(T) → 같은 변수로 코딩변경
①
⑥
다른 값도④⑤⑥을 반복하여 입력
④ ⑤
③
②
• 데이터의 변환(같은 변수로의 변환)
• 데이터의 변환(다른 변수로의 변환)
18
예) “통계학점수”을 점수대별로 묶어 새로운 변수인 “점수”로 변환
변환(T) → 다른 변수로 코딩변경
19
다른 점수도 ⑧ ⑨ ⑩ 순서를 반복하여 입력
①
② ③ ④
⑤
⑥
⑫
⑧ ⑩
⑨
⑦
4. 빈도분석
종류 내용
통계량(S) 중심경향(평균,중위수,최빈값,합계),백분위수 값(사분위수,절단점,백분위수),산포도(표준편차,최소값,최대값,분산,범위,평균의 표준오차),분포(왜도,첨도) 등의 통계량을 설정할 수 있음.
도표(C) 막대도표,원 도표,히스토그램 등 도표의 형식을 설정할 수 있음.
형식(F) 어떤 순서대로 출력할 것인지의 출력순서와 다중변수,표 출력 범주를 설정할 수 있음.
20
분석(A) → 기술통계량(E) → 빈도분석(F)
: 빈도분석에는 통계량, 도표, 형식 3종류가 있음
ⓐ ⓑ
ⓒ
21
②변수변택 ③
④
①
22
통계학점수
1 3.3 3.3 3.3
1 3.3 3.3 6.7
1 3.3 3.3 10.0
2 6.7 6.7 16.7
1 3.3 3.3 20.0
1 3.3 3.3 23.3
1 3.3 3.3 26.7
1 3.3 3.3 30.0
3 10.0 10.0 40.0
2 6.7 6.7 46.7
1 3.3 3.3 50.0
2 6.7 6.7 56.7
4 13.3 13.3 70.0
1 3.3 3.3 73.3
1 3.3 3.3 76.7
2 6.7 6.7 83.3
1 3.3 3.3 86.7
2 6.7 6.7 93.3
2 6.7 6.7 100.0
30 100.0 100.0
31
53
70
72
73
74
75
78
79
80
86
88
89
91
92
94
96
98
99
합계
유효빈도 퍼센트 유효 퍼센트 누적퍼센트
23
24
ⓑ 도표
막대도표, 원도표, 히스토그램 도표값을 빈도로 구할지 백분율로 구할지를 선택
25
1학년 2학년 3학년 4학년
학년
0
5
10
15
20
25
빈도
학년
인문 자연 경상 공과
계열
0
5
10
15
20
25
빈도
계열
60미만 70점대 80점대 90점대
점수
0
2
4
6
8
10
빈도
점수
남자 2
성별
0
5
10
15
20
25
빈도
성별
31 53 70 72 73 74 75 78 79 80 86 88 89 91 92 94 96 98 99
통계학점수
0
1
2
3
4
빈도
통계학점수
5. 기술통계
옵션에는 평균,합계,산포도,분포,출력순서로 구성됨 빈도분석과 같이 기초적인 분석이 가능하지만, 빈도분석과는 달리 도표나 그래프를 그릴 수가 없음
분석(A) → 기술통계량(E) → 기술통계(D)
26
27
기술통계량
30 68 31 99 82.47 14.460 209.085 -1.750 .427 4.613 .833
30
통계학점수
유효수 (목록별)
통계량 통계량 통계량 통계량 통계량 통계량 통계량 통계량 표준오차 통계량 표준오차
N 범위 최소값 최대값 평균 표준편차 분산 왜도 첨도
6. 데이터탐색
기술통계, 줄기 잎 그림(stem-and-leaf plot), 상자그림 세가지가 출력
분석(A) → 기술통계량(E) → 데이터탐색(E)
28
학년별로 통계학점수에 대한 데이터 탐색
학년
29
기술통계
82.47 2.640
77.07
87.87
84.00
87.00
209.085
14.460
31
99
68
18
-1.750 .427
4.613 .833
평균
하한
상한
평균의 95% 신뢰구간
5% 절삭평균
중위수
분산
표준편차
최소값
최대값
범위
사분위수 범위
왜도
첨도
통계학점수통계량 표준오차
통계학점수 Stem-and-Leaf Plot Frequency Stem & Leaf 1.00 Extremes (=<31) 1.00 5 . 3 .00 5 . .00 6 . .00 6 . 5.00 7 . 02234 5.00 7 . 58999 2.00 8 . 00 7.00 8 . 6889999 4.00 9 . 1244 5.00 9 . 68899 Stem width: 10 Each leaf: 1 case(s)
통계학점수
30
40
50
60
70
80
90
100
30
Q3 Q2 Q1
Q3+1.5*IQR
Q1-1.5*IQR
최대값
최소값
이상치