Rex 기초 - Seoul National Universityhosting03.snu.ac.kr/~hokim/int/2019/Rex201903.pdf ·...
Transcript of Rex 기초 - Seoul National Universityhosting03.snu.ac.kr/~hokim/int/2019/Rex201903.pdf ·...
Contents
M a k e A n a l y s i s F a s t a n d E a s y
Rex 기초
• Rex 소개 및 설치
• Rex 기초
• 엑셀을 활용한 랜덤 샘플링
이보라 (렉스소프트)
http://rexsoft.org
01 Rex 소개 및 설치
통계분석 소프트웨어 비교
특징 Stata SPSS SAS R
학습난이도 중 하 상 상
사용 방법 클릭/
프로그래밍 클릭/
프로그래밍 프로그래밍 프로그래밍
데이터 처리 다양성 중 하 상 상
분석 기능 다양성 중 하 상 상
그래픽스 다양성 상 하 중 상
설치 비용 중 고가 고가 무료
4
http://rexsoft.org
01 Rex 소개 및 설치
R의 장단점
A key benefit of R is that it provides near instant availability of new and experimental methods created
by its user base — without waiting for the development/release cycle of commercial software. SAS
recognizes the value of R to our customer base…”
- Michael Gilliland, Product Marketing Manager SAS Institute
R의 장점
R 패키지 수 > 10,000
5
http://rexsoft.org
Rex
– 다운로드: http://rexsoft.org
– 엑셀 인터페이스를 이용한
손쉬운 데이터 정리
– Point-and-click 방식을 활용한
손쉬운 데이터 분석
– R을 활용한 분석 모듈 구성
– 국내 통계 및 전산 전문가의
참여 및 개발
– 한글 데이터 완벽 지원
– WYSIWYG 지원
(What You See Is What You Get)
01 Rex 소개 및 설치
Rex란?
[ Rexsoft 홈페이지 ]
7
http://rexsoft.org
Rex 개발 언어
– Microsoft Visual Studio 2015
– Microsoft Visual Basic .NET
– Microsoft Visual Studio Tools for Office
01 Rex 소개 및 설치
Rex 설치
최소 컴퓨터 사양
– Windows 7 이상
– 32bit 혹은 64bit
– Microsoft Office 2013 이상
– R 3.4.0 이상
R 설치 순서
1 2 3 R
설치 R 패키지
설치
Rex 설치
1. R 설치: R v3.4.0 이상
2. R 패키지 설치
– R 관리자권한으로 실행
– source("http://goo.gl/ZNEFj1")
3. Rex 설치
8
렉스소프트 홈페이지( http://Rexsoft.org ) 방문 후 Register 클릭
1
2
3
4
Rex 다운로드
R 설치
R 패키지 설치
Rex 설치
클릭
1
2
3
4
Rex 다운로드
R 설치
R 패키지 설치
Rex 설치
처음 R을 설치하는 경우 이미 R이 설치된 경우
R 최신버전 다운로드 윈도우 프로그램 추가/제거
R 버전 확인
R 3.4.0 미만 R 3.4.0 이상
관리자 권한으로 실행/설치
R 최신버전 다운로드
관리자 권한으로 실행/설치
R 최신버전에서 R 패키지 설치 진행
R 패키지 설치 진행
R 최신버전 다운로드 (R 미러 사이트: http://healthstat.snu.ac.kr/CRAN )
R 설치 시, 32비트, 64비트는 자동적으로 선택되므로 변경하지 마세요.
R 3.4.0 미만 버전이 이미 설치된 경우, 이를 삭제하실 필요는 없으나, 가장 최근 설치된 R이 3.4.0 이상이어야 합니다.
R 실행하기
– R 아이콘 ▶ 마우스 우클릭 ▶ 관리자 권한으로 실행
– 64비트, 32비트 R 아이콘이 둘 다 있는 경우, 64비트 실행
R 패키지 설치
– R console 창에 다음 명령어 실행
source("http://goo.gl/ZNEFj1")
(Rex 다운로드 이메일의 4(3)의 명령어를 복사-붙여넣기-Enter)
– 다음 메시지가 보이면 R 패키지 설치가 잘 끝났음을 의미
!!! Installing R packages required for Rex was COMPLETED !!!
한꺼번에 300여개의 R 패키지를 다운받아 설치함. 때문에 인터넷이 원활한 곳에서 설치해야 함.
설치 중간, 에러가 나는 경우
명령어 source("http://goo.gl/ZNEFj1") 를 패키지 설치가 끝날 때까지 반복해서 재실행하면 됨.
Rex 재설치
1
2
3
4
Rex 다운로드
R 설치
R 패키지 설치
Rex 설치
엑셀 종료 확인 ▶ Rex 설치파일 압축해제 ▶ setup 우클릭 ▶ 관리자 권한으로 실행
다음 화면에서 설치 클릭
Rex 재설치 혹은 업데이트 하실 경우, R 패키지 설치 → Rex 설치 순으로 진해야 합니다.
1
2
3
4
Rex 다운로드
R 설치
R 패키지 설치
Rex 설치
클릭
클릭
Rex가 잘 설치된 경우
– 엑셀 실행 시, 다음과 같은 문구가 출력됨 「추가 기능 로드 중 Rex」
– 엑셀의 메뉴바에 Rex라는 탭이 생성됨
Rex 연결
– 연결 메뉴를 클릭하여, R과 연결되어야 분석 메뉴들이 활성화됨
– R과 연결된 경우 팝업 메세지 출력됨 「R과 연결되었습니다」
1
2
3
4
Rex 다운로드
R 설치
R 패키지 설치
Rex 설치
클릭
Rex 정상 설치완료 시
나타나는 메뉴
http://rexsoft.org
설치 실패 1
– 「‘type’ 속성 값을 구문 분석할 수 없습니다 .」
라는 에러 메시지가 출력되며 설치에 실패하는
경우
[해결방법]
– 에러 메세지에 출력된 경로의
VSTOInstaller.exe.Config 파일 삭제
01 Rex 소개 및 설치
Rex 에러와 대처방법
설치 실패 2
– 「일반 설치 관리자 오류로 인해 다음 Microsoft
Office 솔루션을 설치할 수 없습니다.
Rex.vsto.」라는 에러 메시지가 출력되며 설치
에 실패하는 경우
[해결방안]
– Rex 설치파일 (setup.exe)을 관리자 권한으로
실행하여 설치
– 해결되지 않을 경우 재부팅 후 위 방법 재시도
– 재부팅 후에도 설치가 되지 않을 경우,
다음 링크로부터 닷넷 프레임워크 4.5 설치 후
위 방법 재시도
https://www.microsoft.com/ko-
kr/download/details.aspx?id=30653
20
http://rexsoft.org
설치 실패 3
– 「신뢰할 수 없는 인증서 메시지」 가 출력되며
설치에 실패하는 경우
[해결방법]
① 에러메세지 경로의 VSTOInstaller.exe.Config 파일 삭제
② Rex 설치파일 (setup.exe) 마우스 우클릭 → 속성 → 디지털 서명
③ 자세히 → 인증서 보기 → 인증서 설치
④ 현재 사용자 → 모든 인증서를 다음 저장소에 저장
⑤ 찾아보기 → 신뢰할 수 있는 루트 인증기관 선택 → 마침
⑥ 이후 재설치
01 Rex 소개 및 설치
Rex 에러와 대처방법
21
http://rexsoft.org
설치 실패 4
– 「MSVCR100.dll이 없어 프로그램을 시작할 수 없습니다」 가 출력되며
설치에 실패하는 경우
[해결방법]
① Visual Studio C++ 2010 재배포 가능 패키지 설치
32비트 운영체제: http://www.microsoft.com/download/en/details.aspx?id=5555
64비트 운영체제: http://www.microsoft.com/download/en/details.aspx?id=14632
② 이후 재설치
01 Rex 소개 및 설치
Rex 에러와 대처방법
22
http://rexsoft.org
설치 실패 5
– 「참조된 어셈블리가 시스템에 설치되지 않았습니다」 가 출력되며 설치에 실패하는 경우
[해결방법]
① 윈도우키+R 눌러 실행 띄운 후 %UserProfile%\AppData\Local\Apps 엔터 후 이동하여 하위 디렉토리
삭제
② 레지스트리 에디터 (윈도우키+R 눌러 실행 띄운 후 regedit) 띄운 후
HKEY_CURRENT_USER\Software\Microsoft\Office\Excel\Addins 이동하여 Rex 삭제
③ HKEY_CURRENT_USER\Software\Microsoft\VSTA\Solutions 이동하여
하위 폴더 중 Rex 값을
포함하는 디렉토리 삭제
01 Rex 소개 및 설치
Rex 에러와 대처방법
23
http://rexsoft.org
R과 연결 실패
– 설치는 잘 되었으나, 「R과 연결될 수 없습니다.」 라는 에러 메지시가 출력되는 경우
[해결방법]
① R 관리자 권한으로 실행
② R console 창에서 source(http://goo.gl/ZNEFj1) 수행 후 재시도
만약 해결되지 않을 경우 백신 프로그램의 차단 문제
① 라이브러리 경로 : C:\Program Files\R\<R 버전>\library\에서 Rserve 디렉토리를 찾아서 삭제
② R을 관리자권한으로 실행한 후 R console 창에서 source(http://goo.gl/ZNEFj1) 재시도
③ 백신 홈페이지에 접속하여 화이트리스트로 Rserve를 등록해야 함.
01 Rex 소개 및 설치
Rex 에러와 대처방법
24
http://rexsoft.org
엑셀에서 Rex 메뉴가 이탈하는 경우
– 엑셀의 메뉴바에 Rex 메뉴탭이 생성되지 않는 경우
[해결방법 (일회성)]
– 엑셀의 다음 메뉴를 순서대로 클릭함
파일 옵션 → 추가기능 → COM 추가기능 → 이동 → Rex 추가
– 위 방법은 엑셀을 실행하여 Rex를 실행하기를 원할 때마다 반복해야 하는 단점이 있음.
01 Rex 소개 및 설치
Rex 에러와 대처방법
1
2
3
5
4
25
http://rexsoft.org
엑셀에서 Rex 메뉴가 이탈하는 경우
– 엑셀의 메뉴바에 Rex 메뉴탭이 생성되지 않는 경우
[해결방법 (영구적)]
– 다음 순서대로 진행
Rex 제거 → 컴퓨터 재부팅 → Rex 설치
– 위 방법으로 해결되지 않을 경우 다음 순서대로 진행
엑셀 제거 → Rex 제거 → 컴퓨터 재부팅 → 엑셀 설치 → Rex 설치
01 Rex 소개 및 설치
Rex 에러와 대처방법
26
http://rexsoft.org
02 Rex 기초
Rex 분석의 흐름
• WYSIWYG 방식 : Excel에서 준비한 자료를 R로 그대로 분석 가능함.
• R 코드 작성 필요 없이 분석에 필요한 모든 것을 UI 상에서 입력 가능함.
내 자료에서 R 분석 결과까지
자료 준비 자료 전송
분석 설정 분석 요청
분석 결과
28
http://rexsoft.org
데이터 구성
1. 각 변수의 이름
– 첫 행은 각 변수의 이름으로 구성되어야 함.
– 첫 행이 공백으로 되어 있는 경우,
해당 변수의 관측값은 분석에서 제외됨.
– 변수 명은 반드시 영문으로 시작해야 하며,
숫자는 영문 뒤에 따라올 수 있음.
또한 특수문자는 변수명에 사용할 수 없음.
2. 결측값
– 공백, NA
– #NUM!, #VALUE!, #N/A
#REF!, #NAME?, #DIV/0!
#NULL!
02 Rex 기초
Rex 데이터 준비하기
[ 변수 이름 ]
[ 결측값 ]
29
http://rexsoft.org
02 Rex 기초
Rex 데이터 준비하기
• 엑셀 데이터를 R의 object로 변환하여 저장할 수 있음.
• 저장된 R object의 이름은 rexdata이며 R을 실행하여 확인 가능함.
R 데이터로 저장
클릭
30
http://rexsoft.org
확률분포
– Rex는 13개의 연속형 확률분포, 5개의 이산형 확률분포를 지원함
02 Rex 기초
Rex 기능 소개
정규분포 t 분포 카이제곱분포 지수분포 F 분포
베타분포 코쉬분포 균등분포
로그정규분포 감마분포 와이블분포
로지스틱분포 굼벨분포
이항분포 포아송분포 기하분포
초기하분포
음이항분포
31
http://rexsoft.org
랜덤샘플링
– 확률분포로부터 랜덤 샘플링을 수행할 수 있음.
– 샘플링 순서 : 엑셀에서 블록 지정 ▶ 분포 선택 ▶ 모수 설정 및 실행
(샘플링 수는 지정한 영역에 따라 자동 지정)
02 Rex 기초
Rex 기능 소개
[ 정규분포 랜덤샘플링 예 ]
32
http://rexsoft.org
다양한 분석 모듈
02 Rex 기초
Rex 기능 소개
33
기술 통계
그룹비교 회귀분석 상관 분석
범주형 자료분석
분류 분석
차원 축소
시계열 분석
생존분석 비모수분석 메타분석
데이터요약
평균비교
일표본 t검정/z검정
선형 회귀분석
상관 분석
분할표 분석
비지도학습
K-평균 군집
요인 분석
시계열 자료탐색
생명표
위치 문제
1-표본 연속형 (단일집단)
메타분석
독립표본
t검정/z검정 가중선형회귀분석
편상관 로그선형
분석 계층적 군집
대응일치분석
지수 평활법
Kaplan -Meier
2-독립 표본
연속형 (두 집단) 메타분석
짝진표본
t검정 편최소 제곱
거리 측도
DBSCAN
군집 주성분 분석
ARIMA 모형
Cox 비례위험모형
2-대응 표본
이분형 (단일집단) 메타분석
일변량
분산분석 포아송
회귀분석
PAM 군집
GARCH
모형
k-독립 표본
이분형 (두 집단) 메타분석
다변량
분산분석 이항자료 회귀분석
지도학습
의사결정 나무
k-대응 표본
상관관계 메타분석
비율비교
일표본 비율검정
다항자료 회귀분석
판별분석 분포 문제
1-표본 발생률
메타분석
이표본
비율검정 2-단계
최소제곱
K최근접 이웃기법
2-표본 진단검사 메타분석
분산비교
등분산 검정
반복측정회귀분석
SVM 런검정
일표본
분산검정 다변량
회귀분석
http://rexsoft.org
그래픽스
– 12가지 종류의 그래픽스 제공
– 그래프 제목, x/y축의 이름, 눈금 값, 범례 등 세밀
한 조정 가능
– 간단한 통계분석 결과를 그래프에 표시 가능
– 다양한 그래프를 조합하여 구성 가능
– 다양한 이미지 저장 형식 (png, tiff, jpeg등) 지원
02 Rex 기초
Rex 기능 소개
Index plot
Dot plot Histogram plot Density plot
Box plot
QQ plot Scatter plot Scattermatrix plot
XY plot
Mean plot Bar plot Pie plot 34
http://rexsoft.org
02 Rex 기초
Rex를 활용한 분석 예
기술통계량
html로 결과 저장 가능 결과창의 그림 및 표를 복사하려면 먼저 html로 저장된 파일을 이용할 것
바로가기 가능 각 분석 제목 추가 및 편집 가능
36
http://rexsoft.org
02 Rex 기초
Rex를 활용한 분석 예
결과창 정리하기: 방법 1
결과 창의 경우 이미지의 복사 및 저장 가능
• 복사 & 붙여넣기 방법
• 이미지는 복사 및 저장 버튼을 이용하여
복사/저장 가능
• 표의 경우 표를 지정한 뒤에 복사 및 붙여
넣기 (엑셀에 붙여넣는 것을 추천)
결과 창의 경우 이미지의 복사 및 저장 가능 복사를 원하는 표를 드래그 한 뒤에 복사할 것.
그림 복사하기
표 복사하기
37
http://rexsoft.org
02 Rex 기초
Rex를 활용한 분석 예
결과창 정리하기: 방법 2
• Html로 변환 후 doc로 변환하기
• HTML로 결과 저장 (예) res.html
• 온라인 프로그램을 활용한 HTML의 doc,
ppt, pdf 등으로 변환
(예시) 아래 온라인 변환 싸이트에 rex.html
업로드:
https://convertio.co/kr/html-doc/
결과파일을 res로 저장.
res.html 업로드
결과 저장하기
온라인 프로그램을 이용하여 변환하기
클릭 38
http://rexsoft.org
02 Rex 기초
Rex를 활용한 분석 예
결과창 정리하기: 방법 3
• Html로 변환 후 doc로 변환하기
• HTML로 결과 저장 (예) res.html
• MS워드에서 html 파일 불러오기
결과파일을 res로 저장.
결과 저장하기
MS워드에서 html 불러오기
40
http://rexsoft.org
03 엑셀을 활용한 랜덤 샘플링
Sampling method
표본추출
비확률표본추출 확률표본추출
편의 표본추출
판단 표본추출
할당 표본 추출
단순 임의추출
층화 임의추출
집락 추출
추출확률 사전정의
계통 추출
42
http://rexsoft.org
Simple random sampling
1. 새로운 열을 하나 만들어서 열 이름(random)을 지정한 뒤, 2번째 행에 “=rand()” 입력 후 enter를 누른다.
2. 자동 채우기를 통해 전체 데이터에 대해 난수를 생성한다.
03 엑셀을 활용한 랜덤 샘플링
단순임의추출
43
http://rexsoft.org
Simple random sampling
3. rand() 함수값이 지속적으로 변경되는 것을 막기 위해, 값을 복사하여 옆에 붙여 넣는다.
4. 정렬 기능을 통해 복사한 값을 오름차순으로 정렬한다.
03 엑셀을 활용한 랜덤 샘플링
단순임의추출
44
http://rexsoft.org
Simple random sampling
5. 정렬된 데이터의 위에서부터 추출하려는 개수만큼 행 기준으로 데이터를 선택한다.
03 엑셀을 활용한 랜덤 샘플링
단순임의추출
45
http://rexsoft.org
Stratified random sampling
1. 새로운 열을 하나 만들어서 열 이름(random)을 지정한 뒤, 2번째 행에 “=rand()” 입력 후 enter를 누른다.
2. 자동 채우기를 통해 전체 데이터에 대해 난수를 생성한다.
03 엑셀을 활용한 랜덤 샘플링
층화임의추출
46
http://rexsoft.org
Stratified random sampling
3. rand() 함수값이 지속적으로 변경되는 것을 막기 위해, 값을 복사하여 옆에 붙여 넣는다.
4. 정렬 기능을 통해 층화변수 > 복사한 값을 순차적으로 오름차순으로 정렬한다.
03 엑셀을 활용한 랜덤 샘플링
층화임의추출
47
http://rexsoft.org
Stratified random sampling
5. 정렬된 데이터에서 그룹별로 위에서부터 추출하려는 개수만큼 행 기준으로 데이터를 선택한다.
03 엑셀을 활용한 랜덤 샘플링
층화임의추출
48
http://rexsoft.org
Systematic sampling
1. 500명 중 50명을 계통추출 하고자 한다면, k=모집단크기/표본크기=500/50=10을 구한다. 1~9 중 임의의
숫자를 골라 그 뒤로 k번씩 건너뛰며 추출한다.
2. 새로운 열을 하나 만들어서 열 이름(random)을 지정한 뒤, 2번째 행에 “=rand()” 입력 후 enter를 누른다.
3. 자동 채우기를 통해 1~9번째 개체에 대해 난수를 생성한다.
03 엑셀을 활용한 랜덤 샘플링
계통추출
49
http://rexsoft.org
Systematic sampling
3. rand() 함수값이 지속적으로 변경되는 것을 막기 위해, 값을 복사하여 옆에 붙여 넣는다.
4. 정렬 기능을 통해 복사한 값을 오름차순으로 정렬한다.
03 엑셀을 활용한 랜덤 샘플링
계통추출
50
http://rexsoft.org
Systematic sampling
5. 계통추출을 시작할 시작점이 선택되면 다시 id를 기준으로 정렬한다.
03 엑셀을 활용한 랜덤 샘플링
계통추출
51
http://rexsoft.org
Systematic sampling
6. 시작점 옆 셀에 =mod( row() - 5, 50) 입력 후 enter를 누른다.
03 엑셀을 활용한 랜덤 샘플링
계통추출
52
http://rexsoft.org
Systematic sampling
7. 해당 열에서 필터기능을 통해 0에 해당하는 데이터를 선택한다.
03 엑셀을 활용한 랜덤 샘플링
계통추출
53
실습 http://rexsoft.org
1. 다음 상황에 대해 랜덤 샘플링을 수행한 데이터를 출력하여 워드파일로 제출하시오.
1) birth 데이터에서 10명을 랜덤 추출하시오.
2) birth 데이터에서 저체중 출생 여부에 따라 층별로 5명을 랜덤 추출하시오.
• 저체중 출생 여부 (lowbw) : 0=normal / 1=low birthweight
3) birth 데이터에서 10명을 계통 추출하시오.
2. 1의 1)에 추출된 데이터 10명에 대해 기술통계량 표를 작성하시오.
– 질적변수 : 저체중출생(lowbw), 조산여부(preterm), 산모고혈압여부(hyp), 신생아성별(sex)
– 양적변수 : 출생체중(bweight), 재태주수 (gestwks), 산모나이 (matage)
54
Rex 특강
과제
문의
M a k e A n a l y s i s F a s t a n d E a s y
홈페이지 ‘질문과 답변’ 게시판을 통해 Rex 설치, 다운로드, 기능 등 사용문의를 남겨주세요.
신속하고 친절한 상담을 통해 사용자들의 궁금증에 답변해 드립니다.
[email protected] http://rexsoft.org