Rex 기초 - Seoul National Universityhosting03.snu.ac.kr/~hokim/int/2019/Rex201903.pdf ·...

55
Contents Make Analysis Fast and Easy Rex 기초 Rex 소개 및 설치 Rex 기초 엑셀을 활용한 랜덤 샘플링 이보라 (렉스소프트)

Transcript of Rex 기초 - Seoul National Universityhosting03.snu.ac.kr/~hokim/int/2019/Rex201903.pdf ·...

Contents

M a k e A n a l y s i s F a s t a n d E a s y

Rex 기초

• Rex 소개 및 설치

• Rex 기초

• 엑셀을 활용한 랜덤 샘플링

이보라 (렉스소프트)

M a k e A n a l y s i s F a s t a n d E a s y

01

02

03

Rex 소개 및 설치

Rex 기초

엑셀을 활용한 랜덤 샘플링

M a k e A n a l y s i s F a s t a n d E a s y

01 Rex 소개 및 설치

http://rexsoft.org

01 Rex 소개 및 설치

통계분석 소프트웨어 비교

특징 Stata SPSS SAS R

학습난이도 중 하 상 상

사용 방법 클릭/

프로그래밍 클릭/

프로그래밍 프로그래밍 프로그래밍

데이터 처리 다양성 중 하 상 상

분석 기능 다양성 중 하 상 상

그래픽스 다양성 상 하 중 상

설치 비용 중 고가 고가 무료

4

http://rexsoft.org

01 Rex 소개 및 설치

R의 장단점

A key benefit of R is that it provides near instant availability of new and experimental methods created

by its user base — without waiting for the development/release cycle of commercial software. SAS

recognizes the value of R to our customer base…”

- Michael Gilliland, Product Marketing Manager SAS Institute

R의 장점

R 패키지 수 > 10,000

5

http://rexsoft.org

R의 단점

– 다양한 패키지 – 다양한 버그

– 체계적 관리 필요

– 통계, 전산에 대한 지식 필요

01 Rex 소개 및 설치

R의 장단점

6

http://rexsoft.org

Rex

– 다운로드: http://rexsoft.org

– 엑셀 인터페이스를 이용한

손쉬운 데이터 정리

– Point-and-click 방식을 활용한

손쉬운 데이터 분석

– R을 활용한 분석 모듈 구성

– 국내 통계 및 전산 전문가의

참여 및 개발

– 한글 데이터 완벽 지원

– WYSIWYG 지원

(What You See Is What You Get)

01 Rex 소개 및 설치

Rex란?

[ Rexsoft 홈페이지 ]

7

http://rexsoft.org

Rex 개발 언어

– Microsoft Visual Studio 2015

– Microsoft Visual Basic .NET

– Microsoft Visual Studio Tools for Office

01 Rex 소개 및 설치

Rex 설치

최소 컴퓨터 사양

– Windows 7 이상

– 32bit 혹은 64bit

– Microsoft Office 2013 이상

– R 3.4.0 이상

R 설치 순서

1 2 3 R

설치 R 패키지

설치

Rex 설치

1. R 설치: R v3.4.0 이상

2. R 패키지 설치

– R 관리자권한으로 실행

– source("http://goo.gl/ZNEFj1")

3. Rex 설치

8

렉스소프트 홈페이지( http://Rexsoft.org ) 방문 후 Register 클릭

1

2

3

4

Rex 다운로드

R 설치

R 패키지 설치

Rex 설치

클릭

렉스소프트 홈페이지 회원가입 (ID, 이름, 이메일, 비밀번호만 요청)

1

2

3

4

Rex 다운로드

R 설치

R 패키지 설치

Rex 설치

렉스소프트 홈페이지 로그인 ▶ 설치 ▶ 최신버전 설치

1

2

3

4

Rex 다운로드

R 설치

R 패키지 설치

Rex 설치

클릭

Rex 최신버전 클릭

1

2

3

4

Rex 다운로드

R 설치

R 패키지 설치

Rex 설치

클릭

약관 동의 후, 이름과 이메일 입력 ▶ 확인 및 다운로드 클릭

1

2

3

4

Rex 다운로드

R 설치

R 패키지 설치

Rex 설치

클릭

약관 동의 후, 이름과 이메일 입력 ▶ 확인 및 다운로드 클릭

1

2

3

4

Rex 다운로드

R 설치

R 패키지 설치

Rex 설치

클릭

이메일 확인 ▶ 최신버전 설치파일 다운로드

1

2

3

4

Rex 다운로드

R 설치

R 패키지 설치

Rex 설치

클릭

홍길동

1

2

3

4

Rex 다운로드

R 설치

R 패키지 설치

Rex 설치

처음 R을 설치하는 경우 이미 R이 설치된 경우

R 최신버전 다운로드 윈도우 프로그램 추가/제거

R 버전 확인

R 3.4.0 미만 R 3.4.0 이상

관리자 권한으로 실행/설치

R 최신버전 다운로드

관리자 권한으로 실행/설치

R 최신버전에서 R 패키지 설치 진행

R 패키지 설치 진행

R 최신버전 다운로드 (R 미러 사이트: http://healthstat.snu.ac.kr/CRAN )

R 설치 시, 32비트, 64비트는 자동적으로 선택되므로 변경하지 마세요.

R 3.4.0 미만 버전이 이미 설치된 경우, 이를 삭제하실 필요는 없으나, 가장 최근 설치된 R이 3.4.0 이상이어야 합니다.

R 실행하기

– R 아이콘 ▶ 마우스 우클릭 ▶ 관리자 권한으로 실행

– 64비트, 32비트 R 아이콘이 둘 다 있는 경우, 64비트 실행

R 패키지 설치

– R console 창에 다음 명령어 실행

source("http://goo.gl/ZNEFj1")

(Rex 다운로드 이메일의 4(3)의 명령어를 복사-붙여넣기-Enter)

– 다음 메시지가 보이면 R 패키지 설치가 잘 끝났음을 의미

!!! Installing R packages required for Rex was COMPLETED !!!

한꺼번에 300여개의 R 패키지를 다운받아 설치함. 때문에 인터넷이 원활한 곳에서 설치해야 함.

설치 중간, 에러가 나는 경우

명령어 source("http://goo.gl/ZNEFj1") 를 패키지 설치가 끝날 때까지 반복해서 재실행하면 됨.

Rex 재설치

1

2

3

4

Rex 다운로드

R 설치

R 패키지 설치

Rex 설치

엑셀 종료 확인 ▶ Rex 설치파일 압축해제 ▶ setup 우클릭 ▶ 관리자 권한으로 실행

다음 화면에서 설치 클릭

Rex 재설치 혹은 업데이트 하실 경우, R 패키지 설치 → Rex 설치 순으로 진해야 합니다.

1

2

3

4

Rex 다운로드

R 설치

R 패키지 설치

Rex 설치

클릭

클릭

Rex가 잘 설치된 경우

– 엑셀 실행 시, 다음과 같은 문구가 출력됨 「추가 기능 로드 중 Rex」

– 엑셀의 메뉴바에 Rex라는 탭이 생성됨

Rex 연결

– 연결 메뉴를 클릭하여, R과 연결되어야 분석 메뉴들이 활성화됨

– R과 연결된 경우 팝업 메세지 출력됨 「R과 연결되었습니다」

1

2

3

4

Rex 다운로드

R 설치

R 패키지 설치

Rex 설치

클릭

Rex 정상 설치완료 시

나타나는 메뉴

http://rexsoft.org

설치 실패 1

– 「‘type’ 속성 값을 구문 분석할 수 없습니다 .」

라는 에러 메시지가 출력되며 설치에 실패하는

경우

[해결방법]

– 에러 메세지에 출력된 경로의

VSTOInstaller.exe.Config 파일 삭제

01 Rex 소개 및 설치

Rex 에러와 대처방법

설치 실패 2

– 「일반 설치 관리자 오류로 인해 다음 Microsoft

Office 솔루션을 설치할 수 없습니다.

Rex.vsto.」라는 에러 메시지가 출력되며 설치

에 실패하는 경우

[해결방안]

– Rex 설치파일 (setup.exe)을 관리자 권한으로

실행하여 설치

– 해결되지 않을 경우 재부팅 후 위 방법 재시도

– 재부팅 후에도 설치가 되지 않을 경우,

다음 링크로부터 닷넷 프레임워크 4.5 설치 후

위 방법 재시도

https://www.microsoft.com/ko-

kr/download/details.aspx?id=30653

20

http://rexsoft.org

설치 실패 3

– 「신뢰할 수 없는 인증서 메시지」 가 출력되며

설치에 실패하는 경우

[해결방법]

① 에러메세지 경로의 VSTOInstaller.exe.Config 파일 삭제

② Rex 설치파일 (setup.exe) 마우스 우클릭 → 속성 → 디지털 서명

③ 자세히 → 인증서 보기 → 인증서 설치

④ 현재 사용자 → 모든 인증서를 다음 저장소에 저장

⑤ 찾아보기 → 신뢰할 수 있는 루트 인증기관 선택 → 마침

⑥ 이후 재설치

01 Rex 소개 및 설치

Rex 에러와 대처방법

21

http://rexsoft.org

설치 실패 4

– 「MSVCR100.dll이 없어 프로그램을 시작할 수 없습니다」 가 출력되며

설치에 실패하는 경우

[해결방법]

① Visual Studio C++ 2010 재배포 가능 패키지 설치

32비트 운영체제: http://www.microsoft.com/download/en/details.aspx?id=5555

64비트 운영체제: http://www.microsoft.com/download/en/details.aspx?id=14632

② 이후 재설치

01 Rex 소개 및 설치

Rex 에러와 대처방법

22

http://rexsoft.org

설치 실패 5

– 「참조된 어셈블리가 시스템에 설치되지 않았습니다」 가 출력되며 설치에 실패하는 경우

[해결방법]

① 윈도우키+R 눌러 실행 띄운 후 %UserProfile%\AppData\Local\Apps 엔터 후 이동하여 하위 디렉토리

삭제

② 레지스트리 에디터 (윈도우키+R 눌러 실행 띄운 후 regedit) 띄운 후

HKEY_CURRENT_USER\Software\Microsoft\Office\Excel\Addins 이동하여 Rex 삭제

③ HKEY_CURRENT_USER\Software\Microsoft\VSTA\Solutions 이동하여

하위 폴더 중 Rex 값을

포함하는 디렉토리 삭제

01 Rex 소개 및 설치

Rex 에러와 대처방법

23

http://rexsoft.org

R과 연결 실패

– 설치는 잘 되었으나, 「R과 연결될 수 없습니다.」 라는 에러 메지시가 출력되는 경우

[해결방법]

① R 관리자 권한으로 실행

② R console 창에서 source(http://goo.gl/ZNEFj1) 수행 후 재시도

만약 해결되지 않을 경우 백신 프로그램의 차단 문제

① 라이브러리 경로 : C:\Program Files\R\<R 버전>\library\에서 Rserve 디렉토리를 찾아서 삭제

② R을 관리자권한으로 실행한 후 R console 창에서 source(http://goo.gl/ZNEFj1) 재시도

③ 백신 홈페이지에 접속하여 화이트리스트로 Rserve를 등록해야 함.

01 Rex 소개 및 설치

Rex 에러와 대처방법

24

http://rexsoft.org

엑셀에서 Rex 메뉴가 이탈하는 경우

– 엑셀의 메뉴바에 Rex 메뉴탭이 생성되지 않는 경우

[해결방법 (일회성)]

– 엑셀의 다음 메뉴를 순서대로 클릭함

파일 옵션 → 추가기능 → COM 추가기능 → 이동 → Rex 추가

– 위 방법은 엑셀을 실행하여 Rex를 실행하기를 원할 때마다 반복해야 하는 단점이 있음.

01 Rex 소개 및 설치

Rex 에러와 대처방법

1

2

3

5

4

25

http://rexsoft.org

엑셀에서 Rex 메뉴가 이탈하는 경우

– 엑셀의 메뉴바에 Rex 메뉴탭이 생성되지 않는 경우

[해결방법 (영구적)]

– 다음 순서대로 진행

Rex 제거 → 컴퓨터 재부팅 → Rex 설치

– 위 방법으로 해결되지 않을 경우 다음 순서대로 진행

엑셀 제거 → Rex 제거 → 컴퓨터 재부팅 → 엑셀 설치 → Rex 설치

01 Rex 소개 및 설치

Rex 에러와 대처방법

26

M a k e A n a l y s i s F a s t a n d E a s y

02 Rex 기초

http://rexsoft.org

02 Rex 기초

Rex 분석의 흐름

• WYSIWYG 방식 : Excel에서 준비한 자료를 R로 그대로 분석 가능함.

• R 코드 작성 필요 없이 분석에 필요한 모든 것을 UI 상에서 입력 가능함.

내 자료에서 R 분석 결과까지

자료 준비 자료 전송

분석 설정 분석 요청

분석 결과

28

http://rexsoft.org

데이터 구성

1. 각 변수의 이름

– 첫 행은 각 변수의 이름으로 구성되어야 함.

– 첫 행이 공백으로 되어 있는 경우,

해당 변수의 관측값은 분석에서 제외됨.

– 변수 명은 반드시 영문으로 시작해야 하며,

숫자는 영문 뒤에 따라올 수 있음.

또한 특수문자는 변수명에 사용할 수 없음.

2. 결측값

– 공백, NA

– #NUM!, #VALUE!, #N/A

#REF!, #NAME?, #DIV/0!

#NULL!

02 Rex 기초

Rex 데이터 준비하기

[ 변수 이름 ]

[ 결측값 ]

29

http://rexsoft.org

02 Rex 기초

Rex 데이터 준비하기

• 엑셀 데이터를 R의 object로 변환하여 저장할 수 있음.

• 저장된 R object의 이름은 rexdata이며 R을 실행하여 확인 가능함.

R 데이터로 저장

클릭

30

http://rexsoft.org

확률분포

– Rex는 13개의 연속형 확률분포, 5개의 이산형 확률분포를 지원함

02 Rex 기초

Rex 기능 소개

정규분포 t 분포 카이제곱분포 지수분포 F 분포

베타분포 코쉬분포 균등분포

로그정규분포 감마분포 와이블분포

로지스틱분포 굼벨분포

이항분포 포아송분포 기하분포

초기하분포

음이항분포

31

http://rexsoft.org

랜덤샘플링

– 확률분포로부터 랜덤 샘플링을 수행할 수 있음.

– 샘플링 순서 : 엑셀에서 블록 지정 ▶ 분포 선택 ▶ 모수 설정 및 실행

(샘플링 수는 지정한 영역에 따라 자동 지정)

02 Rex 기초

Rex 기능 소개

[ 정규분포 랜덤샘플링 예 ]

32

http://rexsoft.org

다양한 분석 모듈

02 Rex 기초

Rex 기능 소개

33

기술 통계

그룹비교 회귀분석 상관 분석

범주형 자료분석

분류 분석

차원 축소

시계열 분석

생존분석 비모수분석 메타분석

데이터요약

평균비교

일표본 t검정/z검정

선형 회귀분석

상관 분석

분할표 분석

비지도학습

K-평균 군집

요인 분석

시계열 자료탐색

생명표

위치 문제

1-표본 연속형 (단일집단)

메타분석

독립표본

t검정/z검정 가중선형회귀분석

편상관 로그선형

분석 계층적 군집

대응일치분석

지수 평활법

Kaplan -Meier

2-독립 표본

연속형 (두 집단) 메타분석

짝진표본

t검정 편최소 제곱

거리 측도

DBSCAN

군집 주성분 분석

ARIMA 모형

Cox 비례위험모형

2-대응 표본

이분형 (단일집단) 메타분석

일변량

분산분석 포아송

회귀분석

PAM 군집

GARCH

모형

k-독립 표본

이분형 (두 집단) 메타분석

다변량

분산분석 이항자료 회귀분석

지도학습

의사결정 나무

k-대응 표본

상관관계 메타분석

비율비교

일표본 비율검정

다항자료 회귀분석

판별분석 분포 문제

1-표본 발생률

메타분석

이표본

비율검정 2-단계

최소제곱

K최근접 이웃기법

2-표본 진단검사 메타분석

분산비교

등분산 검정

반복측정회귀분석

SVM 런검정

일표본

분산검정 다변량

회귀분석

http://rexsoft.org

그래픽스

– 12가지 종류의 그래픽스 제공

– 그래프 제목, x/y축의 이름, 눈금 값, 범례 등 세밀

한 조정 가능

– 간단한 통계분석 결과를 그래프에 표시 가능

– 다양한 그래프를 조합하여 구성 가능

– 다양한 이미지 저장 형식 (png, tiff, jpeg등) 지원

02 Rex 기초

Rex 기능 소개

Index plot

Dot plot Histogram plot Density plot

Box plot

QQ plot Scatter plot Scattermatrix plot

XY plot

Mean plot Bar plot Pie plot 34

http://rexsoft.org

02 Rex 기초

Rex를 활용한 분석 예

기술통계량

– 예시 데이터

example_data.xlsx의 birth 시트

35

http://rexsoft.org

02 Rex 기초

Rex를 활용한 분석 예

기술통계량

html로 결과 저장 가능 결과창의 그림 및 표를 복사하려면 먼저 html로 저장된 파일을 이용할 것

바로가기 가능 각 분석 제목 추가 및 편집 가능

36

http://rexsoft.org

02 Rex 기초

Rex를 활용한 분석 예

결과창 정리하기: 방법 1

결과 창의 경우 이미지의 복사 및 저장 가능

• 복사 & 붙여넣기 방법

• 이미지는 복사 및 저장 버튼을 이용하여

복사/저장 가능

• 표의 경우 표를 지정한 뒤에 복사 및 붙여

넣기 (엑셀에 붙여넣는 것을 추천)

결과 창의 경우 이미지의 복사 및 저장 가능 복사를 원하는 표를 드래그 한 뒤에 복사할 것.

그림 복사하기

표 복사하기

37

http://rexsoft.org

02 Rex 기초

Rex를 활용한 분석 예

결과창 정리하기: 방법 2

• Html로 변환 후 doc로 변환하기

• HTML로 결과 저장 (예) res.html

• 온라인 프로그램을 활용한 HTML의 doc,

ppt, pdf 등으로 변환

(예시) 아래 온라인 변환 싸이트에 rex.html

업로드:

https://convertio.co/kr/html-doc/

결과파일을 res로 저장.

res.html 업로드

결과 저장하기

온라인 프로그램을 이용하여 변환하기

클릭 38

http://rexsoft.org

02 Rex 기초

Rex를 활용한 분석 예

온라인 프로그램을 활용한 변환 결과:

39

http://rexsoft.org

02 Rex 기초

Rex를 활용한 분석 예

결과창 정리하기: 방법 3

• Html로 변환 후 doc로 변환하기

• HTML로 결과 저장 (예) res.html

• MS워드에서 html 파일 불러오기

결과파일을 res로 저장.

결과 저장하기

MS워드에서 html 불러오기

40

M a k e A n a l y s i s F a s t a n d E a s y

03 엑셀을 활용한 랜덤 샘플링

41

http://rexsoft.org

03 엑셀을 활용한 랜덤 샘플링

Sampling method

표본추출

비확률표본추출 확률표본추출

편의 표본추출

판단 표본추출

할당 표본 추출

단순 임의추출

층화 임의추출

집락 추출

추출확률 사전정의

계통 추출

42

http://rexsoft.org

Simple random sampling

1. 새로운 열을 하나 만들어서 열 이름(random)을 지정한 뒤, 2번째 행에 “=rand()” 입력 후 enter를 누른다.

2. 자동 채우기를 통해 전체 데이터에 대해 난수를 생성한다.

03 엑셀을 활용한 랜덤 샘플링

단순임의추출

43

http://rexsoft.org

Simple random sampling

3. rand() 함수값이 지속적으로 변경되는 것을 막기 위해, 값을 복사하여 옆에 붙여 넣는다.

4. 정렬 기능을 통해 복사한 값을 오름차순으로 정렬한다.

03 엑셀을 활용한 랜덤 샘플링

단순임의추출

44

http://rexsoft.org

Simple random sampling

5. 정렬된 데이터의 위에서부터 추출하려는 개수만큼 행 기준으로 데이터를 선택한다.

03 엑셀을 활용한 랜덤 샘플링

단순임의추출

45

http://rexsoft.org

Stratified random sampling

1. 새로운 열을 하나 만들어서 열 이름(random)을 지정한 뒤, 2번째 행에 “=rand()” 입력 후 enter를 누른다.

2. 자동 채우기를 통해 전체 데이터에 대해 난수를 생성한다.

03 엑셀을 활용한 랜덤 샘플링

층화임의추출

46

http://rexsoft.org

Stratified random sampling

3. rand() 함수값이 지속적으로 변경되는 것을 막기 위해, 값을 복사하여 옆에 붙여 넣는다.

4. 정렬 기능을 통해 층화변수 > 복사한 값을 순차적으로 오름차순으로 정렬한다.

03 엑셀을 활용한 랜덤 샘플링

층화임의추출

47

http://rexsoft.org

Stratified random sampling

5. 정렬된 데이터에서 그룹별로 위에서부터 추출하려는 개수만큼 행 기준으로 데이터를 선택한다.

03 엑셀을 활용한 랜덤 샘플링

층화임의추출

48

http://rexsoft.org

Systematic sampling

1. 500명 중 50명을 계통추출 하고자 한다면, k=모집단크기/표본크기=500/50=10을 구한다. 1~9 중 임의의

숫자를 골라 그 뒤로 k번씩 건너뛰며 추출한다.

2. 새로운 열을 하나 만들어서 열 이름(random)을 지정한 뒤, 2번째 행에 “=rand()” 입력 후 enter를 누른다.

3. 자동 채우기를 통해 1~9번째 개체에 대해 난수를 생성한다.

03 엑셀을 활용한 랜덤 샘플링

계통추출

49

http://rexsoft.org

Systematic sampling

3. rand() 함수값이 지속적으로 변경되는 것을 막기 위해, 값을 복사하여 옆에 붙여 넣는다.

4. 정렬 기능을 통해 복사한 값을 오름차순으로 정렬한다.

03 엑셀을 활용한 랜덤 샘플링

계통추출

50

http://rexsoft.org

Systematic sampling

5. 계통추출을 시작할 시작점이 선택되면 다시 id를 기준으로 정렬한다.

03 엑셀을 활용한 랜덤 샘플링

계통추출

51

http://rexsoft.org

Systematic sampling

6. 시작점 옆 셀에 =mod( row() - 5, 50) 입력 후 enter를 누른다.

03 엑셀을 활용한 랜덤 샘플링

계통추출

52

http://rexsoft.org

Systematic sampling

7. 해당 열에서 필터기능을 통해 0에 해당하는 데이터를 선택한다.

03 엑셀을 활용한 랜덤 샘플링

계통추출

53

실습 http://rexsoft.org

1. 다음 상황에 대해 랜덤 샘플링을 수행한 데이터를 출력하여 워드파일로 제출하시오.

1) birth 데이터에서 10명을 랜덤 추출하시오.

2) birth 데이터에서 저체중 출생 여부에 따라 층별로 5명을 랜덤 추출하시오.

• 저체중 출생 여부 (lowbw) : 0=normal / 1=low birthweight

3) birth 데이터에서 10명을 계통 추출하시오.

2. 1의 1)에 추출된 데이터 10명에 대해 기술통계량 표를 작성하시오.

– 질적변수 : 저체중출생(lowbw), 조산여부(preterm), 산모고혈압여부(hyp), 신생아성별(sex)

– 양적변수 : 출생체중(bweight), 재태주수 (gestwks), 산모나이 (matage)

54

Rex 특강

과제

문의

M a k e A n a l y s i s F a s t a n d E a s y

홈페이지 ‘질문과 답변’ 게시판을 통해 Rex 설치, 다운로드, 기능 등 사용문의를 남겨주세요.

신속하고 친절한 상담을 통해 사용자들의 궁금증에 답변해 드립니다.

[email protected] http://rexsoft.org