IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에...

17
데이터마이닝을 이용한 국내여행 만족도에 미치는 결정 요인 분석 임종덕,안재경 서울과학기술대학교 IT정책전문대학원 산업정보시스템 전공 [email protected], [email protected] 2018 춘계공동학술대회

Transcript of IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에...

Page 1: IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에 미치는 결정 요인 분석 종덕,안재경 서울과학기술대학교 IT정책전문대학원

데이터마이닝을 이용한 국내여행 만족도에 미치는 결정 요인 분석

임종덕,안재경

서울과학기술대학교 IT정책전문대학원 산업정보시스템 전공

[email protected], [email protected]

2018 춘계공동학술대회

Page 2: IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에 미치는 결정 요인 분석 종덕,안재경 서울과학기술대학교 IT정책전문대학원

목차

1 서론

2 이론적 고찰

3 연구 방법론(데이터마이닝)

4 국내여행 만족도에 미치는 결정 요인 분석

5 결론 및 향후 과제

Page 3: IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에 미치는 결정 요인 분석 종덕,안재경 서울과학기술대학교 IT정책전문대학원

1.서론(연구배경)

문화부문 국정과제와 ‘문화비전 2030’ 5개 추진과제 중 ‘관광산업 활성화’ 추진정책에 부합하고 국내 관광산업 증대 및 향후 관광수용태세 개선과 관광정책 수립에 기초자료 필요

만족도에 영향을 미치는 속성 변수를 파악

여행지별 여행지별 유형별 만족도, 여행평가를 조사

국내관광객의 여행 성향을 파악

연도별 변화추이를 비교.분석함

국내관광 활성화 및 향후 관광수용태세 개선

관광정책 수립의 기초자료를 제공

연구배경

Page 4: IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에 미치는 결정 요인 분석 종덕,안재경 서울과학기술대학교 IT정책전문대학원

1.서론(연구목적)

연구 목적

데이터마이닝 기법 의사결정나무 CART알고리즘을 이용

국내여행만족도에 미치는 결정 요인을 도출

요인들 간의 상호작용 패턴을 분석

여행 유형, 특성별, 연도별 변화 추이,성향 파악

본 논문의 목적은 국내여행 관광 데이터를 분석하여 관광산업에서

인바운드 국내관광객에 대한 이해를 높이고, 이에 맞는

마케팅인사이트를 도출하고자 하고자 한다.

Page 5: IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에 미치는 결정 요인 분석 종덕,안재경 서울과학기술대학교 IT정책전문대학원

2.이론적고찰(관련연구)

연구자 설명

우은주, 김혜린(2013) 관광객의 여행경험의 지각된 가치, 여행만족도 (Satisfaction) 그리고 삶의 만족도 (Quality of Life)의 관련성을 실증 분석

장양례, 윤유식, 박노현 (2008) 문화목적지 선택속성 추출과 집단별 시장세분화를 통해 문화목적지 선택속성과 여행만족도와의 영향관계 및 차이를 비교

한지숙(2014) 여행활동의 건강 기여 요인의 탐색 및 여행만족과의 관계 내국인 국내 여행자를 대상으로 여행활동의 건강기여 요인의 탐색과 동시에 이들요인이 여행만족과 어떠한 관계를 갖고 있는지 분석

이정원, 홍수희(2017) 여행행태에 따른 지출과 여행만족 차이에 관한 연구, 국내와 해외를 여행하는 여행객들의 여행행태에 따른 지출과 여행만족 차이

권태일, 노선희(2017)

외래관광객 실태조사 데이터를 가지고 로지스틱 회귀분석을 통해 중국과 일본 관광객의 재방문의도에 영향을 미치는 세부요인, 한국관광에 대해 갖는 만족도 및 재방문의도 간의 관계성을 알아보는 것은 매우 의미가 있는 연구

김태형(2017)

서울의 관광환경을 고려하여 외래관광의 품질을 결정하는 속성들이 전반적 만족도 충성도, 이미지 형성에 어느 정도 기여하는지 상대적 가중치를 도출하고, 가중치에 비해 성과가 낮은 전략부문을 파악한 후 이 부분에 영향을 미치는 관광객 특성을 밝히는 데 있다. 이를 위해 2015년 외래관광객 실태조사 서울표본에 부분최소제곱 구조방정식모형을 적용하여 음식·쇼핑·관광지 매력도가 중요도가 높은 변수임을 도출하였다.

강소라, 방정혜, 김민선(2017)

한국을 방문한 외래관광객을 대상으로 숙박, 쇼핑, 음식, 교통에 대한 지출과 만족도 및 재방문 의도 간의 영향 관계를 분석하고, 일본, 중국, 동남아, 미주, 및 유럽관광객들 간에 어떤 차이가 있는지를 탐색하였다. 연구는 2015년 외래관광객 실태조사 결과 데이터를 활용하여 AMOS를 이용한 구조방정식을 통하여 분석

본 논문은 만족조 조사 분석 결과에 근거하여 여행 만족도(독립변수)와 그외 주요 여행 조사항목(설명변수)들간의 관계성을 분석하는 국내 여행 유형별 만족도 속성에 따라 선호하는 여행 성향을 살펴봄으로써 주요 요인을 밝혀보고자 한다. 본 연구는 여행지역별 향후 관광수용태세 개선과 관광정책 수립에 기초자료로 제공할 수 있다.

Page 6: IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에 미치는 결정 요인 분석 종덕,안재경 서울과학기술대학교 IT정책전문대학원

3.연구방법론(데이터마이닝)

데이터마이닝이란?

데이터마이닝의 중심 개념은 과거의 데이터(국내여행 실태조사)는 미래에 유용하게 쓰일 정보(관광정책 방향)를 포함하고 있다는 것이다.

데이터마이닝의 목표 기록(실태조사)으로부터 고객 니즈, 취향, 기호의 규칙들을 찾아 빛을 보게 하는 것으로 이들 데이터 내에 존재하는 관계, 패턴, 규칙 등을 탐색하고 찾아내어 유용한 지식을 추출하는 일련의 과정들이다.

다량의 데이터를 탐구(exploration)하고 분석(analysis)하여 의미있는 패턴이나 규칙을 찾아내는 것이다.

데이터마이닝으로 특정한 목표 필드를 설명하거나 분류(Classification)하는 기법으로 즉, 분류, 구별,

등급 등으로 새로 나타난 대상(object, record)의 특징들(features)을 조사하고, 사전에 정의된 분류

(class) 집합에 할당하거나 클래스들에 대한 사전에 명확한 정의가 존재하며, 미리 분류된 예들로 구

성된 훈련 집합(predefined set of classes)을 가지고 있다.

분류 작업의 특징으로 클래스(만족도 항목)에 대한 사전에 명확한 정의가 존재하고 미리 분류된 예

들로 구성된 훈련 집합(training set)을 통해 분류 작업의 목적과 분류되는 않은 데이터에 적용되어

분류할 수 있도록 해주는 모형(model)을 만드는 것이다.

데이터마이닝(DM) 도구들은 이러한 과거 레코드들에 적용되어 미래의 고객들에게 더 좋은 서비스를

제공할 수 있도록 고객들에 대한 학습을 지원하고 데이터는 새로운 핵심적인 프로세스의 중심에서

탐색적 데이터에 대한 흥미로운 패턴발견이 가능하다.

데이터-> 정보->행동->가치 단계로 나타낼 수 있다.

Page 7: IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에 미치는 결정 요인 분석 종덕,안재경 서울과학기술대학교 IT정책전문대학원

다양한 형태, 포맷 데이터에서 적절한 데이터 원천을 찾아내고 그들을 집합시키는 것이 주요한 성공 요인

데이터 수집 및 전처리 데이터 분석 방법 데이터 분석 설계 데이터 요인 분석

3.연구방법론(분석설계)

Page 8: IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에 미치는 결정 요인 분석 종덕,안재경 서울과학기술대학교 IT정책전문대학원

3.연구방법론(CART 알고리즘)

Page 9: IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에 미치는 결정 요인 분석 종덕,안재경 서울과학기술대학교 IT정책전문대학원

4.데이터마이닝(데이터 대상 및 정의)

데이터 정의

대상 : 만 15세 이상 6,309명, 여행기록부 또는 온라인

여행기록부(자기기입법)

조사내용

- 여행실태(여행목적, 여행시기, 숙박/당일여행)

- 여행소비실태(지출비용, 여행상품)

- 여행 평가(여행소감, 여행 항목별 만족도)

Page 10: IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에 미치는 결정 요인 분석 종덕,안재경 서울과학기술대학교 IT정책전문대학원

4.데이터마이닝( 데이터 전처리 과정)

<여행실태조사 자료> - 응답자 : 6,309명 - 응답항목 : 240여개 이상 - 복수응답: 16,625

Page 11: IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에 미치는 결정 요인 분석 종덕,안재경 서울과학기술대학교 IT정책전문대학원

4.데이터마이닝(데이터 마스터 테이블)

설명변수 속성 변수값 가구원번호 연속 예)1000101, Numeric

성별 명목 1: 남성 2: 여성

연령 명목 예)25, Numeric

거주시도 명목 1.서울 2. 부산 3. 대구 4. 인천 5. 광주 6. 대전…..16. 제주

직업별 명목 1. 관리자 2. 전문가 및 관련 종사자 3. 사무 종사자 4. 서비스 종사자…10. 군인…14. 대학생

학력 명목 1. 안받았음 2. 초등학교 3. 중학교 4. 고등학교 5. 대학교(4년제미만)6. 대학교(4년제이상) 7. 대학원석사과정8. 대학원박사과정9. 모름/무응답

여행한 지역 명목 1.서울 2. 부산 3. 대구 4. 인천 5. 광주 6. 대전…..16. 제주

Page 12: IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에 미치는 결정 요인 분석 종덕,안재경 서울과학기술대학교 IT정책전문대학원

4.데이터마이닝(데이터 모델 구성)

연구 목적

사용툴 : SPSS Modeler 18.0

모델링 방법 : CART 알고리즘

분석대상(목표변수)

국내여행

전반적 만족도 분석

국내여행 항목별 만족도

분석

데이터 수 : 6,309개

설명변수 : 인구통계학적 정

보를 포함한 16개

Page 13: IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에 미치는 결정 요인 분석 종덕,안재경 서울과학기술대학교 IT정책전문대학원

4.데이터마이닝(데이터 모델링)

사용툴 : SPSS Modeler 18.0 모델링 절차 1. 유형분류 2. 훈련용/테스트용 데이터 분류(70:30) 3. 데이터 불균형 해소(Oversampling) 4. 모델적용

모델링 절차

Page 14: IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에 미치는 결정 요인 분석 종덕,안재경 서울과학기술대학교 IT정책전문대학원

4.데이터마이닝(데이터 검증)

정확도(precision) : 96%

정분류율(accuracy) : 64%

Page 15: IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에 미치는 결정 요인 분석 종덕,안재경 서울과학기술대학교 IT정책전문대학원

4.데이터마이닝(요인분석:전체 만족도)

여행 전체 만족도에 가장 영향을 미치는 설명변수 타인추천의향 도출

여행지 추천 시 재방문 의향이 높다는 것은 그 만큼 여행만족도가 높다는 것

78.6%가 교통수단이 중요하며, 자가용, 철도, 고속/시외버스 순으로 만족도가 높은 것으로 분석

교통 접근성이 좋을수록 여행지 재방문 의향이 있다는 것

여행지 선택이유로는 여행지 지명도, 볼거리 제공, 저렴한 여행경비,쇼핑, 음식 순으로 만족도에 영

향을 미치는 것으로 분석되었으며, 이동거리는 중요하지 않았다.

Page 16: IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에 미치는 결정 요인 분석 종덕,안재경 서울과학기술대학교 IT정책전문대학원

4.데이터마이닝(요인분석:항목별 만족도)

관광지 혼잡도 관광지 편의시설

관광지 편의시설 자연경관

관광지 편의시설 관광지 혼잡도

Page 17: IT정책전문대학원 - Amazon S3...데이터마이닝을 이용한 국내여 만족도에 미치는 결정 요인 분석 종덕,안재경 서울과학기술대학교 IT정책전문대학원

5.결론 및 향후과제

실태조사 자료를 활용하여 전처리 과정을 거쳐 전체만족도와 항목별 만족도를 구분하여 국내여행에 대해

여행객들의 만족도를 높이기 위한 결정요인을 밝혀내고 만족도에 미치는 결정요인들이 결국 국내여행 만족

과 관광 활성화에 영향을 미친 주요 요인임을 제시

여행지역별 여행만족도를 분석하고 여행 평가요소(여행지 선택이유, 교통수단, 숙박, 여행활동, 여행 소비

행태)를 상세 분석하였으며, 전반적 만족도의 가장 큰 결정요인은 재방문 의향, 타인 추천의향 등으로 분석

본 연구는 국민여행 실태조사 만족도와 주요 설명변수를 추출하여 국내 관광객 만족도에 미치는 여행 속성

을 제시하고 그 속성들에 대해 여행 만족도에 미치는 영향도를 분석했다는 점에서 의미

☞ 본 연구는 국민여행실태조사 자료를 분석하여 파악한 여행만족도와 이용에 영향을 미치는 인자들 중 정책

적 활용성이 있는 항목을 제시하고 분석함으로써 향후 국내 지역별 관광수용태세 개선과 관광정책 수립에

기초자료로 활용될 것이라 기대

국내여행 만족도 항목별로 평가요소(여행시기, 숙박여부, 여행목적, 여행정보 획득/참고한 사이트 방법, 여

행 동행자유형, 여행비용, 사전예약 유형, 여행상품 구매 및 유형)에 따라 만족도 결정요인 분석 가능