딥러닝을 11번가 영상 검색에 활용한 경험 공유

41
딥러닝 활용 11번가 검색 상용화에 적용 경험 공유 SK Planet, Machine Intelligence Lab, 전혁준

Transcript of 딥러닝을 11번가 영상 검색에 활용한 경험 공유

Page 1: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

딥러닝 활용 11번가 영상 검색 상용화에 적용

한 경험 공유

SK Planet, Machine Intelligence Lab, 전혁준

Page 2: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

이름: 전혁준

탄생일: 19XX년으로 추정

2012~2016(현재) SK플래닛 매니저아직 회고할 시기는 아님...

2011~2012 한국항공우주연구원 , 박사후아리랑 3호 영상검보정팀특수한 영상을 많이 만져보고 나랏일에 도움이 된다는 자부심을 가진 시절...

2005~2011 충남대학교 컴퓨터공학과 석사/박사 학위(지도교수님 : 황치정)많은 것을 해본 시절...

2004 (주)엠게임보드 게임 서버 및 클라이언트 개발 담당사고도 많이 쳤던 시절...개인적으로 벤처하고 싶어서 뛰처 나왔음…젊어서 아쉽지만 짧게 다녔음…그러나 현실은 달랐음 T_T

2004 우송대학교 컴퓨터과학과 학사

전공: 컴퓨터 비전, 패턴 인식, 영상 검색사용 가능 언어: C++/Python/Golang/Lua취미: 매년 달라 짐결혼: 사랑하는 와이프가 있음.

Page 3: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

비슷한 이미지 검색의 목적

소비자 관심 > 노출 > 구매

Page 4: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

패션 옷!

Page 5: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

탐색(아이쇼핑)

가격비교

장바구니 담기

주문/결재

배달

구매 패턴

Page 6: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

탐색 구간에 집중!

11번가에 많은 상품!

Page 7: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

기존 텍스트 기반

1. 강점a. 대중성 b. 품번 검색c. 키워드 검색d. 검색 대상이 넓음

2. 단점a. 판매자 키워드 조작b. 시각적인 특징 검색이 부족함.

영상 기반 검색

1. 강점a. 판매자의 조작 행위가 어려움 → 영상 자체에서 텍스트 추출

b. 시각적인 특징 부분을 채워줌.

2. 단점a. 참조 사진이 있어야 함.b. 품번 검색을 못함.

Page 8: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

효과적으로 비슷한 것을 잘 찾자!

많은 판매 영상

텍스트에서 표현(x) → 시각 정보를 활용하여

Page 9: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

탐색(아이쇼핑)

추천 가격비교

질의 추천

Page 10: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

비슷한 상품 v.s.

동일 상품

아이 쇼핑 v.s.

가격 비교

Page 11: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

Deep Learning 적용

Page 12: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

Deep Learning 브랜드 11에 적용 사례

Page 13: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

2014.1 2015.122015.1

4월

Deep Learning 기술 활용 브랜드11

- Detector 개선이 필요- 상품만 보는 detector

- 학습 라벨링 데이터 필요(현재 기계학습의 한계!)- 많은 종류의 상품 검출 필요

- 수공업으로 설계하기에는 힘듬.

- Feature 개선 필요- 더 추상적인 시각정보를 담고있는 feature

- 학습 라벨링 데이터 필요(현재 기계학습의 한계!)

Page 14: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

Deep Learning 적용(검출기)

Page 15: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

학습 데이터 생성

기계 학습은 인간을 모방이 목표

모방 가능한 데이터 생성

Page 16: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

데이터 구축 정책

Training Set Validation Set Test Set

(황금 비율)Training Set & Validation Set vs. Test Set:1. 7 : 32. 8(6:2) : 2 (Andrew Ng)

Training set: 모델의 인자를 최적화(학습) 하는 용도개수↑, 정확한 구축↓, 비용↓

Validataion set: 서로 다른 구조로 인자가 여러 개의 최적화된 모델들 중에서 최고로 좋은 것을 찾는 용도,

이 모델의 훈련을 go/stop 판단하는 용도개수↓, 정확한 구축↑, 비용↑

Test set: 잘 훈련한 모델의 성능을 평가하는 용도, 선택된 모델로 튜닝이 안된 셋.개수↓, 정확한 구축↑, 비용↑

Page 19: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

Deep Learning Object Detector

batch

Page 20: 딥러닝을 11번가 영상 검색에 활용한 경험 공유
Page 21: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

사람이 수작업으로 라벨링한 화면 Deep Learning으로 검출한 박스(부족한 부분도 학습하여 검출)11번가 패션 상품: 100만장 구축

Page 22: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

2015 SK Planet의 Deep Learning Object Detector

Page 23: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

Deep Learning 적용(Deep Learning Feature)

Page 24: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

Deep Learning Feature

- Inception Network(Googlenet)- Inception-Style Nework(SK Planet)

1000개의 category: http://image-net.org/challenges/LSVRC/2015/browse-synsets

Page 25: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

Inception Neural Network - GoogleNet

- Oversampling- Average Pooling Feature- Binary Feature- Hamming Distance

0101∙∙∙0001001

22-Layers

Page 26: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

Dense-HOG Feature(Handcrafted Feature)

Dense-HOG Feature v.s. Deep Learning Feature

Page 27: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

Deep Learning Feature

Page 28: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

그러나기계는 비슷하다고 판단!사람의 직관과 맞지 않는 결

과들...

Page 29: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

옷깃의 주름을 보고 판단

목부위에 칼라의 주름을 보고

Page 30: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

옷의 벌어진 것의 모양을 보고 판단

칼라의 모양을보고 판단

Page 31: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

매듭을 보고 판단 하였음.

Page 32: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

피드백

Desen-HOG 보다 패턴 특성을 거리 함수에 잘 적용된다.

일부 내용의 비슷한 점이 거리에 크게 반영된다.

원래 인식기의 학습은 강인성 목표였음.

Feature 최적화 필요: 부분 → 전체 특성

Page 33: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

Deep Lerning Feature Extractor - SK Planet

- GoogleNet 개선(11번가 기획자 피드백 반영)- Inception-Style Network

- Multiscale- Dimension Reduction- Network size 제한

- Fully Convolutional Network- Oversampling (x)

Page 34: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

피드백

2015. 12. 전체적으로 기존(Dense-HOG)보다 좋다.

2016. 03. - 사람의 직관과 맞는 개선이 더 필요하다.- 입력 절차 간소화.

Page 35: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

데모

Page 36: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

내부 상품끼리 비슷한 이미지 검색(Detector+Feature)

Page 37: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

촬영 기반한 비슷한 상품 검색

Page 38: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

결 론

Page 39: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

Deep Learning으로 개선 측면

Detector 측면- 카테고리 개선:

- 7 카테고리(21.6%) → 90 카테고리(90%)- ROI 영역 정확성 개선

- 상반신 검출기(포즈에 집중) → 제품에 집중

Feature 측면- 패턴 성능 개선- Robustness 조절이 필요.

손으로 구현한 feature 개발이 많이 해소되었다.

Page 40: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

적용이 어려웠던 것이 Deep Learning으로 되더라…

집중도: How → What

관점의 전환

Feature Design 알고리즘 개발:

사람 → 기계학습 데이터 생성에 집중

(show me the money!)

Page 41: 딥러닝을 11번가 영상 검색에 활용한 경험 공유

배포

비즈니스 이해데이터 이해

데이터 준비

모델링

모델 평가

데이터 마이닝 프로세스

DATA