모두의 알파고

51
모두의 알파고 이동헌 [email protected]

Transcript of 모두의 알파고

모두의알파고

이동헌

[email protected]

시작하면서

•많은분들이 “알파고”를더잘이해하시는데도움이되고자• 최대한노력했습니다

• 피드백환영합니다

• 스스로가다음에해당된다면,• 컴퓨터프로그래머

• 빅데이터전문가

• 딥러닝전문가

• 강화학습전문가

• 이미다알고계신내용일수도있습니다

3/14/2016 모두의알파고 © 2016 이동헌 2

목차

•알파고약력등인적사항

•알파고 – 이세돌9단의대국

•알파고본체의정체와대국실상

•알파고소프트웨어의정체

•알파고는어떻게훈련되었나?

•알파고는 (당연하지만) 사람이아닙니다

•알파고의무엇이새로운것인가요?

3/14/2016 모두의알파고 © 2016 이동헌 3

목차

•알파고약력등인적사항

•알파고 – 이세돌9단의대국

•알파고본체의정체와대국실상

•알파고소프트웨어의정체

•알파고는어떻게훈련되었나?

•알파고는 (당연하지만) 사람이아닙니다

•알파고의무엇이새로운것인가요?

3/14/2016 모두의알파고 © 2016 이동헌 4

알파고약력

•출생• 2014~2015년경, Google Deepmind 회사,알파고팀

•컴퓨터와의전적• 2015년기준 5종의유명바둑프로그램들을상대로 495전 494승

•세계최초기록• 프로바둑기사상대로호선바둑공식전승리 (5경기모두승리)

• 프로바둑기사 9단상대로호선바둑공식전중 1경기이상승리 (진행중)• 호선바둑: 접바둑이아닌, 맞바둑의공식용어입니다

3/14/2016 모두의알파고 © 2016 이동헌 5

알파고팀

•제작진 16명• 제작 1팀: Aja Huang, George van den Driessche, Ioannis Antonoglou, Marc

Lanctot, Arthur Guez, Thore Graepel, David Silver

• 제작 2팀: Chris J. Maddison, Arthur Guez, Laurent Sifre, Aja Huang, IoannisAntonoglou, Veda Panneershelvam, Sander Dieleman, Dominik Grewe, NalKalchbrenner, Ilya Sutskever, Koray Kavukcuoglu, David Silver

• 평가팀 Julian Schrittwieser, John Nham, Aja Huang, David Silver

•관리팀• David Silver, Madeleine Leach, Timothy Lillicrap, Thore Graepel, Koray

Kavukcuoglu, Demis Hassabis

3/14/2016 모두의알파고 © 2016 이동헌 6

목차

•알파고약력등인적사항

•알파고 –이세돌9단의대국

•알파고본체의정체와대국실상

•알파고소프트웨어의정체

•알파고는어떻게훈련되었나?

•알파고는 (당연하지만) 사람이아닙니다

•알파고의무엇이새로운것인가요?

3/14/2016 모두의알파고 © 2016 이동헌 7

알파고 –이세돌9단의대국

•총 5번, 서울에서시합예정• 3월 9, 10, 12, 13, 15일

•중국프로바둑제도를그대로가져옴• 호선바둑 (맞바둑), 흑 7집반공제

•시간은조금여유있게• 2시간, 1분초읽기 3회

3/14/2016 모두의알파고 © 2016 이동헌 8

알파고 –이세돌9단의대국전망 (경기전)

•한국• 이세돌 9단본인: 승리예측

• 전문가여론: 첫경기승리예측에는대개동의, 다음경기들은알수없음

• 일반여론: 이세돌 9단의승리예측

•외국• 트위터계정비공인투표 50:50 [링크]

• 비트코인도박사이트이세돌 9단승리에 51.7% (가중투표치) [링크]

• 독일웹사이트이세돌 9단승리에 69.7% [링크]

3/14/2016 모두의알파고 © 2016 이동헌 9

목차

•알파고약력등인적사항

•알파고 – 이세돌9단의대국

•알파고본체의정체와대국실상

•알파고소프트웨어의정체

•알파고는어떻게훈련되었나?

•알파고는 (당연하지만) 사람이아닙니다

•알파고의무엇이새로운것인가요?

3/14/2016 모두의알파고 © 2016 이동헌 10

알파고의정체?

3/14/2016 모두의알파고 © 2016 이동헌 11

알파고의정체?

• 이사진에는알파고본체가없습니다

Aja Huang

이세돌 9단알파고화면(화상통화)

3/14/2016 모두의알파고 © 2016 이동헌 12

알파고본체기계의정체

• 2015년기준• CPU 1202개, GPU 176개

• 참고로,• 가정용 PC 1대 = CPU 1개

• 게임용 1대 = CPU 1개+GPU 1개

3/14/2016 모두의알파고 © 2016 이동헌 13

알파고본체기계의정체

• 2015년기준• CPU 1202개, GPU 176개

• 참고로,• 가정용 PC 1대 = CPU 1개

• 게임용 1대 = CPU 1개+GPU 1개

•이번이세돌9단경기에는• “미국중서부지역에있는구글데이터센터”• 예를들면

• 자세한컴퓨터사양은미공개구글데이터센터자료사진

3/14/2016 모두의알파고 © 2016 이동헌 14

미국중서부어딘가의구글데이터센터

서울포시즌스호텔대국장

알파고대국의실상

이세돌 9단

현재바둑판

Aja Huang

구글데이터센터자료사진

상황파악

3/14/2016 모두의알파고 © 2016 이동헌 15

미국중서부어딘가의구글데이터센터

서울포시즌스호텔대국장

알파고대국의실상

이세돌 9단

현재바둑판

Aja Huang

구글데이터센터자료사진

다음수결정

3/14/2016 모두의알파고 © 2016 이동헌 16

미국중서부어딘가의구글데이터센터

서울포시즌스호텔대국장

알파고대국의실상

이세돌 9단

현재바둑판

Aja Huang

구글데이터센터자료사진

그대로실행

3/14/2016 모두의알파고 © 2016 이동헌 17

미국중서부어딘가의구글데이터센터

서울포시즌스호텔대국장

알파고대국의실상

이세돌 9단

현재바둑판

Aja Huang

구글데이터센터자료사진

3/14/2016 모두의알파고 © 2016 이동헌 18

목차

•알파고약력등인적사항

•알파고 – 이세돌9단의대국

•알파고본체의정체와대국상황

•알파고소프트웨어의정체

•알파고는어떻게훈련되었나?

•알파고는 (당연하지만) 사람이아닙니다

•알파고의무엇이새로운것인가요?

3/14/2016 모두의알파고 © 2016 이동헌 19

미국중서부어딘가의구글데이터센터

서울포시즌스호텔대국장

알파고소프트웨어의정체?

이세돌 9단

현재바둑판

Aja Huang

구글데이터센터자료사진

3/14/2016 모두의알파고 © 2016 이동헌 20

알파고바둑프로그램

알파고소프트웨어의정체

상대바둑기사다음수

예측프로그램

알파고의다음수

결정프로그램

바둑경기상황

유/불리분석

프로그램

바둑판미래예측시도

여러번미래예측후가장많이둔수로선택

현재바둑판

바둑판현상황인식프로그램이세돌 9단

현재바둑판그림에서지금상황을인식하자

3/14/2016 모두의알파고 © 2016 이동헌 21

알파고바둑프로그램

알파고소프트웨어의정체

상대바둑기사다음수

예측프로그램

알파고의다음수

결정프로그램

바둑경기상황

유/불리분석

프로그램

바둑판미래예측시도

여러번미래예측후가장많이둔수로선택

현재바둑판

바둑판현상황인식프로그램이세돌 9단

내가승리에얼마나가까운지생각해보자

3/14/2016 모두의알파고 © 2016 이동헌 22

알파고바둑프로그램

알파고소프트웨어의정체

상대바둑기사다음수

예측프로그램

알파고의다음수

결정프로그램

바둑경기상황

유/불리분석

프로그램

바둑판미래예측시도

여러번미래예측후가장많이둔수로선택

현재바둑판

바둑판현상황인식프로그램이세돌 9단

상대가먼저뒀으니이제내차례네.

현재대국상황에서볼때어디에둬야할까?

3/14/2016 모두의알파고 © 2016 이동헌 23

알파고바둑프로그램

알파고소프트웨어의정체

상대바둑기사다음수

예측프로그램

알파고의다음수

결정프로그램

바둑경기상황

유/불리분석

프로그램

바둑판미래예측시도

여러번미래예측후가장많이둔수로선택

현재바둑판

바둑판현상황인식프로그램이세돌 9단

내가여기두면상대방은어디에둘까?

3/14/2016 모두의알파고 © 2016 이동헌 24

알파고바둑프로그램

알파고소프트웨어의정체

상대바둑기사다음수

예측프로그램

알파고의다음수

결정프로그램

바둑경기상황

유/불리분석

프로그램

바둑판미래예측시도

여러번미래예측후가장많이둔수로선택

현재바둑판

바둑판현상황인식프로그램이세돌 9단

그러면내상황은? 그러면나는어디둘까?

3/14/2016 모두의알파고 © 2016 이동헌 25

알파고바둑프로그램

알파고소프트웨어의정체

상대바둑기사다음수

예측프로그램

알파고의다음수

결정프로그램

바둑경기상황

유/불리분석

프로그램

바둑판미래예측시도

여러번미래예측후가장많이둔수로선택

현재바둑판

바둑판현상황인식프로그램이세돌 9단

그다음은???

3/14/2016 모두의알파고 © 2016 이동헌 26

알파고바둑프로그램

알파고소프트웨어의정체

상대바둑기사다음수

예측프로그램

알파고의다음수

결정프로그램

바둑경기상황

유/불리분석

프로그램

바둑판미래예측시도

여러번미래예측후가장많이둔수로선택

현재바둑판

바둑판현상황인식프로그램이세돌 9단

다시처음으로돌아가서생각해보자.

만약내가다른곳에둔다면…?

3/14/2016 모두의알파고 © 2016 이동헌 27

알파고바둑프로그램

알파고소프트웨어의정체

상대바둑기사다음수

예측프로그램

알파고의다음수

결정프로그램

바둑경기상황

유/불리분석

프로그램

바둑판미래예측시도

여러번미래예측후가장많이둔수로선택

현재바둑판

바둑판현상황인식프로그램이세돌 9단

또다시한번더해보자

3/14/2016 모두의알파고 © 2016 이동헌 28

알파고바둑프로그램

알파고소프트웨어의정체

상대바둑기사다음수

예측프로그램

알파고의다음수

결정프로그램

바둑경기상황

유/불리분석

프로그램

바둑판미래예측시도

여러번미래예측후가장많이둔수로선택

현재바둑판

바둑판현상황인식프로그램이세돌 9단

여러번해봤는데역시이게제일많이해본거야. 이걸로가자.

3/14/2016 모두의알파고 © 2016 이동헌 29

알파고바둑프로그램

알파고소프트웨어의정체

상대바둑기사다음수

예측프로그램

알파고의다음수

결정프로그램

바둑경기상황

유/불리분석

프로그램

바둑판미래예측시도

여러번미래예측후가장많이둔수로선택

현재바둑판

바둑판현상황인식프로그램이세돌 9단

Aja Huang

3/14/2016 모두의알파고 © 2016 이동헌 30

미국중서부어딘가의구글데이터센터

서울포시즌스호텔대국장

알파고소프트웨어의정체

이세돌 9단

현재바둑판

Aja Huang

구글데이터센터자료사진

다음수결정

3/14/2016 모두의알파고 © 2016 이동헌 31

목차

•알파고약력등인적사항

•알파고 – 이세돌9단의대국

•알파고본체의정체와대국상황

•알파고소프트웨어의정체

•알파고는어떻게훈련되었나?

•알파고는 (당연하지만) 사람이아닙니다

•알파고의무엇이새로운것인가요?

3/14/2016 모두의알파고 © 2016 이동헌 32

알파고는어떻게훈련되었나?

•개인교습예제문제• 바둑판돌놓인상황을보여줄께

• 다음에바둑판어디에돌이놓일지맞춰봐?

• 이런문제를 3천만개먼저풀어봄

• 57% 맞추는상태까지도달

3/14/2016 모두의알파고 © 2016 이동헌 33

알파고는어떻게훈련되었나?

•개인교습예제문제통과후,

•자체연습대국• 실전룰 (7집반공제) 사용

• 한수두는데 2초로시간제한

3/14/2016 모두의알파고 © 2016 이동헌 34

알파고는어떻게훈련되었나?

•연습대국은실전보다혹독하게• 실전룰 (7집반공제) 사용

• 한수두는데 2초로시간제한

•상대방은바로나자신• 옛날버전또는최신버전의알파고프로그램과시합

• 대국을통한경험으로자체프로그램버전업그레이드

3/14/2016 모두의알파고 © 2016 이동헌 35

알파고는어떻게훈련되었나?

•자신과의무한연습데쓰매치• 시합승률이제일높은버전이생존하는데쓰매치

• 연습은그만하라할때까지계속된다

• 1달에 1,000,000 시합완료• (사람이백만시합을해보려면약 10년이걸린다고합니다)

3/14/2016 모두의알파고 © 2016 이동헌 36

목차

•알파고약력등인적사항

•알파고 – 이세돌9단의대국

•알파고본체의정체와대국상황

•알파고소프트웨어의정체

•알파고는어떻게훈련되었나?

•알파고는 (당연하지만) 사람이아닙니다

•알파고의무엇이새로운것인가요?

3/14/2016 모두의알파고 © 2016 이동헌 37

알파고는사람이아닙니다

•막대한양의개인교습예제• 바둑판돌놓인상황을보고, 다음에어디에둘지맞춰봐?

• 이런문제를 3천만개풀어보고 57% 맞추는상태

•실전보다혹독한자신과의무한데쓰매치• 실전룰 (7집반공제) 사용 + 한수두는데 2초시간제한

• 1,000,000 시합완료 (1달만에)

• 과거의스스로와경기해서살아남은것이최종판 “알파고”

3/14/2016 모두의알파고 © 2016 이동헌 38

알파고는사람이아닙니다

•이영화와유사점이있지요• 기본기술부터스승에게배워나감

• 실전무한반복으로성장

• 절대강자스승에게도전

3/14/2016 모두의알파고 © 2016 이동헌 39

알파고는사람이아닙니다

•이영화와유사점이있지요• 기본기술부터스승에게배워나감

• 실전무한반복으로성장

• 절대강자스승에게도전

•알파고가더나은점이라면..• 수많은프로바둑기사에게서기본기를배움

• 실전무한반복해도옛일을잊어먹지않음

• 실전투입시에도지치지않음

• 감정이없는기계멘탈

3/14/2016 모두의알파고 © 2016 이동헌 40

알파고 –이세돌9단간단비교

알파고 이세돌 9단

최소 300대이상의컴퓨터 (추정) 물리적실체 인간 1명

위의컴퓨터를가동하는데들어가는전력

대국시소모품 1일대사량많이잡아도 2500kcal+ 커피

안가도됩니다 화장실 갈수있습니다

실패하면세이브&로드가능 컨디션조절 -

없습니다 피로도 쌓입니다

기계입니다 기억력 인간최고수준 (추정)

초당백만수이상 (추정) 다음수시뮬레이션능력 초당백만수는힘들것같습니다

기계는한눈같은거못팝니다 집중력 인간최고수준 (추정)

• 절대같은체급의경기가아닙니다

3/14/2016 모두의알파고 © 2016 이동헌 41

목차

•알파고약력등인적사항

•알파고 – 이세돌9단의대국

•알파고본체의정체와대국상황

•알파고소프트웨어의정체

•알파고는어떻게훈련되었나?

•알파고는 (당연하지만) 사람이아닙니다

•알파고의무엇이새로운것인가요?

3/14/2016 모두의알파고 © 2016 이동헌 42

알파고의무엇이새로운것인가요?

알파고바둑프로그램

상대바둑기사다음수

예측프로그램

알파고의다음수

결정프로그램

바둑경기상황

유/불리분석

프로그램

바둑판미래예측시도

여러번미래예측후가장많이둔수로선택

바둑판현상황인식프로그램

3/14/2016 모두의알파고 © 2016 이동헌 43

알파고의무엇이새로운것인가요?

1. 바둑기사들의실제기록을과외받을때효율적으로사용합니다

알파고바둑프로그램

상대바둑기사다음수

예측프로그램

알파고의다음수

결정프로그램

바둑경기상황

유/불리분석

프로그램

바둑판미래예측시도

여러번미래예측후가장많이둔수로선택

바둑판현상황인식프로그램

3/14/2016 모두의알파고 © 2016 이동헌 44

알파고의무엇이새로운것인가요?

1. 바둑기사들의실제기록을과외받을때효율적으로사용합니다

2. 바둑판미래예측을매우효율적인방법으로합니다

알파고바둑프로그램

상대바둑기사다음수

예측프로그램

알파고의다음수

결정프로그램

바둑경기상황

유/불리분석

프로그램

바둑판미래예측시도

여러번미래예측후가장많이둔수로선택

바둑판현상황인식프로그램

3/14/2016 모두의알파고 © 2016 이동헌 45

알파고의무엇이새로운것인가요?

1. 바둑기사들의실제기록을과외받을때효율적으로사용합니다

2. 바둑판미래예측을매우효율적인방법으로합니다

3. 상대바둑기사행동예측과현재경기상황분석에딥러닝을사용합니다

알파고바둑프로그램

상대바둑기사다음수

예측프로그램

알파고의다음수

결정프로그램

바둑경기상황

유/불리분석

프로그램

바둑판미래예측시도

여러번미래예측후가장많이둔수로선택

바둑판현상황인식프로그램

3/14/2016 모두의알파고 © 2016 이동헌 46

알파고의무엇이새로운것인가요?

1. 바둑기사들의실제기록을과외받을때효율적으로사용합니다

2. 바둑판미래예측을매우효율적인방법으로합니다

3. 상대바둑기사행동예측과현재경기상황분석에딥러닝을사용합니다

4. 위의과정을수많은컴퓨터에서동시에실행합니다

3/14/2016 모두의알파고 © 2016 이동헌 47

알파고의무엇이새로운것인가요?

1. 바둑기사들의실제기록을과외받을때효율적으로사용합니다

2. 바둑판미래예측을매우효율적인방법으로합니다

3. 상대바둑기사행동예측과현재경기상황분석에딥러닝을사용합니다

4. 위의과정을수많은컴퓨터에서동시에실행합니다

5. 스스로데쓰매치를통해더욱강해집니다

3/14/2016 모두의알파고 © 2016 이동헌 48

“프로그래머를위한알파고”

•각항목들을구체적으로다루어볼예정입니다

1. 바둑기사들의실제기록을과외받을때효율적으로사용합니다

2. 바둑판미래예측을매우효율적인방법으로합니다

3. 상대바둑기사행동예측과현재경기상황분석에딥러닝을사용합니다

4. 위의과정을수많은컴퓨터에서동시에실행합니다

5. 스스로데쓰매치를통해더욱강해집니다

3/14/2016 모두의알파고 © 2016 이동헌 49

요약

•알파고는복잡하고새로운바둑프로그램입니다

•알파고는컴퓨터수백대의능력을쏟아붓습니다

•알파고는혹독한훈련을통해실력을쌓을수있습니다

•알파고는경험을통해강해져가는프로그램입니다

•그래서더, 이세돌9단의승리를응원합니다

3/14/2016 모두의알파고 © 2016 이동헌 50

수고하셨습니다

•알파고의바둑에대해더자세한내용을알고싶으시다면• “바둑인을위한알파고” 를읽어주세요

•피드백/오류제보이메일이필요하시면여기로보내주세요• [email protected]

3/14/2016 모두의알파고 © 2016 이동헌 51