모두의 알파고
-
Upload
donghun-lee -
Category
Technology
-
view
22.028 -
download
0
Transcript of 모두의 알파고
시작하면서
•많은분들이 “알파고”를더잘이해하시는데도움이되고자• 최대한노력했습니다
• 피드백환영합니다
• 스스로가다음에해당된다면,• 컴퓨터프로그래머
• 빅데이터전문가
• 딥러닝전문가
• 강화학습전문가
• 이미다알고계신내용일수도있습니다
3/14/2016 모두의알파고 © 2016 이동헌 2
목차
•알파고약력등인적사항
•알파고 – 이세돌9단의대국
•알파고본체의정체와대국실상
•알파고소프트웨어의정체
•알파고는어떻게훈련되었나?
•알파고는 (당연하지만) 사람이아닙니다
•알파고의무엇이새로운것인가요?
3/14/2016 모두의알파고 © 2016 이동헌 3
목차
•알파고약력등인적사항
•알파고 – 이세돌9단의대국
•알파고본체의정체와대국실상
•알파고소프트웨어의정체
•알파고는어떻게훈련되었나?
•알파고는 (당연하지만) 사람이아닙니다
•알파고의무엇이새로운것인가요?
3/14/2016 모두의알파고 © 2016 이동헌 4
알파고약력
•출생• 2014~2015년경, Google Deepmind 회사,알파고팀
•컴퓨터와의전적• 2015년기준 5종의유명바둑프로그램들을상대로 495전 494승
•세계최초기록• 프로바둑기사상대로호선바둑공식전승리 (5경기모두승리)
• 프로바둑기사 9단상대로호선바둑공식전중 1경기이상승리 (진행중)• 호선바둑: 접바둑이아닌, 맞바둑의공식용어입니다
3/14/2016 모두의알파고 © 2016 이동헌 5
알파고팀
•제작진 16명• 제작 1팀: Aja Huang, George van den Driessche, Ioannis Antonoglou, Marc
Lanctot, Arthur Guez, Thore Graepel, David Silver
• 제작 2팀: Chris J. Maddison, Arthur Guez, Laurent Sifre, Aja Huang, IoannisAntonoglou, Veda Panneershelvam, Sander Dieleman, Dominik Grewe, NalKalchbrenner, Ilya Sutskever, Koray Kavukcuoglu, David Silver
• 평가팀 Julian Schrittwieser, John Nham, Aja Huang, David Silver
•관리팀• David Silver, Madeleine Leach, Timothy Lillicrap, Thore Graepel, Koray
Kavukcuoglu, Demis Hassabis
3/14/2016 모두의알파고 © 2016 이동헌 6
목차
•알파고약력등인적사항
•알파고 –이세돌9단의대국
•알파고본체의정체와대국실상
•알파고소프트웨어의정체
•알파고는어떻게훈련되었나?
•알파고는 (당연하지만) 사람이아닙니다
•알파고의무엇이새로운것인가요?
3/14/2016 모두의알파고 © 2016 이동헌 7
알파고 –이세돌9단의대국
•총 5번, 서울에서시합예정• 3월 9, 10, 12, 13, 15일
•중국프로바둑제도를그대로가져옴• 호선바둑 (맞바둑), 흑 7집반공제
•시간은조금여유있게• 2시간, 1분초읽기 3회
3/14/2016 모두의알파고 © 2016 이동헌 8
알파고 –이세돌9단의대국전망 (경기전)
•한국• 이세돌 9단본인: 승리예측
• 전문가여론: 첫경기승리예측에는대개동의, 다음경기들은알수없음
• 일반여론: 이세돌 9단의승리예측
•외국• 트위터계정비공인투표 50:50 [링크]
• 비트코인도박사이트이세돌 9단승리에 51.7% (가중투표치) [링크]
• 독일웹사이트이세돌 9단승리에 69.7% [링크]
3/14/2016 모두의알파고 © 2016 이동헌 9
목차
•알파고약력등인적사항
•알파고 – 이세돌9단의대국
•알파고본체의정체와대국실상
•알파고소프트웨어의정체
•알파고는어떻게훈련되었나?
•알파고는 (당연하지만) 사람이아닙니다
•알파고의무엇이새로운것인가요?
3/14/2016 모두의알파고 © 2016 이동헌 10
알파고본체기계의정체
• 2015년기준• CPU 1202개, GPU 176개
• 참고로,• 가정용 PC 1대 = CPU 1개
• 게임용 1대 = CPU 1개+GPU 1개
3/14/2016 모두의알파고 © 2016 이동헌 13
알파고본체기계의정체
• 2015년기준• CPU 1202개, GPU 176개
• 참고로,• 가정용 PC 1대 = CPU 1개
• 게임용 1대 = CPU 1개+GPU 1개
•이번이세돌9단경기에는• “미국중서부지역에있는구글데이터센터”• 예를들면
• 자세한컴퓨터사양은미공개구글데이터센터자료사진
3/14/2016 모두의알파고 © 2016 이동헌 14
미국중서부어딘가의구글데이터센터
서울포시즌스호텔대국장
알파고대국의실상
이세돌 9단
현재바둑판
Aja Huang
구글데이터센터자료사진
상황파악
3/14/2016 모두의알파고 © 2016 이동헌 15
미국중서부어딘가의구글데이터센터
서울포시즌스호텔대국장
알파고대국의실상
이세돌 9단
현재바둑판
Aja Huang
구글데이터센터자료사진
다음수결정
3/14/2016 모두의알파고 © 2016 이동헌 16
미국중서부어딘가의구글데이터센터
서울포시즌스호텔대국장
알파고대국의실상
이세돌 9단
현재바둑판
Aja Huang
구글데이터센터자료사진
그대로실행
3/14/2016 모두의알파고 © 2016 이동헌 17
미국중서부어딘가의구글데이터센터
서울포시즌스호텔대국장
알파고대국의실상
이세돌 9단
현재바둑판
Aja Huang
구글데이터센터자료사진
3/14/2016 모두의알파고 © 2016 이동헌 18
목차
•알파고약력등인적사항
•알파고 – 이세돌9단의대국
•알파고본체의정체와대국상황
•알파고소프트웨어의정체
•알파고는어떻게훈련되었나?
•알파고는 (당연하지만) 사람이아닙니다
•알파고의무엇이새로운것인가요?
3/14/2016 모두의알파고 © 2016 이동헌 19
미국중서부어딘가의구글데이터센터
서울포시즌스호텔대국장
알파고소프트웨어의정체?
이세돌 9단
현재바둑판
Aja Huang
구글데이터센터자료사진
3/14/2016 모두의알파고 © 2016 이동헌 20
알파고바둑프로그램
알파고소프트웨어의정체
상대바둑기사다음수
예측프로그램
알파고의다음수
결정프로그램
바둑경기상황
유/불리분석
프로그램
바둑판미래예측시도
여러번미래예측후가장많이둔수로선택
현재바둑판
바둑판현상황인식프로그램이세돌 9단
현재바둑판그림에서지금상황을인식하자
3/14/2016 모두의알파고 © 2016 이동헌 21
알파고바둑프로그램
알파고소프트웨어의정체
상대바둑기사다음수
예측프로그램
알파고의다음수
결정프로그램
바둑경기상황
유/불리분석
프로그램
바둑판미래예측시도
여러번미래예측후가장많이둔수로선택
현재바둑판
바둑판현상황인식프로그램이세돌 9단
내가승리에얼마나가까운지생각해보자
3/14/2016 모두의알파고 © 2016 이동헌 22
알파고바둑프로그램
알파고소프트웨어의정체
상대바둑기사다음수
예측프로그램
알파고의다음수
결정프로그램
바둑경기상황
유/불리분석
프로그램
바둑판미래예측시도
여러번미래예측후가장많이둔수로선택
현재바둑판
바둑판현상황인식프로그램이세돌 9단
상대가먼저뒀으니이제내차례네.
현재대국상황에서볼때어디에둬야할까?
3/14/2016 모두의알파고 © 2016 이동헌 23
알파고바둑프로그램
알파고소프트웨어의정체
상대바둑기사다음수
예측프로그램
알파고의다음수
결정프로그램
바둑경기상황
유/불리분석
프로그램
바둑판미래예측시도
여러번미래예측후가장많이둔수로선택
현재바둑판
바둑판현상황인식프로그램이세돌 9단
내가여기두면상대방은어디에둘까?
3/14/2016 모두의알파고 © 2016 이동헌 24
알파고바둑프로그램
알파고소프트웨어의정체
상대바둑기사다음수
예측프로그램
알파고의다음수
결정프로그램
바둑경기상황
유/불리분석
프로그램
바둑판미래예측시도
여러번미래예측후가장많이둔수로선택
현재바둑판
바둑판현상황인식프로그램이세돌 9단
그러면내상황은? 그러면나는어디둘까?
3/14/2016 모두의알파고 © 2016 이동헌 25
알파고바둑프로그램
알파고소프트웨어의정체
상대바둑기사다음수
예측프로그램
알파고의다음수
결정프로그램
바둑경기상황
유/불리분석
프로그램
바둑판미래예측시도
여러번미래예측후가장많이둔수로선택
현재바둑판
바둑판현상황인식프로그램이세돌 9단
그다음은???
3/14/2016 모두의알파고 © 2016 이동헌 26
알파고바둑프로그램
알파고소프트웨어의정체
상대바둑기사다음수
예측프로그램
알파고의다음수
결정프로그램
바둑경기상황
유/불리분석
프로그램
바둑판미래예측시도
여러번미래예측후가장많이둔수로선택
현재바둑판
바둑판현상황인식프로그램이세돌 9단
다시처음으로돌아가서생각해보자.
만약내가다른곳에둔다면…?
3/14/2016 모두의알파고 © 2016 이동헌 27
알파고바둑프로그램
알파고소프트웨어의정체
상대바둑기사다음수
예측프로그램
알파고의다음수
결정프로그램
바둑경기상황
유/불리분석
프로그램
바둑판미래예측시도
여러번미래예측후가장많이둔수로선택
현재바둑판
바둑판현상황인식프로그램이세돌 9단
또다시한번더해보자
3/14/2016 모두의알파고 © 2016 이동헌 28
알파고바둑프로그램
알파고소프트웨어의정체
상대바둑기사다음수
예측프로그램
알파고의다음수
결정프로그램
바둑경기상황
유/불리분석
프로그램
바둑판미래예측시도
여러번미래예측후가장많이둔수로선택
현재바둑판
바둑판현상황인식프로그램이세돌 9단
여러번해봤는데역시이게제일많이해본거야. 이걸로가자.
3/14/2016 모두의알파고 © 2016 이동헌 29
알파고바둑프로그램
알파고소프트웨어의정체
상대바둑기사다음수
예측프로그램
알파고의다음수
결정프로그램
바둑경기상황
유/불리분석
프로그램
바둑판미래예측시도
여러번미래예측후가장많이둔수로선택
현재바둑판
바둑판현상황인식프로그램이세돌 9단
Aja Huang
3/14/2016 모두의알파고 © 2016 이동헌 30
미국중서부어딘가의구글데이터센터
서울포시즌스호텔대국장
알파고소프트웨어의정체
이세돌 9단
현재바둑판
Aja Huang
구글데이터센터자료사진
다음수결정
3/14/2016 모두의알파고 © 2016 이동헌 31
목차
•알파고약력등인적사항
•알파고 – 이세돌9단의대국
•알파고본체의정체와대국상황
•알파고소프트웨어의정체
•알파고는어떻게훈련되었나?
•알파고는 (당연하지만) 사람이아닙니다
•알파고의무엇이새로운것인가요?
3/14/2016 모두의알파고 © 2016 이동헌 32
알파고는어떻게훈련되었나?
•개인교습예제문제• 바둑판돌놓인상황을보여줄께
• 다음에바둑판어디에돌이놓일지맞춰봐?
• 이런문제를 3천만개먼저풀어봄
• 57% 맞추는상태까지도달
3/14/2016 모두의알파고 © 2016 이동헌 33
알파고는어떻게훈련되었나?
•연습대국은실전보다혹독하게• 실전룰 (7집반공제) 사용
• 한수두는데 2초로시간제한
•상대방은바로나자신• 옛날버전또는최신버전의알파고프로그램과시합
• 대국을통한경험으로자체프로그램버전업그레이드
3/14/2016 모두의알파고 © 2016 이동헌 35
알파고는어떻게훈련되었나?
•자신과의무한연습데쓰매치• 시합승률이제일높은버전이생존하는데쓰매치
• 연습은그만하라할때까지계속된다
• 1달에 1,000,000 시합완료• (사람이백만시합을해보려면약 10년이걸린다고합니다)
3/14/2016 모두의알파고 © 2016 이동헌 36
목차
•알파고약력등인적사항
•알파고 – 이세돌9단의대국
•알파고본체의정체와대국상황
•알파고소프트웨어의정체
•알파고는어떻게훈련되었나?
•알파고는 (당연하지만) 사람이아닙니다
•알파고의무엇이새로운것인가요?
3/14/2016 모두의알파고 © 2016 이동헌 37
알파고는사람이아닙니다
•막대한양의개인교습예제• 바둑판돌놓인상황을보고, 다음에어디에둘지맞춰봐?
• 이런문제를 3천만개풀어보고 57% 맞추는상태
•실전보다혹독한자신과의무한데쓰매치• 실전룰 (7집반공제) 사용 + 한수두는데 2초시간제한
• 1,000,000 시합완료 (1달만에)
• 과거의스스로와경기해서살아남은것이최종판 “알파고”
3/14/2016 모두의알파고 © 2016 이동헌 38
알파고는사람이아닙니다
•이영화와유사점이있지요• 기본기술부터스승에게배워나감
• 실전무한반복으로성장
• 절대강자스승에게도전
•알파고가더나은점이라면..• 수많은프로바둑기사에게서기본기를배움
• 실전무한반복해도옛일을잊어먹지않음
• 실전투입시에도지치지않음
• 감정이없는기계멘탈
3/14/2016 모두의알파고 © 2016 이동헌 40
알파고 –이세돌9단간단비교
알파고 이세돌 9단
최소 300대이상의컴퓨터 (추정) 물리적실체 인간 1명
위의컴퓨터를가동하는데들어가는전력
대국시소모품 1일대사량많이잡아도 2500kcal+ 커피
안가도됩니다 화장실 갈수있습니다
실패하면세이브&로드가능 컨디션조절 -
없습니다 피로도 쌓입니다
기계입니다 기억력 인간최고수준 (추정)
초당백만수이상 (추정) 다음수시뮬레이션능력 초당백만수는힘들것같습니다
기계는한눈같은거못팝니다 집중력 인간최고수준 (추정)
• 절대같은체급의경기가아닙니다
3/14/2016 모두의알파고 © 2016 이동헌 41
목차
•알파고약력등인적사항
•알파고 – 이세돌9단의대국
•알파고본체의정체와대국상황
•알파고소프트웨어의정체
•알파고는어떻게훈련되었나?
•알파고는 (당연하지만) 사람이아닙니다
•알파고의무엇이새로운것인가요?
3/14/2016 모두의알파고 © 2016 이동헌 42
알파고의무엇이새로운것인가요?
알파고바둑프로그램
상대바둑기사다음수
예측프로그램
알파고의다음수
결정프로그램
바둑경기상황
유/불리분석
프로그램
바둑판미래예측시도
여러번미래예측후가장많이둔수로선택
바둑판현상황인식프로그램
3/14/2016 모두의알파고 © 2016 이동헌 43
알파고의무엇이새로운것인가요?
1. 바둑기사들의실제기록을과외받을때효율적으로사용합니다
알파고바둑프로그램
상대바둑기사다음수
예측프로그램
알파고의다음수
결정프로그램
바둑경기상황
유/불리분석
프로그램
바둑판미래예측시도
여러번미래예측후가장많이둔수로선택
바둑판현상황인식프로그램
3/14/2016 모두의알파고 © 2016 이동헌 44
알파고의무엇이새로운것인가요?
1. 바둑기사들의실제기록을과외받을때효율적으로사용합니다
2. 바둑판미래예측을매우효율적인방법으로합니다
알파고바둑프로그램
상대바둑기사다음수
예측프로그램
알파고의다음수
결정프로그램
바둑경기상황
유/불리분석
프로그램
바둑판미래예측시도
여러번미래예측후가장많이둔수로선택
바둑판현상황인식프로그램
3/14/2016 모두의알파고 © 2016 이동헌 45
알파고의무엇이새로운것인가요?
1. 바둑기사들의실제기록을과외받을때효율적으로사용합니다
2. 바둑판미래예측을매우효율적인방법으로합니다
3. 상대바둑기사행동예측과현재경기상황분석에딥러닝을사용합니다
알파고바둑프로그램
상대바둑기사다음수
예측프로그램
알파고의다음수
결정프로그램
바둑경기상황
유/불리분석
프로그램
바둑판미래예측시도
여러번미래예측후가장많이둔수로선택
바둑판현상황인식프로그램
3/14/2016 모두의알파고 © 2016 이동헌 46
알파고의무엇이새로운것인가요?
1. 바둑기사들의실제기록을과외받을때효율적으로사용합니다
2. 바둑판미래예측을매우효율적인방법으로합니다
3. 상대바둑기사행동예측과현재경기상황분석에딥러닝을사용합니다
4. 위의과정을수많은컴퓨터에서동시에실행합니다
3/14/2016 모두의알파고 © 2016 이동헌 47
알파고의무엇이새로운것인가요?
1. 바둑기사들의실제기록을과외받을때효율적으로사용합니다
2. 바둑판미래예측을매우효율적인방법으로합니다
3. 상대바둑기사행동예측과현재경기상황분석에딥러닝을사용합니다
4. 위의과정을수많은컴퓨터에서동시에실행합니다
5. 스스로데쓰매치를통해더욱강해집니다
3/14/2016 모두의알파고 © 2016 이동헌 48
“프로그래머를위한알파고”
•각항목들을구체적으로다루어볼예정입니다
1. 바둑기사들의실제기록을과외받을때효율적으로사용합니다
2. 바둑판미래예측을매우효율적인방법으로합니다
3. 상대바둑기사행동예측과현재경기상황분석에딥러닝을사용합니다
4. 위의과정을수많은컴퓨터에서동시에실행합니다
5. 스스로데쓰매치를통해더욱강해집니다
3/14/2016 모두의알파고 © 2016 이동헌 49
요약
•알파고는복잡하고새로운바둑프로그램입니다
•알파고는컴퓨터수백대의능력을쏟아붓습니다
•알파고는혹독한훈련을통해실력을쌓을수있습니다
•알파고는경험을통해강해져가는프로그램입니다
•그래서더, 이세돌9단의승리를응원합니다
3/14/2016 모두의알파고 © 2016 이동헌 50
수고하셨습니다
•알파고의바둑에대해더자세한내용을알고싶으시다면• “바둑인을위한알파고” 를읽어주세요
•피드백/오류제보이메일이필요하시면여기로보내주세요• [email protected]
3/14/2016 모두의알파고 © 2016 이동헌 51