해외 AI와 미디어 융합 현황 데이터 분석·기사 작성은 기본, 가짜...

18

신문과 방송 2017. 03

특집

AI와 미디어 융합

손재권 ／ 매일경제신문 실리콘밸리 특파원

해외 AI와 미디어 융합 현황

데이터 분석·기사 작성은 기본,가짜 기사도 판별

뉴스통신사 AP에서 분사한 오토메이티드 인사이츠는 기사를 자동으로 작성하는 것을 넘어 아마존의 음성인식 인공지능 ‘알렉사(Alexa)’와 결합,

음성으로 인간과 대화할 수 있는 서비스도 개발 중이다. 알렉사와 로봇 저널리즘의 결합은 폭발적 잠재력을 가지고 있는 것으로 평가받고 있다.<저작권자 ©연합뉴스, 무단복제 및 무단사용 금지>

19

인공지능(AI) 기반 소프트웨어가 기사를 작성하는

소위 ‘로봇 저널리즘’은 지난 2~3년간 한국을 포함한

글로벌 미디어 지형을 흔들 만한 화두였다. 로봇

기자는 자체에 프로그램된 소프트웨어가 뉴스 작성에

필요한 데이터를 자동으로 수집해 다양한 형태의

기사를 만들어낸다. 뉴스통신사 AP는 로봇 기자가

생산한 뉴스를 공급하고 있으며 워싱턴포스트는

로봇 기자 ‘헬리오그래프(Heliograf)’가 지난해 열린

2016 리우 올림픽에서 개별 경기 결과에 대한 신속한

기사를 써서 호평을 받기도 했다.

2017년 들어 인공지능 기반

저널리즘은 큰 주목을

받지 못하고 있는데 이는 중요하지 않다거나

활용도가 떨어져서가 아니라 글로벌 미디어 지형에

이미 깊숙하게 파고들었기 때문이다. 로봇이 쓰는

기사는 이미 널리 퍼져 있어서 독자들이 사람이

썼는지 로봇이 썼는지 구분하지 못하는 단계에

도달했다. 미 대선에서 ‘가짜 뉴스’가 도널드 트럼프

대통령 당선에 적지 않은 영향을 미친 것으로

드러나면서 가짜 뉴스와 진실에 기반을 둔 뉴스를

구분해주는 인공지능 기술도 빠르게 발전하고 있다.

이제 인공지능과 미디어의 융합은 자동으로 기사를

작성한다는 것 이상의 결과물을 보여주고 ‘로봇

저널리즘 2.0’으로 진화하는 단계에 들어선 것이다.

이제 로봇이 기사를 작성하는 것은 놀랍지 않다.

이제는 ‘누구나’ 사용할 수 있는 정도의 플랫폼이

됐다. 로봇 저널리즘을 개척한 뉴스통신사 AP에서

분사한 오토메이티드 인사이츠는 자동 기사 작성

소프트웨어(SW) 워드스미스(Word Smith) 기술을

누구나 사용할 수 있도록 공개(https://automated

insights.com/wordsmith)했다.

워드스미스는 수많은 데이터를 텍스트로 바꿔주는

자연어 처리 엔진(NLG: Natural Language

Generation)인데 AP와 야후 등은 이 프로그램으로

로봇 저널리즘 2.0

현재 매달 수천 건의 로봇 기사를 쏟아내고 있다.

AP는 그동안 미국 메이저리그 야구 리그에 견주어

제대로 다루지 못하던 마이너리그 관련 뉴스를

요새 로봇 기자가 작성한 기사로 채운다. 인터넷

포털 야후의 스포츠 섹션과 분기 실적 기사도 로봇

기자가 정리한 기사를 올리고 있다. 다만 독자들이

이 기사가 로봇이 데이터를 기반으로 작성한 것인지

인간이 작성한 것인지 구분하지 못할 뿐이다.

제임스 코테치 AP 홍보팀장은 지난해 3월 열린

세계편집인포럼에서 “로봇 저널리즘은 그동안

기자들이 접근하지 못하거나 해석하지 못하던

데이터 영역에 침투하고 있으며 흥미로운 결과를

내놓고 있다. 그동안 데이터를 가지고 (사람) 기자

한 명이 하나의 기사를 써서 최대한 많은 독자에게

노출할 수 있도록 기사를 써왔다. 하지만 로봇

기자는 데이터에서 수백, 수천 개의 스토리를 만들어

그 스토리에 맞는 독자에게 맞춤형 기사를 보낼 수

있다”고 말했다.

오토메이티드 인사이츠는 자동으로 기사를 작성하는

인공지능 SW 개발을 넘어 흥미로운 실험을 지속하고

있는데 최근엔 기사를 자동으로 작성하는 것을 넘어

아마존의 음성인식 인공지능 ‘알렉사(Alexa)’와

워드스미스는 수많은 데이터를 텍스트로 바꿔주는 자연어 처리

엔진인데 AP와 야후 등은 이 프로그램으로 현재 매달 수천 건의 로봇

기사를 쏟아내고 있다. <사진 출처-오토메이티드 인사이츠 홈페이지 캡처>

20

신문과 방송 2017. 03

결합, 음성으로 인간과 대화할 수 있는 서비스도

개발 중이다. 이를 위해 지난 2월 초에는 ‘알렉사-

워드스미스 해커톤’을 개최하기도 했다. AP와 함께

금융회사(링컨 파이낸셜, 나스닥), 미디어(슬링TV),

공연 중계 업체(티켓마스터) 등 12개 회사가

해커톤에 참가, 다양한 프로그램 아이디어를 만들어

냈다. 데이터를 인공지능 SW에 넣으면 워드스미스를

통해 기사를 작성할 수 있고 알렉사를 통해 의미를

분석, 인간과 대화할 수 있게 된다.

이 해커톤의 우승팀인 옴니트랙스(Omnitracs)는

트럭 운전사들이 알렉사를 이용, 안전하게 운전할

수 있도록 하는 아이디어를 선보였다. 트럭 운전

중 궁금한 실시간 데이터를 알렉사에게 물어보면

대답해주는 방식이다. 트럭 운전자들이 실시간으로

바뀌는 날씨나 교통 정보를 트럭 운전 중에는 제때

확인할 수 없기 때문이다. 실시간으로 바뀌는

데이터를 워드스미스가 수집해 사람이 읽을 수

있는 ‘글(기사 형식)’로 자동으로 만들면 그 의미를

알렉사가 분석하고 읽어주는 방식이다.

이처럼 알렉사와 로봇

저널리즘의 결합은 폭발적

잠재력을 가진 것으로

평가받고 있다. 인간이 미처 발견하지 못한 수많은

데이터가 로봇 저널리즘 SW와 알렉사를 만나서,

인간과 대화하고 의미를 발전시킬 수 있는 수준의

그야말로 ‘인공지능’이 될 수 있도록 하는 것이다.

이처럼 한 단계 진화한 로봇 저널리즘은 편집국

(뉴스룸)의 효율성을 높이는 데도 기여하고 있다.

대표적 사례가 워싱턴포스트다. 지난해 하반기는

워싱턴포스트에서 야심만만하게 추진한 헬리오

그래프가 비약적으로 성장한 시기다. 리우 올림픽은

물론 2016년 미 대통령 선거 과정에서도 쓰인

것이다. 각 주별, 선거구별로 실시간으로 상이하게

나온 결과는 로봇(헬리오그래프)이 수집하고

작성하며 ‘사람’ 기자는 의미를 분석하고 실제

전문가를 인터뷰해서 향후 정치 지형을 예측하는

‘의미 있는’ 일에만 집중하도록 했다. 지난 2012년

선거에서 워싱턴포스트는 같은 일을 하는데 기자

4명이 25시간 동안 분석해 단 한 개의 기사(선거

결과)만 작성했다. 그러나 4년 후인 2016년

대선에서는 사람 기자의 개입을 최소화한 가운데

헬리오그래프가 500개 기사를 작성, 50만 번의

클릭을 유발한 것으로 알려졌다.

워싱턴포스트는 인공지능 기술을 활용해 그래픽

뉴스 자동화, 사용자 제작 콘텐츠 검증, 알림 수신,

콘텐츠 위치 파악 등의 뉴스룸 공정을 자동화하는

데 총력을 기울이고 있다. 이는 인공지능 활용이

편집국의 효율성을 높이고 기사 품질을 높일 수

있다는 믿음 때문이다. 워싱턴포스트는 자체

개발한 CMS(콘텐츠 관리 시스템)를 시카고트리뷴,

LA타임스와 각 지역신문 등에 라이선스할 계획인

것으로 알려졌다. 워싱턴포스트가 쌓은 노하우가

미국 전역의 미디어 산업에 퍼질 가능성이 높아지고

있는 것이다.

워싱턴포스트의 이 같은 움직임은 구글의 ‘인공지능

퍼스트’ 전략을 연상케 한다. 인공지능은 앞으로

미디어 산업의 중심으로 들어올 것으로 예상된다.

뉴스 브랜드의 미래는 어쩌면 ‘AI’에 달려 있는지

모른다. 독자들이 복잡한 세계를 더 쉽게 이해하고

발견하며 배우게 하고 사실을 발견할 수 있도록

인공지능이 도울 것이다.

가짜 뉴스는 2017년 글로벌

미디어의 최대 화두다.

바이러스처럼 퍼지는 가짜

뉴스는 서구 정치를 뒤흔들어 놓았다. 옥스퍼드

사전은 지난해 11월 2016년 올해의 단어로 ‘포스트

진실(Post Truth)’을 선정하기도 했다. 포스트 진실은

객관적 사실보다 감정이나 개인적 신념이 여론

WP의

‘인공지능 퍼스트’

인공지능이 막는

가짜 뉴스

21

형성에 더 영향을 미치는 상황을 뜻한다. 포스트

진실은 ‘진실을 넘다’라는 의미의 ‘탈(脫)진실’보다는

‘진실이 아니다’라는 의미의 ‘비(非)진실’에 가깝다.

구글, 페이스북, 트위터 알고리즘(기술)이 지배하던

글로벌 미디어 지형이 역풍을 맞고 있는 것이다.

페이스북, 구글 같은 기술 기업에도 가짜 뉴스

대응은 발등에 떨어진 불이다. 이들은 콘텐츠 생산은

하지 않고 유통만 한다며 책임을 회피하던 그동안의

자세에서 벗어나 적극적으로 대응하고 있다. 즉

인공지능 알고리즘으로 가짜 뉴스를 걸러내는 방법

개발에 사활을 걸고 있다. 스마트 필터링 및 콘텐츠

분석과 자연어 처리를 사용, 스팸 메일이 받은

편지함에 들어오지 못하게 하는 것처럼 알고리즘을

활용, 가짜 뉴스를 탐지하고 방어하려는 것이다.

실제 구글의 기술 인큐베이터팀 구글 직소(Google

Jigsaw)는 2017년 2월 머신러닝 기술을 활용,

온라인에서 악의적 댓글을 골라낼 수 있는 인공지능

기반 기술을 선보였다. 구글은 뉴욕타임스와 협력,

‘퍼스펙티브(Perspective)’라는 기술을 사용한

테스트를 진행해 왔는데 그 결과 악의적이라고

판단되는 댓글을 머신러닝을 통해 학습하면서

알고리즘을 만들어 악성 댓글을 걸러내는 역할을

수행했다.

뉴욕타임스에는 현재 매일 1만1,000건의 댓글을

검색하고 관리하는 팀이 있다. 퍼스펙티브 기술을

통해 사실 왜곡, 뉴스 조작 등의 문제를 발생시킬

수 있는 악의적 댓글을 걸러내는 데 시간과 비용을

절약할 수 있을 것으로 예상했다. 이 기술은

뉴욕타임스를 포함, 악의적인 댓글로 인해 피해를

보는 언론사들과 IMDb 등의 정보 사이트에서

유용하게 활용될 예정이다. 실제로 영화 정보 제공

사이트 IMDb는 늘어나는 악성 댓글로 인해 해당

섹션을 폐쇄하기도 했다. 구글은 퍼스펙티브가

인공지능의 활용 범위를 넓히는 데에도 한몫할

것으로 기대하고 있다.

페이스북도 전사적 차원에서 인공지능 기술을 활용해

가짜 뉴스를 판별하고 걸러내는 기술을 개발하는

데 나서고 있다. 얀 레쿤 페이스북 AI 총괄을 직접

인터뷰한 적이 있는데 그는 “우리는 이미 (가짜 뉴스

판별) 기술을 갖고 있고 더 개발할 수도 있다. 하지만

검열, 필터링, 표현의 자유 등의 이슈와 상충할 수

있다. 어떻게 서비스로 만드느냐가 중요하다”고

말했다. 페이스북은 이미 AI 기술을 뉴스피드에

적용하고 있다. 한 달에 한 번 이상 페이스북에 접속

하는 17억9,000만 명이 올리는 글, 사진, 동영상은

AI 알고리즘 없이는 분류가 불가능하다. 매일 나오는

25억 개에 달하는 게시물도 25개국 언어로 자동

번역되는데 이것도 AI 기술을 접목한 것이다.

그렇다면 인공지능은 가짜 뉴스를 어떻게 판별할

수 있을까? 가장 유력한 알고리즘은 자연어처리

엔진이 가짜 뉴스의 제목, 주제, 지리적 위치, 본문

텍스트를 파악, 동일한 내용을 다룬 기존 사이트(예를

들어 위키피디아 및 구글에서 검색된 신뢰도 높은

문서들)와 비교해 사실을 보도하는지 여부를 결정할

수 있게 한다. 또 인공지능이 가짜 뉴스 헤드라인에서

자주 사용되는 감각적인 단어를 발견, 키워드를

분석해 판별할 수 있게 하는 방법도 있다.

가짜 뉴스와 진실에 기반을 둔 뉴스를

구분해주는 인공지능 기술도 빠르게 발전하고 있다.

이제 인공지능과 미디어의 융합은 자동으로

기사를 작성한다는 것 이상의

결과물을 보여주고 ‘로봇 저널리즘 2.0’으로

진화하는 단계에 들어선 것이다.

해외 AI와 미디어 융합 현황 데이터 분석·기사 작성은 기본, 가짜...

Documents

Transcript of 해외 AI와 미디어 융합 현황 데이터 분석·기사 작성은 기본, 가짜...