이세돌 VS AI(알파고, 한돌)

알파고는 2017년 역사적인 전적 “73승 1패”를 끝으로 은퇴를 하였다. “알파고”는 모두 아시겠지만 “인간”이 아닙니다. 인공지능, AI이지요.

여기서 1패는 AI와 맞서 유일하게 이긴 사람, “이세돌”입니다. 그 이세돌이 알파고를 능가한다고 하는 “한돌”을 상대로 은퇴전을 치루었습니다.

아쉽게도 2:1로 이세돌이 지난 25년간 반상을 호령했던 이세돌이 인공지능(AI)과의 최종 은퇴 대국에서 패배를 하였습니다. 그래도 멋진 승부를 펼치신 이세돌은 정말 대단한 사람입니다. 그에게 박수를 보냅니다.

그럼 천하의 “이세돌” 그를 패하게 만든 “AI”는 무엇인지에 대해서 알아보겠습니다.

1. 알파고! 넌 누구니?

우선 알파고에 대해서 알아봅시다. 알파고(AlphaGo)는 구글(Google)의 딥마인드(DeepMind Technologies Limited)가 개발한 인공지능(AI, Artificial Intelligence) 바둑 프로그램입니다. 그리고 프로기사를 맞바둑으로 최초로 이긴 프로그램이기도 합니다.

딥마인드는 영국의 스타트업 기업으로 2014년 구글에 인수되었고, 알파고의 개발이 본격적으로 진행되었습니다. 2015~2017년 동안의 개발기간 동안 수많은 테스트와 업그레이드가 이루어졌고 2017년 10월에 최종 버전인 알파고 제로를 발표하였습니다.

알파고라는 이름은 구글의 알파벳과 그리스 문자의 첫 번째 글자로 최고를 의미하는 '알파(α)', 바둑의 일본어 발음 '碁(ご)'에서 유래한 영어 단어 'Go'를 뜻합니다. "Go"란 일본어로 바둑을 뜻하는 碁(바둑 기. 일본어 음독은 "고")를 의미합니다.

바둑은 체스와 같은 다른 종목에 비해 컴퓨터가 인간을 이기기 훨씬 어려운 것으로 여겨졌습니다. 일반적인 게임과 달리 바둑은 경우의 수가 훨씬 크기 때문에, 기존의 인공지능 기법 적용은 어렵기 때문입니다.

알파고 제로(최종버전)는 기존의 빅데이터 즉, 인간의 기보에 의존하는 것이 아니라 게임의 규칙만으로 스스로 학습하며 기력을 향상시키는 인공지능입니다. 단순히 A를 두었을 때 B를 하여야 한다는 식의 개념으로 프로그래밍 하는 것이 아닙니다.

알파고 제로는 2900만 번의 자가 대국을 진행하며 바둑에 대하여 학습하였고, 사내 테스트 결과 다른 바둑 인공지능 프로그램들을 상대로 495전 494승 1패를 기록했다고 합니다. 빅데이터 학습이 필요없는 인공지능의 등장은 빅데이터 확보가 어려워 인공지능을 활용하기 어려웠던 분야에 해결책을 제시했다는 점에서 의미가 있다고 할 수 있습니다.

흔히 알파고의 강점이 엄청난 하드웨어, 즉 물리적인 계산력으로 생각하는 경우가 많습니다. 하지만 알파고가 가장 차별화 된 부분은 하드웨어가 아니라 소프트웨어의 알고리즘입니다. 알파고는 일반 컴퓨터에서도 돌릴 수 있으며, 단지 기력이 떨어질 뿐 컴퓨터 1대에서 돌아가는 알파고를 CPU 1,000개가 넘어가는 알파고가 이길 확률이 고작 77%에 불과합니다. 알파고가 대국 중에 하드웨어를 많이 쓰는 이유는 추가 탐색으로 얻는 저 23%의 차이도 실제 대국에서는 중요하기 때문이지 하드웨어로 단순계산하는 프로그램이 아닌 것입니다.

개발기간동안 알파고는 2015년 판 후이(Fan Hui, 樊麾) 2단과의 5번기에서 모두 승리해 프로 바둑 기사를 이긴 최초의 컴퓨터 바둑 프로그램이 되었고, 2016년 3월에는 세계 최상위급 프로 기사인 이세돌 9단과의 5번기 공개 대국에서 4승 1패로 승리해 세계를 놀라게 했었습니다.

그리고 2017년 5월에는 당시 바둑 세계 랭킹 1위 프로 기사였던 커제(柯洁) 9단과의 3번기 공개 대국과 중국 대표 5인과의 상담기(相談棋, 단체전)에서도 모두 승리하며 '세계에서 가장 강력한 인공지능'임을 다시 한번 각인시켰습니다. 한국기원은 알파고가 정상의 프로기사 실력인 '입신'(入神)의 경지에 올랐다고 인정하여 '프로 명예 단증(9단)'을 수여하였고, 중국기원도 '프로기사 9단' 칭호를 부여했습니다.

그리고 알파고는 2017년 5월을 마지막으로 은퇴를 하였습니다.

2. 알파고보다 한 수위 “한돌”

한돌은 '한게임 바둑'을 서비스 중인 NHN(대표 정우진)의 기술연구센터(센터장 박근한) 산하 게임 AI팀이 2017년 초부터 개발을 시작한 AI입니다. 이후 10개월간의 기간을 거쳐 인간의 기보를 기반으로 한 '한돌' 1.0을 2017년 12월 출시했으며, 이후 인간 기보 없이 자가 대국으로 기력을 향상시킨 2.0 버전을, 다시 자가 대국 속도를 보다 빠르게 한 3.0버전을 선보였습니다. 2.0은 1.0과 비교해 90% 이상의 승률을, 3.0은 2.0보다 90% 이상 승률을 기록했다는 게 NHN의 설명입니다. 이세돌 은퇴 기념 대국에 나선 한돌은 최신 버전인 3.0이라고 합니다.

한돌 역시 알파고처럼 딥러닝과 MCTS(Monte Carlo Tree Search)를 기반으로 합니다. MCTS란 내 차례 때 제일 좋은 수, 상대 턴에서 상대가 제일 좋은 수를 번갈아 가면서 시뮬레이션해서 좋은 수를 찾는 방법을 뜻합니다.

한돌은 알파고와 달리 여기서 더욱 나아가 '앙상블 추론(Ensemble Inference)' 분석을 더했다고 합니다. 한돌 3.0에 도입된 앙상블 추론은 똑똑한 여러 사람이 머리를 맞대 가장 좋은 수를 찾는 개념으로 보면 됩니다. 한돌 내에서 높은 승률을 올린 AI 주체들끼리 다음 수를 토론한다는 것입니다.

MCTS와 딥러닝을 기반으로 한 AI 중 프로기사를 뛰어넘는 성능을 보여준 건 알파고가 처음이며 앙상블 추론을 통해 보다 효율적으로 시뮬레이션할 수 있게 한 점이 한돌이 알파고와 다른 점이라고 합니다.

3. 이세돌 VS 한돌 VS 알파고

ELO 레이팅이라는 개념이 있습니다. 이는 미국의 물리학 교수이자 체스 플레이어인 아르파드 엘뢰(Arpad Elo) 박사가 체스에서 플레이어들의 실력을 표현하기 위해 만든 레이팅 개념으로써 플레이어끼리 대결을 하는 게임에서, 플레이어의 상대적인 실력을 평가하는 점수를 부여해서 비슷한 점수인 플레이어끼리 매치메이킹을 시키려는 목적으로 Elo 레이팅 또는 이를 응용한 레이팅을 사용하기도 합니다. 이에 대해서는 다음에 좀 더 다루도록 하겠습니다.

한돌 3.0은 Elo 레이팅 기준 4,500점을 넘는 수준으로 추정되고 있습니다. 이는 2016년 이세돌과 대국한 '알파고 리', 2017년 커제와 대결했던 '알파고 마스터'보다 높은 기력입니다. 최정상권인 신진서, 박정환, 커제 등의 프로기사는 현재 3천600점대 후반으로 추정되고 있습니다. 다른 9단의 평균은 3500정도입니다.

NHN측에서 추정하길 한돌은 알파고 리(2016년 이세돌과 대국한 알파고 버전)는 넘어섰고 알파고 제로(2017년 10월 공개)나 알파 제로(2018년 12월 공개) 사이라고 합니다.

이미 400점 차이가 나므로 사실상 승률은 1대9, 어찌보면 상대가 안되는 대결입니다. 동등한 조건(어드벤티지가 없는)에서의 승부는 어찌보면 당연한 결과 일 수도 있습니다. 그래도 좋은 승부를 펼친 이세돌은 정말 대단한 사람임에는 분명합니다.

저작자표시