이세돌 9단이 18일 국산 바둑 인공지능(AI)인 '한돌'과 프로 바둑기사로서의 마지막 은퇴대국을 펼친다.
이세돌 9단은 이날 낮 12시 서울 바디프랜드 도곡 본사에서 '바디프랜드 브레인마사지배 이세돌 vs 한돌' 1국에 나선다.
이세돌 9단의 은퇴 대국 상대인 '한돌'은 NHN에서 만든 바둑 AI 프로그램이다. 2017년 12월 공개된 '한돌'은 구글 딥마인드가 같은 해 발표한 알파고 제로 및 알파제로 논문들에 담긴 머신러닝 기법들이 적용됐다.
'한돌'은 지난해 12월 '한돌 2.0' 버전으로 성능을 끌어올렸다. 국내 바둑계 톱기사들과의 대국 경험과 꾸준히 한게임을 통해 일반인과 상시 대국하며, 수많은 대국 경험으로 노하우를 축적했다.
한돌은 지난해 12월 28일부터 올 1월 23일까지 한국 기사 5명과 각각 단판 승부를 겨루는 '프로 TOP5 vs 한돌 빅매치'라는 이벤트 대전을 가졌다. 당시 한돌은 신민준 9단, 이동훈 9단, 김지석 9단, 박정환 9단, 신진서 9단을 상대로 모두 승리했다.
올 7월에는 성능 업그레이드를 통해 '한돌 3.0' 버전을 공개했고, 8월 개최된 중신증권배 AI바둑대회에 참가해 존재감을 드러냈다. 한돌은 총 14개 팀이 참여한 가운데 예선전에서 5위를 차지하며 8강에 올랐고, 벨기에 '릴라제로(Leela Zero)', 대만 '씨쥐아이 고(CGI GO)', 일본 '글로비스 에이큐제트(Globis-AQZ)' 등을 상대로 승리하며 당당히 3위를 차지, 국내 AI 기술력을 세계에 선보였다. 대회 우승과 준우승은 중국의 '절예', '골락시(GOLAXY')가 각각 차지했다.
기력(棋力)을 측정할 때 쓰이는 'Elo 레이팅' 기준으로 한돌 3.0은 4500을 넘는 것으로 NHN은 추산했다. 알파고는 3700 정도, 인간 9단은 평균 3500 정도로 평가된다. NHN 측은 한돌의 실력에 대해 '알파고 제로'와 '알파제로' 사이 정도가 될 것이라고 설명했다.
NHN의 주장대로라면 이세돌 9단이 대국한 3년 전의 '알파고 리'보다 훨씬 강한 상대인 셈이다.
개발 초기 한돌은 '한게임 바둑' 데이터 등 사람이 둔 기보를 학습해서 다음 수를 예측하는 정책망(바둑 AI에서 다음 후보 수를 결정하는 딥러닝 모델)을 사용했고, 출시 시점에는 사람이 둔 기보로 학습한 정책망으로 후보 수를 선택한 후 자가 대국을 한 기보로 학습한 가치망(바둑 AI에서 현재 수순에서 승리 확률을 구하는 딥러닝 모델)과 패턴(한돌 개발에 사용된 바둑돌들의 특정 모양)으로 끝까지 빠르게 둔 롤아웃(한돌 1.0에서 쓰였던 알고리듬으로, 바둑판에서 좁은 영역에 돌이 4개나 9개 정도 놓일 수 있는 곳에 특정 패턴의 돌이 놓이면 미리 만들어둔 패턴으로 돌을 두는 것)으로 다음 수에 대한 승리 확률을 얻었다.
이렇게 선택하고 얻은 수에 대한 승리 확률에 MCTS(바둑이나 장기처럼 상대방과 내가 번갈아 가면서 두는 게임에서 내 턴에 내가 제일 좋은 수, 상대 턴에 상대가 제일 좋은 수를 번갈아 가면서 시뮬레이션해 좋은 수를 찾는 방법)라는 수읽기 알고리듬을 사용해 다음 수를 예측했다.
현재 버전의 '한돌'은 무작위·자가대국으로 만든 기보로부터 학습한 정책망 및 더 정확한 가치망을 사용해 롤아웃 없이 MCTS 수읽기 알고리듬을 통해 다음 수를 예측한다. 여기에 자가 대국을 통해 생성한 기보를 이용하여 학습하는 과정을 반복하여 지속적으로 성능을 개선시키고 있다.