딥마인드는 18일(현지시간) 인간 바둑 최고수들을 모두 격파한 알파고를 능가하는 새 바둑 프로그램 ‘알파고제로(AlphaGo Zero)’를 공개했다고 영국 파이낸셜타임스(FT)가 보도했다.
과학저널 네이처에 공개된 논문에 따르면 알파고제로가 기존 알파고와 가장 큰 차이점을 보이는 것은 인간의 도움을 전혀 받지 않았다는 것이다. 이전 버전의 알파고는 초기에 인간 바둑고수들이 구축한 방대한 기보를 학습해 승률이 가장 높은 수를 찾아내는 방식을 적용했다. 그러나 알파고제로는 바둑 기본규칙만 익히고 기보와 정석을 전혀 배우지 않은 상태에서 자체적인 대국을 통해 알파고를 능가하는 수준으로 올라섰다. 더욱 경이적인 것은 이런 수준에 오르기까지 걸린 시간이 70시간에 불과했다는 것이다. 또 막대한 양의 데이터를 처리할 필요가 없기 때문에 프로세서 등 자원이 기존 알파고에 비해 덜 들어간다는 장점도 있다.
데미스 하사비스 딥마인드 최고경영자(CEO)는 “알파고제로는 완전히 무(無)에서 시작해 스스로 바둑을 두는 것만으로 빠르게 인간 수준을 넘어섰으며 이세돌을 이긴 알파고 버전에 100전 전승을 거뒀다. 인간 지식의 한계에 제약을 받지 않았기 때문에 더욱 강력해졌다”고 말했다. 또 알파고제로는 40일간 약 2900판의 자체 대국을 둔 끝에 지난 5월 세계 바둑랭킹 1위 커제를 꺾었던 알파고에도 약 90%의 승률을 보였으며 더 나아가 자체적으로 정석을 만들어 제시했다.
AI의 놀라운 진화에 외신들도 충격적이라는 반응을 보였다. 영국 BBC방송은 AI가 점점 더 외계인처럼 돼가고 있다고 감탄했고 텔레그래프는 인간이 3000년간 쌓은 지식을 40일 만에 모두 배웠다고 평가했다.
알파고가 지난 5월 세계 최강 바둑기사들에 전승을 거두고나서 하사비스 CEO는 “더는 알파고가 인간과 대국하지 않을 것”이라고 선언했다. 그후에도 알파고를 계속 개선한 것은 인간에 전혀 의존하지 않는 AI를 만들겠다는 목표가 있었기 때문이다. 종전 알파고가 인간의 축적된 지식의 연장선상에 있었다면 알파고제로는 인간의 발상에 전혀 얽매이지 않는 혁신적인 AI가 된 것이다.
이에 딥마인드가 알파고제로 알고리즘을 통해 무엇을 할지에 더욱 관심이 쏠리고 있다. 하사비스 CEO는 단순히 바둑에서 인간을 이기고자 알파고를 개발한 것이 아니라는 점을 강조해왔다.
현재 딥마인드는 영국 국민보건서비스(NHS)와 제휴해 난치병 조기 발견에 AI를 활용하고 있다. 또 영국의 송전망을 운영하는 내셔널그리드와 함께 AI를 통한 전력수급 조정 프로젝트도 진행하고 있다.
더 나아가 하사비스 CEO는 “아무것도 없는 상태에서 스스로 배울 수 있는 알고리즘을 구축함으로써 실세계의 다양한 문제 해결에 도움이 될 수 있다”며 “알츠하이머 치료 등 의료 분야에 적용될 수 있다”고 설명했다. 이어 “알파고제로에 적용됐던 알고리즘을 통해 인체 내에 단백질 구조가 만들어지는 과정이나 신소재 개발에 필요한 물리법칙을 발견할 수 있다”고 덧붙였다. 또 분자 단위에서 조합을 다양하게 구축해 슈퍼 배터리를 만들거나 독창적인 미래 전자기기를 고안해 낼 수도 있다.
알파고제로 알고리즘은 인간이 쌓은 데이터가 없어도 강화학습을 통해 독학할 수 있다는 특징이 있기 때문에 대량의 데이터 중에서 사람들이 눈치채지 못한 중요 정보를 찾을 수 있어 전력수급 효율성을 더욱 높일 수 있다고 전문가들은 내다봤다. 우주와 해양 분야 등 측정 데이터가 부족한 분야에도 도움이 될 수 있다.
다만 하사비스를 포함해 딥마인드 연구진은 이런 AI 기술이 실생활에 얼마나 빨리 적용될지에 대해서는 조심스러운 태도를 보였다. 바둑은 규칙이 분명해 운(運)과 같은 변수가 작용할 여지가 매우 적지만 실세계는 예측할 수 없는 변수가 매우 많다는 것이다.