데이터 과학분야의 최고 영예인 SIGKDD 혁신상을 2년 연속 수상한 페드로 도밍고스의 ‘마스터 알고리즘’(비즈니스북스)의 핵심 메시지는 부제인 ‘머신러닝은 우리의 미래를 어떻게 바꾸는가’라는 한 문장에 들어 있다. 이미 구글, 페이스북, 아마존, 엑스피디아, 옐프 등에는 머신러닝 알고리즘이 꽉 들어차 있다. 머신러닝은 인공지능의 한 분야이다. 기계에 일일이 명령을 내리거나 프로그래밍하지 않아도, 기계 스스로 학습할 수 있는 능력을 부여하도록 연구하는 분야를 말한다. 저자는 머신러닝 알고리즘이 광범위하게 확산하면서 과학과 기술은 물론이고 사업이나 정치 그리고 전쟁 등에서 큰 변화가 일어날 것이라고 주장한다.
독자들에게 머신러닝의 전모를 짧은 시간에 이해시키고 그 미래를 가르쳐 줄 책이다. 아마존이나 넷플릭스의 추천 알고리즘은 전혀 다른 조언을 한다. 한쪽은 책 추천을, 또 다른 한쪽은 영상물 추천을 담당한다. 그럼에도 불구하고 두 회사가 사용하는 머신러닝 알고리즘은 비슷하다. 매년 수백 가지 새로운 머신러닝 알고리즘이 시장에 쏟아져 나오지만 그 기초는 똑같은 소수의 아이디어에 있다. 이 책은 그 소수의 아이디어를 소개하고, 그것이 앞으로 어떻게 변화해 나갈지를 전망한다.
△우리는 어떻게 배우는가? △더 나은 방법은 있는가? △우리는 무엇을 예측할 수 있는가? △우리가 배운 것은 신뢰할 만한가? 이러한 질문에 대해 머신러닝 분야에서 경쟁하는 종족들은 각각 다른 답을 제시한다. 기호주의자, 연결주의자, 진화주의자, 베이즈주의자, 유추주의자이다. 예를 들어, 기호주의자는 학습을 연역의 역순으로 보며 철학과 논리학에서 아이디어를 얻지만, 연결주의자는 두뇌를 분석하고 모방하며 신경과학과 물리학에서 영감을 얻는다.
머신러닝를 구성하는 다섯 종족은 각자 고유한 마스터 알고리즘을 갖고 있다. 여기서 마스터 알고리즘은 이론상으로 어느 영역의 데이터에서도 지식을 발견해내는 범용 학습 알고리즘을 말한다. 기호주의자의 마스터 알고리즘은 역연역법이며, 나머지는 역전파, 유전자 프로그래밍, 베이즈 추정, 서포트 벡터 머신 등이다. 저자가 이 책에서 주장하는 핵심은 앞으로 다섯 가지 알고리즘의 특성을 모두 지닌 단일한 알고리즘, 즉 최종 마스터 알고리즘을 만들어낼 수 있다는 것이다. 다수의 사람들이 마스터 알고리즘의 등장에 회의적인 시각을 갖고 있음에도 불구하고 저자는 확신에 찬 목소리로 외친다. 마스터 알고리즘의 등장이 무엇을 뜻하는 것일까. 만일 그것을 찾아낼 수 있다면, 그것은 세상의 모든 지식, 즉 과거와 현재 그리고 미래의 모든 지식을 데이터에서 얻어낼 수 있음을 뜻한다. 이는 과학의 역사에서 가장 위대한 진보 가운데 하나로 손꼽힐 것이다. 다소 난해하지만, 머신러닝의 전모를 파악할 수 있는 책이다.