카카오의 AI 연구 자회사인 카카오브레인은 20일 온라인 기자간담회를 열고 내년 초 ‘이미지 텍스트 멀티모달(Multi-modality)’ AI 모델을 공개할 계획이라고 밝혔다. 멀티모달 AI 모델과 데이터셋을 한 번에 공개하는 것이 목표다.
멀티모달은 글(텍스트)과 이미지, 음성을 동시에 이해할 수 있는 AI 모델이다. 이를 활용하면 AI가 이미지를 글로 표현하거나, 글에 맞는 이미지를 검색·제작할 수 있다. 김일두 카카오브레인 대표는 “언어와 이미지를 섞거나 이미지를 생성하는 멀티모달을 (카카오브레인이) 선도적으로 하고 있다”며 “국내에서 이런 연구를 하고 있는 팀이 아직까지 없는 것으로 안다”고 강조했다.
연달아 초거대 AI 모델을 공개하며 생태계 확장을 선포한 카카오가 추격 속도를 높이고 있다. 카카오브레인은 지난달 한국어 특화 AI 언어모델 ‘코지피티(KoGPT)’를 공개했다. 한국어 문장을 사전·문맥적 의미에 따라 이해하고 문장을 추론할 수 있는 모델로, 마치 사람처럼 생각하고 글을 쓴다.
이어 카카오는 초거대 멀티모달 AI 모델인 ‘민달리(minDALL-E)’를 공개했다. 이용자가 명령어를 텍스트로 입력하면 실시간으로 원하는 이미지를 만들어 준다. “살바도르 달리 화가 스타일로 그려줘”라고 말하면 이를 AI가 직접 이해하고 이미지를 제작한다.
카카오는 이처럼 고도화한 AI 기술을 헬스케어, 교육, 금융 등 다양한 산업 현장에 적용할 계획이다. 헬스케어에서는 단백질 구조 예측에 AI를 도입하고, 언어, 코딩 등 교육분야와 AI 콜센터(AICC) 등 상담 분야에도 AI가 등장할 방침이다. 또한 멀티모달 모델을 활용해 검색이나 커머스 서비스도 고도화할 수 있다.
하지만 앞서 초거대 AI 시장에 나선 네이버의 성장세도 무섭다. 네이버는 올해 5월 자체 개발한 초거대 AI ‘하이퍼클로바(HyperCLOVA)’를 공개했다. 하이퍼클로바는 매개변수(파라미터)가 2040억 개에 달하는 대규모 서비스로 다양한 서비스에 이미 적용된 상태다.
그간 네이버가 선보인 하이퍼클로바 기반 서비스는 음성인식부터 쇼핑, 회의록 작성, 검색, 케어콜까지 확장했다. 네이버는 AI 기술 고도화와 서비스 확장을 통해 생태계를 더욱 공고히 하겠단 구상이다.
네이버는 지난달 열린 ‘데뷰(DEVIEW) 2021’ 행사에서 총 8개 세션에 걸쳐 하이퍼클로바 기술을 제시하며 이를 드러냈다. 성낙호 네이버 클로바(CLOVA) 비즈AI 책임리더는 지난달 열린 네이버 ‘데뷰 2021’ 행사에서 “하이퍼스케일 AI는 특정 전문가만 다룰 수 있는 어려운 기술이 아닌 누구나 접근 가능한 플랫폼이 되어가고 있고, AI 전환을 가속화하고 있다”며 이같은 구상을 구체화했다.
이어 네이버는 클라우드 서비스에도 하이퍼클로바를 접목해 비즈니스 생산성을 높이겠다고 선포했다. 스타트업·중소상공인(SME) 등이 사용할 수 있도록 웹 기반 ‘클로바 스튜디오’ 시험판을 이달 말께 선보일 예정이라고 밝히기도 했다.
따라서 내년 양대 포털의 초거대 AI 경쟁이 치열해질 전망이다. 서비스 확대를 통해 일상 속에서 초거대 AI를 만날 수 있는 방법이 다양해질 것으로 예상되는 가운데, 양 사의 기술 경쟁에는 이미 불이 붙었다.
이날 김일두 카카오브레인 대표는 AI 성능을 결정하는 파라미터 규모가 네이버에 비해 카카오가 더 작다는 지적에 대해 “AI 언어모델은 규모를 키울 수록 속도가 느려지거나 연구개발 기간이 늘어나는 등 단점이 드러난다”며 “실용적으로 사용할 수 있는 규모에서 언어 모델을 만들기 위해 노력하고 있다”고 답했다.
이어 “실제로 지난달 공개한 내용을 보면 카카오브레인의 성능이 네이버가 공개한 최고 수준 모델보다 높기도 하다”고 강조했다.