IPTV와 연동한 음성인식…화면 통해 실행여부 확인
미디어ㆍ통화ㆍ영상비서 등 다양한 홈 융합서비스 자신
“집뿐만 아니라 사무실ㆍ가게ㆍ車 등 분야서 영역 확장”
“‘기가지니’는 음성인식, 영상, 미디어 등 KT가 20년 동안 쌓아온 기술이 집약된 인공지능(AI) 서비스입니다.”
서초구 우면동에 있는 KT 융합기술원에서 KT AI 기술개발 전반을 담당하고 있는 박재형<사진> AI 디자인팀장을 만났다. 박 팀장은 이투데이와의 인터뷰 내내 ‘기가지니’에 대해 자신감을 드러냈다. 과한 수식어를 쓰지 않으면서도 기가지니에 녹아 있는 20년 KT 기술 노하우를 담담하게 설명했다. 박 팀장은 KT 융합기술원 서비스연구소 AI 테크센터 소속으로, 기가지니뿐만 아니라 KT가 개발하는 AI 서비스 기획과 전략 수립을 맡고 있다. AI테크센터는 KT가 AI 기술 개발을 고도화하고자 올해 초 신설한 조직이다.
박 팀장은 “2015년 말, KT의 모든 홈서비스의 중심이 되는 융합 서비스로 만들어 보겠다는 목표 아래 기가지니 개발이 시작됐다”며 “KT 사내에서 황창규 회장님 주도 하에 비밀 프로젝트로 진행될 정도로, 초반에는 극비리에 준비를 진행했다”고 회상했다.
애초에 기가지니는 지난해 9월 출시를 목표로 하고 있었다. 하지만 최고의 기술력을 위한 제휴업체 선정을 위해 일정을 올해 1월로 늦췄다. 박 팀장은 “최고의 제휴회사와 최고의 단말기·서비스를 만든다는 목표 때문에 하만카돈 스피커를 탑재하고, 디자인도 변경하고 했기에 출시 일정을 다소 조정했다”고 귀띔했다.
기가지니는 IPTV와 연동한 음성인식 AI 서비스 기능이다. KT의 IPTV 서비스 올레tv와 연결돼 음성만으로 TV 조작을 가능하게 해준다. 기존 AI 스피커가 음성인식 위주의 ‘청각’에 초점을 맞췄다면, 기가지니는 스피커와 함께 TV 연동과 카메라 내장으로 ‘시청각’을 기반으로 한다. 음성으로 명령하면서 눈으로 TV 화면을 보며 실행 여부를 확인할 수 있기 때문에 보다 직관적으로 이용할 수 있다.
박 팀장은 경쟁사인 SK텔레콤 AI 스피커 ‘누구’와 비교해 기가지니의 기술력이 더 뛰어나다고 우회적으로 언급하기도 했다. 그는 “최근 SK텔레콤은 ‘누구’가 인간에게 먼저 사인을 보내는 기능을 선보인다고 하는데 기가지니는 올해 초 출시할 때부터 단말이 사용자에게 먼저 말을 거는 능동형 대화를 제공하고 있다”며 “누구가 출시 일정을 예정보다 앞당겨서 내놓은 만큼 서비스가 충분치 않은 상태로 출시된 것으로 보인다”고 말했다. 그는 이어 “KT는 미디어, 통화, IoT, 영상비서 등 홈 융합서비스를 앞세워 새로운 포지셔닝으로 자신 있게 출시했고, 판매도 성공적으로 진행되고 있다”고 덧붙였다. 현재 기가지니의 판매량은 공개되지 않고 있지만 업계에선 2만 대를 넘어선 것으로 추정하고 있다.
기가지니의 높은 음성인식 성공률에 대해서는 특히 강조했다. 그는 “다양한 서비스가 탑재된 단말기에서 노이즈 환경에서의 음성인식이나, 에코 캔슬 등에 대한 기술을 적용했다”고 설명했다. KT는 10여 년 전부터 의미해석, 예측분석 등에 기반을 둔 미디어 큐레이션 기술을 개발해 왔다. 기가지니에서 선보인 대화형 검색은 국내외 최고 수준으로 평가받는 한국어 자연어 음성인식 기술에 기반을 둔 것으로, 꾸준히 고도화 작업을 진행 중이다.
박 팀장은 “집에서뿐만 아니라 집 밖의 사무실, 상점, 차량 등 다양한 분야에서 AI 기술과 서비스를 접목한 영역 확장을 하겠다는 목표가 있다”며 “지능형 네트워크 인프라 기반에 5대 플랫폼 기반의 사업을 지능화해 나가는 방향으로 AI 사업을 확장할 예정”이라고 말했다.