네이버 음성인식의 진화… 여러명이 동시에 말해도 거뜬

입력 2019-04-05 17:46
  • 가장작게

  • 작게

  • 기본

  • 크게

  • 가장크게

▲김성훈 네이버 클로바 리더가 클로바 AI에 대해 설명하고 있다. (조성준 기자 tiatio@)
▲김성훈 네이버 클로바 리더가 클로바 AI에 대해 설명하고 있다. (조성준 기자 tiatio@)

네이버가 음성인식을 활용한 다양한 기술 발전에 나선다. 앞으로는 음성을 통해 식당 예약과 주문이 가능해질 전망이다.

네이버는 서울 그랜드 인터컨티넨털 호텔에서 개최한 ‘네이버 AI 콜로키움 2019’에서 음성인식을 활용한 ‘듀엣’ 서비스를 개발하고 있다고 5일 밝혔다.

이날 김성훈 네이버 클로바 리더는 ‘클로바 AI 함께해요’를 주제로 음성합성, 입술읽기, 동작인식 등 새로운 음성인식 기술을 선보였다.

우선 음성 합성을 통해 새로운 기계음을 만들 수 있다. 현재 기계음은 딱딱한 톤이 대부분이지만 여러 요소 변화를 통해 사투리 등 일상어에 친숙한 음성으로 변화시킬 수 있다. 톤을 바꾸면서 지루하지 않고 다양하게 변화시키는 것이 가능하다는 뜻이다.

또 주변이 시끄러운 환경에서도 음성인식이 가능해진다. 여러명이 동시에 말을 해도 카메라는 말하는 사람의 입술모양을 분석해 정확한 텍스트 도출이 가능하다. 카메라는 입술을 정확하게 인식해 전달하고자 하는 문장을 읽어낼 수 있다. 얼굴이나 입술뿐만 아니라 전체 동작을 스캐닝 해 춤 점수 자동 계산 등 새로운 기술도 선보였다.

네이버는 이 같은 기술을 합쳐 ‘듀엣’ 서비스를 개발하고 있다. 이날 행사장에서는 ‘듀엣’을 활용해 식당을 예약하고 음식을 주문하는 시연을 펼쳤다. 다만 듀엣은 현재 컨셉형 모델로 앞으로 기술 개발에 방향에 따라 변경될 가능성도 있다.

김성훈 리더는 “음성을 듣는 것과 보는 것이 중요해지면서 음성인식은 이제 일상이 됐다”라며 “앞으로 음성을 활용한 다양한 기술개발을 통해 여러 가지를 할 수 있도록 할 것”이라고 말했다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0

주요 뉴스

  • "여기도 품절이라고요?"…Z세대 '뷰티 방앗간' 된 다이소, 다음 대란템은? [솔드아웃]
  • ‘슈팅스타’ 오늘 첫 방송…‘큰 산’ 최강야구 넘을까? [해시태그]
  • 우리은행장 교체 수순…차기 행장 후보 내주 윤곽 나올 듯
  • 단독 부모-자녀 한 동네 사는 실버타운 만든다더니…오세훈표 '골드빌리지' 무산
  • ‘더 게임 어워드’ 올해의 게임 후보 6선…각 작품 경쟁력은? [딥인더게임]
  • "동덕여대 손해배상 상대 특정 어려워…소송 쉽지 않을 것"
  • 트럼프 등에 업은 머스크, 베이조스 겨냥…“그는 트럼프 패배 원했다”
  • 이재명, 또 입단속…“거친 언행 주의해달라”
  • 오늘의 상승종목

  • 11.22 장종료

실시간 암호화폐 시세

  • 종목
  • 현재가(원)
  • 변동률
    • 비트코인
    • 136,180,000
    • -1.06%
    • 이더리움
    • 4,638,000
    • -1.53%
    • 비트코인 캐시
    • 741,500
    • +7.78%
    • 리플
    • 2,116
    • +9.64%
    • 솔라나
    • 363,500
    • +0.06%
    • 에이다
    • 1,496
    • +21.53%
    • 이오스
    • 1,056
    • +10.23%
    • 트론
    • 286
    • +2.14%
    • 스텔라루멘
    • 588
    • +48.48%
    • 비트코인에스브이
    • 99,750
    • +4.23%
    • 체인링크
    • 23,280
    • +9.76%
    • 샌드박스
    • 527
    • +6.46%
* 24시간 변동률 기준