LG사이언스파크가 개발한 AI(인공지능) 프로그램이 AI 학습용 한국어 표준데이터셋 ‘코쿼드(KorQuAD)1.0’ 기계 독해 평가에서 95.39점을 받아 1위를 기록했다. 사람이 같은 독해 문제를 풀었을 때 받은 점수(91.2점)를 뛰어넘는 결과다.
19일 LG에 따르면 기계 독해는 AI가 ‘질문하고 답하기’를 반복적으로 학습해, 스스로 문제를 분석하고 질문에 최적화된 답안을 찾아내는 기술이다.
예를 들어 “제주도는 대한민국의 남해 상에 위치하는 섬으로 대한민국에서 가장 큰 섬이다. 행정구역상 제주특별자치도에 속한다. 섬의 면적은 1833.2㎢인데 이는 남한 면적의 1.83%에 해당한다. 2020년 주민등록 인구는 약 67만 명으로 대한민국의 섬 중에서 가장 인구가 많다”와 같은 지문을 주고 “제주도에서 사는 사람은?”이라고 물으면 AI가 맥락을 이해해 “67만 명”이라고 대답하는 식이다.
독해 평가는 AI가 약 10분 동안 수천 개의 비정형화된 주관식 질문에 답하는 방식으로 진행되며, 답변의 정밀도와 재현율에 따라 점수를 높게 산출한다.
LG는 이 기술을 고객 상담 챗봇에 적용할 계획이다. 고도화된 챗봇 서비스는 질문 유형에 따라 정해진 답변을 취사선택해 응대하는 기존 챗봇과 달리 질문 의미를 이해하고 사람이 상담하는 것처럼 자연스럽게 답변할 수 있다.
AI 기술로 한국어 제품 설명서, 웹페이지 등 많은 양의 길고 복잡한 문서를 빠르고 정확하게 이해해 필요한 핵심 정보를 단시간 안에 찾아낼 수 있기 때문이다.
LG사이언스파크 AI 추진단은 그룹 차원의 AI 전담 조직으로 AI 전략 수립과 선행 기술 연구를 진행하고 있다.