하반기 금융 공통분야 말뭉치 유형ㆍ규모↑
내년부터 금융 업권별 특화 말뭉치 지원 예정

금융위원회는 31일부터 금융권에 특화한 생성형 인공지능(AI) 금융서비스 개발 활성화ㆍ고도화를 위해 '금융 특화 한글 말뭉치'를 제공한다고 30일 밝혔다.
금융 특화 한글 말뭉치란 금융 분야의 다양한 전문지식을 AI 모델이 가공ㆍ처리ㆍ분석할 수 있는 형태로 모은 대규모 한국어 언어자료 집합이다.
그동안 금융사들은 해외에서 일반 사용자를 위해 개발된 상용 AI(챗 GPT, HyperCLOVA 등)과 오픈소스 AI를 활용해 챗봇, 뉴스 요약, 번역 등 일반화된 서비스를 제공하는 데 사용해왔다. 한국어로 된 금융 용어와 우리나라 금융 법규 등 전문화된 데이터가 부족하다는 점이 걸림돌이었다.
금융당국은 앞서 지난해 말 발표한 '금융권 생성형 AI 활용 지원 방안'의 후속 조치로 금융 특화 한글 말뭉치를 제공한다.
관련 뉴스
말뭉치는 AI 모델의 금융 전문지식 학습과 답변의 정확도 제고, 성능과 윤리 평가 등에 활용할 수 있도록 다양한 형태로 제공된다. 이번에 제공되는 금융 공통 분야 말뭉치는 총 1만2600건, 약 45GB 이상 규모다. 구체적으로 △사전학습용 6700건 △추가학습용 1100건 △검색증강생성용 3800건 △평가지원용 1000건으로 구성돼 있다.
금융감독원, 은행연합회, 금융연수원 등의 금융용어 사전과 금융 일반지식 자료를 활용해 금융 분야 지식 학습을 위한 '사전학습용' 말뭉치를 지원한다. 금융 특화 AI 서비스 개발을 위한 '추가학습용' 말뭉치는 국내 금융정책·제도 설명자료, 금융 법규·가이드라인 및 보험연수원의 기초 연수자료를 활용해 구축했다.
AI 모델이 외부의 최신 정보와 전문 데이터를 참조해 더욱 정확한 답변을 도출하도록 하는 '검색증강생성용' 말뭉치도 지원한다. 이는 금융소비자보호법 및 관련 참고자료, 전자금융거래법 등 연계법의 관련 조문을 활용해 구축했다. 금융권 AI 서비스가 관련 제도나 법규의 최신 개정 내용이 반영되지 않은 잘못된 답변을 도출해 이용자의 권리를 침해하거나 재산상 손해를 입히는 경우를 막기 위해서다.
AI 모델의 금융 지식, 추론능력 및 잠재적 유해성을 평가하기 위한 평가지원용 말뭉치도 지원한다. 생성형 AI가 허구의 정보를 생성하거나 성별, 인종 등에 대한 선입견을 학습하는 편향의 문제를 해소할 수 있을 것으로 금융당국은 내다봤다.
금융 공통분야 말뭉치 이용을 희망하는 금융사는 금융결제원 데이터 공유 플랫폼을 통해 신청하고 내려받을 수 있다. 금융당국은 시범사업 기간인 6월 말까지 말뭉치를 무료로 제공할 예정이다.
금융위 관계자는 "개별 금융회사의 AI 학습ㆍ평가 데이터 확보에 걸리는 시간과 비용을 절약하고, 국내 금융 제도ㆍ서비스에 전문화된 혁신적 AI 서비스 개발이 촉진될 것"이라며 "올 하반기에는 금융 공통분야 말뭉치의 유형과 규모를 키우고, 내년부터는 금융 업권별 특화 말뭉치를 지원할 수 있도록 다양한 원천 데이터 보유기관, 유관기관과 협의할 계획"이라고 말했다.