업스테이지, NIA와 한국어 LLM 성능평가 리더보드 구축

입력 2023-09-25 09:24
  • 가장작게

  • 작게

  • 기본

  • 크게

  • 가장크게

▲업스테이지와 한국지능정보사회진흥원(NIA)이 한국어 거대언어모델(LLM)의 성능을 평가하고 비교할 수 있는 리더보드를 만든다. (사진제공=업스테이지)
▲업스테이지와 한국지능정보사회진흥원(NIA)이 한국어 거대언어모델(LLM)의 성능을 평가하고 비교할 수 있는 리더보드를 만든다. (사진제공=업스테이지)
업스테이지와 한국지능정보사회진흥원(NIA)이 한국 인공지능(AI) 경쟁력 증진을 위해 한국어 거대언어모델(LLM)의 성능을 평가하고 비교할 수 있는 리더보드를 만든다.

업스테이지는 NIA와 공동 주최로 한국어 LLM 리더보드인 ‘오픈 코(Open Ko)-LLM 리더보드’를 구축, 27일 개설한다고 25일 밝혔다. 이는 4일 업스테이지와 NIA의 협력 이후 실현된 결과로, 업스테이지는 1T클럽에 이어 오픈LLM 리더보드까지 더해 한국 AI 생태계 외연을 지속 확대할 계획이다.

오픈 코-LLM 리더보드는 누구나 자신이 개발한 한국어 LLM 모델을 등록하고 다른 모델과 경쟁할 수 있는 공개 플랫폼이다. 오픈 코-LLM 리더보드에 관심이 있는 연구자들은 27일 이후 허깅페이스의 오픈 코-LLM 리더보드 스페이스에서 자세한 정보를 확인하고 참여할 수 있다.

업스테이지와 NIA의 오픈 코-LLM 리더보드는 허깅페이스가 운영하는 오픈LLM 리더보드의 기존 데이터를 단순히 번역한 것이 아니라 한국어의 특성과 문화를 반영한 고품질의 데이터를 자체 구축해 한국어 특화 리더보드로서의 강점을 갖는다.

또한, 상식을 생성하는 능력을 살펴보는 ‘상식생성’ 기준을 추가해 한국어 LLM 모델의 높은 성능과 다양성을 평가할 수 있도록 했다. ‘상식생성’은 업스테이지가 고려대 임희석 교수 연구진과 협업으로 구축한 데이터셋으로 역사 왜곡, 환각 오류, 형태소 오류, 불규칙 활용 오류, 혐오 표현 등에 대한 광범위한 유형을 포함한 질문지로 구성했다. 이를 통해 AI가 주어진 조건에 대해서 만들어 낸 결과물이 한국어 사용자라면 지닐 수 있는 일반 상식에 부합할 수 있는지를 측정한다.

즉, 해당 상식생성 기준을 통해 국내에서 가장 대표적인 할루시네이션의 예시로 평가되는 '세종대왕의 맥북던짐 사건' 등의 사례들도 크게 방지할 수 있어 한국어와 역사에 대해 더 적합한 모델을 평가할 수 있다는 평가다.

오픈 코-LLM 리더보드는 한국어 LLM 연구의 수준과 경쟁력을 높이고, 한국어 데이터의 양과 질을 개선하며, 한국어 LLM의 국제적 인지도를 제고할 것으로 기대를 모으고 있다. 오픈LLM 리더보드를 기반으로 다양한 연구자들의 결과를 공유하고 공동 연구 및 협력을 촉진할 수 있으며 이를 통한 성능 수준의 향상과 산업 분야 확대에도 기여할 것으로 예상된다.

이번 오픈 코-LLM 리더보드 개설에는 최근 발표된 업스테이지와 KT의 협업도 한 몫 했다. AI 생태계 확대에 양사가 힘을 합쳐 KT 클라우드의 인프라 지원을 통해 리더보드가 안정적으로 운영될 예정이다.

업스테이지는 한국어 리더보드를 구축, 업스테이지는 1T클럽을 기반으로 한 한국어 데이터를 바탕으로 한국문화 정서를 담아낼 수 있는 고품질의 LLM을 개발하는 것을 넘어 이를 국내 LLM 독립을 위한 생태계 조성에 기여할 계획이다.

업스테이지 김성훈 대표는 “앞으로도 1T클럽을 포함한 고품질 한국어 데이터 공유는 물론, 리더보드를 통한 협업 촉진과 빠른 기술 전파 등을 통해 한국 AI 생태계를 넓히고 발전을 증진시킬 수 있도록 더욱 노력 할 것”이라고 밝혔다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0

주요 뉴스

  • 이재명, '위증교사 1심 무죄'..."죽이는 정치 말고 살리는 정치 해야"
  • "여보! 부모님 폰에 ‘여신거래 안심차단’ 서비스 해드려야겠어요" [경제한줌]
  • 갖고 싶은 생애 첫차 물어보니…"1000만 원대 SUV 원해요" [데이터클립]
  • 농심 3세 신상열 상무, 전무로 승진…미래 먹거리 발굴 힘 싣는다
  • ‘아빠’ 정우성, 아이 친모는 문가비…결혼 없는 양육 책임 뒷말 [해시태그]
  • 논란의 트럼프 2기 행정부 인선…막후 권력자는 당선인 아들
  • 국민연금, 삼성전자 10조 ‘증발’ vs SK하이닉스 1조 ‘증가’
  • "권리 없이 책임만" 꼬여가는 코인 과세…트럭·1인 시위 ‘저항 격화’
  • 오늘의 상승종목

  • 11.25 장종료

실시간 암호화폐 시세

  • 종목
  • 현재가(원)
  • 변동률
    • 비트코인
    • 133,297,000
    • +0.03%
    • 이더리움
    • 4,822,000
    • +5.05%
    • 비트코인 캐시
    • 709,500
    • +2.09%
    • 리플
    • 2,054
    • +9.31%
    • 솔라나
    • 336,000
    • -1.75%
    • 에이다
    • 1,379
    • +1.85%
    • 이오스
    • 1,139
    • +1.52%
    • 트론
    • 277
    • -1.77%
    • 스텔라루멘
    • 717
    • +9.3%
    • 비트코인에스브이
    • 95,750
    • +2.96%
    • 체인링크
    • 25,430
    • +10.18%
    • 샌드박스
    • 1,034
    • +32.9%
* 24시간 변동률 기준