1조 토큰 훈련에 약 13억원 비용”

24일 블룸버그통신에 따르면 앤트그룹은 중국산 반도체를 사용해 AI 모델 훈련 비용을 20% 절감하는 기술을 개발했다고 밝혔다.
한 소식통은 “앤트가 알리바바의 다른 자회사와 화웨이테크놀로지가 개발한 중국산 칩을 사용해 머신러닝 중 ‘전문가 혼합(MoE)’ 접근 방식을 통해 AI 모델을 훈련시켰다”며 “이 방식은 엔비디아의 ‘H800’ 칩과 유사한 결과를 얻었다”고 설명했다. 앤트는 여전히 엔비디아 칩을 사용하고 있지만, 최신 모델에서는 AMD와 중국산 칩을 주로 사용하고 있다고 블룸버그는 덧붙였다.
중국 딥시크가 AI 모델을 저렴하게 훈련시킬 가능성을 보여준 가운데 다른 중국 기업들도 저비용 고효율의 AI 개발에 총력을 기울이고 있다.
앤트는 이달 발표한 연구 논문에서 특정 벤치마크에는 메타의 AI 모델을 능가하는 성과를 기록했다고 주장했다. 다만 이 주장은 아직 독립적으로 검증되지 않았다. 만약 이 주장이 사실이라면, 앤트 플랫폼은 AI 서비스의 추론 비용을 절감하는 데 중요한 역할을 할 수 있다고 블룸버그는 평가했다.
관련 뉴스
머신러닝 훈련 방법 중 MoE 모델은 구글과 딥시크 등이 활용하고 있다. 이 기술은 작업을 작은 데이터 세트로 나누어 처리하는 방식으로 효율성을 높인다.
앤트는 “고성능 하드웨어를 사용해 1조 토큰을 훈련하는 데 약 635만 위안(약 13억 원)이 들어간다”며 “최적화된 접근 방식을 통해 저사양 하드웨어를 사용해 비용을 510만 위안으로 줄일 수 있다”고 주장했다. 토큰은 AI 모델이 세계에 대해 학습하고 사용자 질의에 유용한 응답을 제공하기 위해 처리하는 정보 단위다.
앤트는 최근 개발한 거대언어모델(LLM)인 ‘링 플러스’와 ‘링 라이트’를 활용해 의료와 금융 산업용 AI 솔루션을 제공할 계획이다.