개발비 ‘10분의 1’로 줄인 딥시크…중국은 AI 가격 경쟁 중

입력 2025-02-01 06:00

이은주 기자

기자 이름을 클릭하면
더 자세한 정보를
확인할 수 있어요!

북마크 되었습니다.
마이페이지에서 확인하세요.

가장작게
작게
기본
크게
가장크게

알리바바클라우드 자사 LLM 97%까지 인하
바이트댄스는 신규 AI 공개 “오픈AI o1보다 뛰어나”
오픈소스 생태계 경쟁력에도 관심…비용 절감 효과

▲미국과 중국 국기를 배경으로 스마트폰에 중국 생성형 AI 딥시크 로고가 보인다. (로이터연합뉴스)

‘인공지능(AI)의 스푸티니크 모멘트’를 이끈 중국 AI 기업들이 자사 모델 가격을 획기적으로 낮추는 ‘출혈 경쟁’에 돌입하고 있다. 글로벌 패권 경쟁에서 AI 개발 비용을 줄이는 대신 가격 경쟁력으로 승부 보겠다는 전략이다.

1일 AI 업계에 따르면 중국의 AI 스타트업 딥시크(DeepSeek)는 AI 추론 모델 ‘알원(R1)’을 공개했다. 딥시크는 기술 보고서를 통해 기존 V3 모델을 미세조정(파인튜닝)하면서도 AI가 스스로 답을 찾도록 추론 능력을 향상하는 ‘강화학습(RL)’을 통해 R1을 개발했다고 밝혔다.

딥시크는 R1이 ‘미국 수학경시대회(AIME) 풀이 정확도’ 테스트에서 79.8%를 기록하며 오픈AI의 오원(o1) 모델을 앞섰다고 했다. 언어 이해를 측정하는 벤치마크(MMLU)와 수학 능력을 평가하는 벤치마크(MATH-500) 등 부문에서도 오픈AI 모델과 유사한 성능이었다.

특히 딥시크는 AI 모델의 개발 비용을 확 낮췄다. 딥시크는 V3의 개발비가 약 557만6000만 달러(약 78억8000만 원)라고 발표했는데, 이는 메타가 ‘라마(LLaMA)3’를 만들 때 투입했던 비용의 10분의 1 수준에 불과한 수준이다.

▲1월 31일 딥시크의 AI 챗봇 '딥시크'가 애플 앱스토어에서 무료 다운로드 앱 1위에 올랐다. (출처=애플 앱스토어 캡처)

중국 AI 모델은 사용료를 대폭 낮춰 ‘가격 경쟁력’을 내세우고 있다. 딥시크는 오픈AI나 구글처럼 사용료를 내야 하는 폐쇄형 방식이 아닌, 오픈소스 방식을 채택하고 있다. 딥시크의 AI 서비스 챗봇인 ‘딥시크’는 무료 애플리케이션(앱)으로 제공한다.

알리바바클라우드도 ‘퉁이첸원(Tongyi Qwen)’ 등 자사 거대언어모델(LLM) 가격을 최대 97%까지 인하하며 AI 경쟁에 참전했다. 또, ‘큐웬 브이엘(Qwen-VL) 가격도 최대 85% 낮췄다.

특히 지난달 29일 알리바바클라우드는 공식 사회관계망서비스(SNS)에서 새로운 AI 모델 ‘큐웬(Qwen) 2.5’를 공개하면서, 오픈AI GP4 4o, 딥시크 V3, 메타 라마3 등 AI 모델과 비교했을 때 웃도는 성능을 제공한다고 강조했다. 이 모델은 20조 개 이상의 토큰을 사전 훈련 데이터로 사용했다. 틱톡의 모회사 바이트댄스도 자사 AI 서비스인 ‘두바오(Doubao)’ 가격을 99%까지 낮췄다. 바이트댄스는 최근 AI 모델 ‘두바오-1.5 프로’를 출시하면서 오픈AI o1보다 AIME 벤치마크에서 더 좋은 성능을 보였다고 강조했다.

중국이 ‘저비용 고성능’ AI를 개발할 수 있었던 건, 프로그램 개발 과정을 공개해 누구나 접근할 수 있도록 하는 오픈소스 커뮤니티가 기술력을 획기적으로 끌어 올린 것으로 분석된다.

워싱턴포스트는 “주목할 점은 딥시크 전체 모델이 오픈소스라는 점”이라며 “누구나 재생산하고 확장할 수 있는 ‘오픈 가중치’가 존재한다”고 설명했다. 이어 “미국식 폐쇄형 소스 모델은 모델 가중치와 학습방법을 보호해 역량 격차를 보존할 수 있지만, 오픈소스 모델은 사용 비용이 저렴해 이점이 있다”며 “딥시크가 훨씬 적은 비용으로 경쟁한다면 미국 빅테크 기업이 받는 압박은 극도로 커질 것”이라고 했다.

또한, AI 강화학습을 통해 데이터 학습 비용을 줄인 것도 한몫했다. 기존 AI 모델은 대규모 데이터를 학습해 확률을 추론하는 ‘사전학습’ 기반이다. 이에 반해 강화학습을 활용하면, AI가 차등적인 보상을 통해 스스로 학습에 필요한 데이터를 도출해낼 수 있다.

워싱턴포스트는 “딥시크는 메타의 라마3와 같은 공개적으로 사용 가능한 기본 모델을 가져와 강화학습을 통해 추론하도록 가르쳐 더 비용 효율적으로 수행하도록 했다”고 봤다.