[써보니] ‘도널드 트럼프’ 묻자 그록3·딥시크가 한 답변은?

입력 2025-02-21 15:50

  • 가장작게

  • 작게

  • 기본

  • 크게

  • 가장크게

그록3 "트럼프, 전통적인 정치 틀 깨부숴"
딥시크 "미국 리더십은 여전히 논쟁의 중심"
수능 영어, 그록3은 틀리고 GPT·딥시크는 맞췄다

▲21일 xAI의 '그록3' 베타버전이 "도널드 트럼프 미국 대통령의 이미지를 만들어달라"는 프롬프트에 따라 이미지를 생성했다. (xAI의 '그록3'이 생성한 이미지.)
▲21일 xAI의 '그록3' 베타버전이 "도널드 트럼프 미국 대통령의 이미지를 만들어달라"는 프롬프트에 따라 이미지를 생성했다. (xAI의 '그록3'이 생성한 이미지.)

“도널드 트럼프는 전통적인 정치의 틀을 깨고 포퓰리즘과 미디어 활용을 극대화한 인물로 역사에 기록될 가능성이 높습니다.”

인공지능(AI) 기업 ‘xAI’의 최신 AI 모델 ‘그록3’ 베타버전이 도널드 트럼프 미국 대통령을 평가한 내용이다. 그러면서 그록3은 “그러나 동시에 그는 분열과 논란의 상징이기도 하다”며 “지지자들은 그를 ‘파격적 혁신가’로, 비판자들은 ‘위험한 선동가’로 보는데, 이 양극단 사이에서 그의 진짜 유산은 시간이 지나며 더 명확해질 것”이라고도 했다.

21일 ‘그록3’의 베타 버전을 직접 써봤다. 그록3에게 한국어로 ‘도널드 트럼프에 대해 평가해줘’라는 프롬프트를 입력하자, 위와 같은 답변을 내놨다. 이어 그록3은 “트럼프의 재선(2024년 대선 승리)은 여전히 미국 내에서 강력한 지지 기반이 존재한다는 점을 보여준다”며 최신 정보도 제공했다.

▲21일 "도널드 트럼프 미국 대통령에 대해 평가해달라"는 프롬프트에 대해 그록3 베타버전이 답변한 내용. (xAI의 '그록3' 베타버전)
▲21일 "도널드 트럼프 미국 대통령에 대해 평가해달라"는 프롬프트에 대해 그록3 베타버전이 답변한 내용. (xAI의 '그록3' 베타버전)

그록3의 특징은 데이터 학습량과 최신 정보 업데이트 등이다. 그록3은 엔비디아 그래픽처리장치(GPU) H100 10만 개를 탑재한 슈퍼컴퓨터에서 2억 시간 훈련됐다. 최근엔 20만 개까지 GPU 규모를 높였으며, 향후 100만 개까지 확대할 계획이다. 창업자인 일론 머스크는 개발자들과 그록3을 공개하며 “지구에서 가장 똑똑한 AI다. 어떤 챗봇보다도 뛰어난 성능을 보인다”고 강조한 바 있다.

똑같은 프롬프트를 이번엔 중국의 추론형 AI ‘딥시크’에 입력해봤다. 딥시크는 강화학습 등으로 모델 개발비를 줄였으나, 중국 정부의 입장을 과도하게 대변하는 환각은 잡지 못했다는 평가를 받고 있다.

딥시크는 “도널드 트럼프는 미국에 큰 영향을 미쳤다. 그의 강력한 지지 기반과 함께 극심한 반대 세력도 존재하며, 그의 정책과 리더십 스타일은 여전히 논쟁의 중심에 있다”고 답했다. 딥시크는 △경제성장 △북한과의 외교 △반체제적 리더십을 긍정 평가로, △분열적 리더십 △탄핵 사건 △코로나19 대응 △국제적 관계 악화를 부정 평가로 분류했다.

▲21일 "도널드 트럼프 미국 대통령에 대해 평가해달라"는 프롬프트에 대해 딥시크 V3이 답변한 내용. (딥시크의 '딥시크 V3')
▲21일 "도널드 트럼프 미국 대통령에 대해 평가해달라"는 프롬프트에 대해 딥시크 V3이 답변한 내용. (딥시크의 '딥시크 V3')

특히 트럼프 대통령의 ‘파리기후협정 탈퇴’에 대해 두 모델은 상반된 평가를 했다. 딥시크는 트럼프가 파리기후협정 등 국제적 협약에서 탈퇴하는 것으로 인해 “다른 나라와의 관계가 악화했고, 미국의 국제적 위상도 떨어졌다”고 답했다. 반면 그록3는 “국경장벽 건설, 파리기후협정 탈퇴 등 논란이 많았던 공약을 실제로 추진하며 지지자들의 신뢰를 얻었다”는 관점에서 긍정적이라고 분석했다.

그록3는 대부분의 답변에서 미국 정부 및 언론 등의 영향을 받은 것으로 분석된다. 실제로 그록3가 학습한 데이터셋 다수가 합성됐다. 합성데이터란 실제 데이터를 모방해 인공적으로 생성한 데이터다. AI의 학습용 데이터에서 합성데이터가 많이 포함될수록 추론 정확도가 떨어지고 환각이 강화될 수 있다. 그록3은 스스로 학습하고 오류를 수정하는 ‘자가 수정’ 기술과, 합성 데이터의 대량 학습, 사회관계망서비스(SNS) ‘엑스(X)’의 실시간 학습 등으로 모델을 고도화 한다고 발표된 바 있다.

언어 분야의 정확도도 떨어졌다. ‘2025 대학수학능력시험’ 영어영역에서 가장 오답률(84.3%)이 높았던 32번 문항을 입력하니 잘못된 답안을 내놨다. 주목할 만한 점은 학생들이 많이 틀렸던 보기인 1번과 2번을 맞는 것으로 제시한 것이다. 반면 오픈AI의 ‘GPT 4o’와 딥시크의 ‘딥시크 V3’은 맞는 답을 도출했다.

그럼에도 불구하고 그록3는 수학, 컴퓨팅 등 영역에서 높은 정확도를 보였다. ‘파이썬 프로그래밍 언어를 사용한 게임을 만들고 싶다’는 요청에 “간단한 숫자 맞추기 게임”을 예로 들며 코드를 써 내려 갔다. 그록3는 게임 시도 횟수, 점수 시스템 조정, 힌트 주기 로직 추가 등 세밀한 코드까지 추가해줬다. 파이썬을 잘 모르는 이용자를 위해 파이썬 설치 환경, 파일 입력 등 실행 방법도 자세히 설명해줬다. 실제로 xAI는 그록3는 수학, 과학, 코딩 벤치마크 테스트에서 구글의 제미나이, 딥시크 V3, 오픈AI의 GPT-4o 등을 앞질렀다고 했다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0

주요 뉴스

  • 트럼프 “애플, 미국으로 공장 이전할 것…수억 달러 미국 투자도”
  • 한화가 기다리고 있는 LCK컵 결승, 최종 승리 팀은 어디가 될까? [딥인더게임]
  • [투자전략] 이제는 금보다 은?…ETF로 투자해볼까
  • 애니메이션으로 돌아오는 퇴마록…이우혁 표 오컬트 판타지 [시네마천국]
  • "양산서 미나리 맛보세요"…남이섬ㆍ쁘띠 프랑스에선 마지막 겨울 파티 [주말N축제]
  • 점점 치열해지는 글로벌 빅테크 '양자' 경쟁
  • ‘무신사 장학생’ 데뷔 팝업…차세대 K패션 브랜드 ‘시선 집중’ [가보니]
  • ‘싱글몰트 위스키 대명사’ 글렌피딕 제대로 즐기는 방법은? [맛보니]
  • 오늘의 상승종목

  • 02.21 장종료

실시간 암호화폐 시세

  • 종목
  • 현재가(원)
  • 변동률
    • 비트코인
    • 142,010,000
    • -1.95%
    • 이더리움
    • 3,972,000
    • -2.1%
    • 비트코인 캐시
    • 468,400
    • -3.36%
    • 리플
    • 3,800
    • -3.7%
    • 솔라나
    • 253,700
    • -2.46%
    • 에이다
    • 1,124
    • -4.83%
    • 이오스
    • 923
    • -3.35%
    • 트론
    • 351
    • -4.62%
    • 스텔라루멘
    • 483
    • -3.78%
    • 비트코인에스브이
    • 54,900
    • -3.17%
    • 체인링크
    • 25,760
    • -4.91%
    • 샌드박스
    • 521
    • -7.3%
* 24시간 변동률 기준