기업

오피니언

논현논단

논현광장

시론

AI 만평

데스크 시각

마감 후

칼럼

노트북 너머

이슈n인물
증권·금융

공시

시황

시세

환율

장외/IPO

특징주

투자전략

채권/펀드

금융

일반
부동산

시장동향

업계

정책

분양

일반
기업

재계

전자/통신/IT

자동차

중화학

항공/물류

유통

의료/바이오

중기/벤처

일반
글로벌경제

국제경제

국제일반

국제시황

미국

중국

아시아

유럽/중동
정치·경제

대통령실/총리실

정책

국회/정당

국방/외교

경제

일반
사회

사건/사고

노동/취업

법조

교육

전국

인사/동정/부음

오비추어리

일반
문화·라이프

방송/TV

영화

음악

공연/출판

스포츠

일반
뉴스발전소

이슈크래커

요즘, 이거

그래픽스

한 컷

엔비디아, 구글과 협력…AI 모델 '젬마' 최적화

입력 2024-02-23 11:10

박민웅 기자

기자 이름을 클릭하면
더 자세한 정보를
확인할 수 있어요!

북마크 되었습니다.
마이페이지에서 확인하세요.

가장작게
작게
기본
크게
가장크게

엔비디아가 구글과 협력해 자사의 인공지능(AI) 플랫폼에서 AI 모델 '젬마'(Gemma)를 위한 최적화를 실시했다고 23일 밝혔다.

젬마는 구글의 새로운 경량 오픈 언어 모델이다. 20억(2B) 파라미터와 70억(7B) 파라미터 크기로 제공된다.

젬마는 구글의 멀티모달 모델인 제미나이(Gemini) 개발에 사용된 동일한 연구와 기술을 기반으로 구축됐다. 엔비디아는 구글과 긴밀히 협력해 엔비디아 텐서RT-LLM(TensorRT-LLM)으로 젬마의 성능을 가속화했다. 텐서RT-LLM은 데이터센터, 클라우드 혹은 엔비디아 RTX GPU가 탑재된 PC에서 대규모 언어 모델(LLM) 추론을 최적화하는 오픈 소스 라이브러리이다.

이를 통해 개발자는 전 세계 고성능 AI PC에 탑재된 1억 개 이상의 엔비디아 RTX GPU를 활용할 수 있다.

개발자들은 클라우드 상의 엔비디아 GPU에서도 젬마를 실행할 수 있다. 여기에는 H100 텐서 코어(H100 Tensor Core) GPU를 기반으로 하는 구글 클라우드 A3인스턴스(A3 instances)가 포함된다. 1초당 4.8테라바이트의 141GB HBM3e 메모리를 갖춘 엔비디아 H200 텐서 코어 GPU도 합류할 예정이다. 구글은 올해 안에 이를 배포할 예정이다.

엔비디아는 네모 프레임워크(NeMo Framework)가 적용된 엔비디아 AI 엔터프라이즈(AI Enterprise)와 텐서RT-LLM을 비롯한 광범위한 도구를 갖추고 있다. 엔터프라이즈 개발자들은 이들을 추가로 활용해 젬마를 미세 조정하고 최적화된 모델을 프로덕션 애플리케이션에 배포할 수 있다.

한편 엔비디아 기술 데모인 챗 위드 RTX에 젬마가 추가로 지원될 예정이다. 챗 위드 RTX는 검색 증강 생성(RAG)과 텐서RT-LLM 소프트웨어를 사용해 로컬 RTX 기반 윈도우(Windows) PC에서 사용자에게 생성형 AI 기능을 제공하는 기술이다.

사용자는 챗 위드 RTX를 통해 PC의 로컬 파일을 LLM에 쉽게 연결하고 자신의 데이터로 챗봇을 개인화할 수 있다.

관련 뉴스

#엔비디아 #구글

박민웅 기자의 주요 뉴스

자세히보기

좋아요0
화나요0
슬퍼요0
추가취재 원해요0

주요 뉴스

이투데이, 2026년 새해맞이 ‘다음채널·지면 구독’ 특별 이벤트

3월 3일까지… 온라인 채널 구독 및 지면 구독 프로모션 동시 실시추첨 통해 스타벅스 쿠폰 증정 및 1년 구독료 4만 원 할인 혜택 제공 프리미엄 경제신문 이투데이가 2026년 새해를 맞아 독자들의 성원에 보답하기 위한 풍성한 경품 이벤트를 마련했다. 이투데이는 지난달 28일부터 3월 3일까지 온·오프라인 독자를 아우르는 ‘2026 새해맞이 다
빗썸, 비트코인 오지급 사고 후속 조치 발표…피해구제전담반 신설

빗썸은 최근 발생한 비트코인(BTC) 오지급 사고와 관련해 끝까지 책임을 지기 위한 대책을 마련했다고 7일 밝혔다. 이번 사고의 재발을 막기 위해 경영진 주도의 전사 위기관리 체계를 가동할 계획이다. 경영진을 중심으로 전 사업부문이 협력해 사고를 수습하는 동시에, 고객 자산 보호와 거래 안정성을 강화해 나간다는 방침이다. 피해 구제를
최태원, 李대통령 '가짜뉴스' 지적에 "재발 없도록 만전" 지시

이재명 대통령이 상속세 부담에 따른 자산가 해외 유출 통계를 두고 "가짜뉴스"라고 비판하자 최태원 대한상공회의소 회장이 유사 사례 재발 방지를 주문했다. 대한상의도 외부 통계 인용 과정에서 검증이 부족했다며 공식 사과하고 내부 점검 강화 방침을 밝혔다. 7일 연합뉴스에 따르면 최 회장은 이번 보도자료 논란과 관련해 "책임있는 기관
BTS, 군백기도 막지 못한 인기⋯'토트넘 홈구장' 12만석 매진

그룹 방탄소년단(BTS)이 영국 런던 토트넘 홋스퍼 스타디움에서 단일 공연 사상 최고 객석 점유율을 달성하며 변함없는 인기를 입증했다. 6일 공연기획사 라이브네이션 UK 측은 “방탄소년단의 아미(팬덤)가 토트넘 홋스퍼 스타디움 단일 공연 사상 최고 객석 점유율(Highest Single Show Capacity)을 달성했다”라고 밝혔다. 방탄소년단은 오는 7
로또 복권, 이제부터 스마트폰에서도 산다

복권제도 22년만 개편…1인당 회차별 5000원 가능 9일부터 평일 오전 6시~자정까지…상반기 시범운영 법정배분제도 개편…'수익금 35%'→'35%내'로 정부가 2004년 복권법 제정 이후 22년 만에 복권제도 전면 개편을 추진한다. 기존에는 복권판매점이나 PC로만 구매가 가능했던 로또복권을 9일부터 모바일로도 구매할 수 있게 된다. 복권수익금 35%를
李 대통령 "대한상의가 가짜뉴스 생산"…상속세 자료 두고 정면 비판

이재명 대통령이 대한상공회의소의 상속세 관련 보도자료와 이를 인용한 일부 보도에 대해 "가짜뉴스"라고 규정하며 강하게 비판했다. 이 대통령은 7일 자신의 X(옛 트위터)에 '존재하지도 않는 백만장자 탈한국…철 지난 떡밥 덥석 문 보수언론들'이라는 제목의 기사를 공유하며 "사익 도모와 정부 정책 공격을 위해 가짜뉴스를 생산해 유포하는
‘가격 상승’ 넘어 ‘공급 확대’ 국면으로…2027년까지 이어질 메모리 반도체 호황

메모리 반도체 산업이 인공지능(AI) 수요 폭증에 힘입어 2027년까지 장기 호황 국면에 진입할 것이라는 낙관적인 전망이 나왔다. 특히 반도체 업계의 무게중심이 단순한 ‘가격 상승’을 넘어 ‘설비 투자 확대’로 이동함에 따라, 그간 소외됐던 소재·부품·장비(소부장) 기업들도 본격적인 수혜를 입을 것이라는 분석이다. 7일 미래에셋증권 보고서
하이닉스 2964% 성과급ㆍ삼성 1752억 자사주⋯핵심 인력 유지 사활

반도체 업황 반등과 함께 삼성전자와 SK하이닉스의 보상 규모가 역대 최대 수준으로 확대됐다. 사상 최대 실적이 성과급으로 이어지면서 ‘성과급 잔치’라는 평가가 나오지만 업계에서는 이를 인공지능(AI) 반도체 경쟁 심화 속에서 인재 확보를 위한 보상 체계 자체가 재편되는 신호로 보고 있다. 7일 업계에 따르면 SK하이닉스는 지난해 사상

많이 본 뉴스

최신 영상

정청래 대표가 조국혁신당과 합당하려고 하는 이유?! I 노정태 I 임윤선 I 정치대학

기업 최신 뉴스

뉴스발전소

키키도 소환한 그 감성⋯Y2K, 왜 아직도 먹히냐면요 [솔드아웃]

내가 저장한 뉴스 모아보기

내가 구독한 기자 전체보기

한 컷

'노란 등불 밝힌 봄의 전령사' [한컷]

마켓 뉴스

오늘의 상승종목
02.06 장종료

1.조비

2,520
2.대양금속

185
3.한화솔루션

5,600
4.우진플라임

285
5.일신석재

205

실시간 암호화폐 시세

종목
현재가(원)
변동률

- 비트코인
- 101,726,000
- -2.32%
- 이더리움
- 3,018,000
- -0.56%
- 비트코인 캐시
- 775,000
- +5.08%
- 리플
- 2,089
- -6.03%
- 솔라나
- 128,200
- -0.7%
- 에이다
- 402
- -2.66%
- 트론
- 409
- +0.99%
- 스텔라루멘
- 239
- -4.02%
- 비트코인에스브이
- 20,800
- +0%
- 체인링크
- 13,030
- -0.46%
- 샌드박스
- 133
- +1.53%

* 24시간 변동률 기준