엔비디아, AI 에이전트 모델 공개… “사람 개입없이 알아서 작업”
||2026.03.12
||2026.03.12
엔비디아가 인공지능(AI) 에이전트 구동에 특화된 개방형 AI 모델을 공개했다. 동시에 AI 클라우드 기업 네비우스에 20억달러를 투자하며 AI 인프라 생태계 확대에도 나섰다. 칩 개발을 넘어 모델과 인프라까지 영향력을 넓히며 AI 시장 장악력을 강화하려는 행보로 풀이된다.
엔비디아는 지난 10일(현지시각) 매개변수 1200억 개 규모의 개방형 AI 모델 ‘네모트론3 슈퍼(Nemotron 3 Super)’를 출시한다고 밝혔다.
해당 모델은 사람의 개입 없이 스스로 판단하고 도구를 활용해 작업을 수행하는 ‘AI 에이전트’ 구동에 맞춰 설계된 것이 특징이다. AI 에이전트는 단순히 질문에 답하는 챗봇과 달리 여러 단계의 추론과 외부 도구 활용을 반복하며 작업을 수행한다. 이 과정에서 데이터와 맥락 정보를 반복적으로 처리해야 해 일반 챗봇보다 최대 15배 많은 데이터 처리량이 필요하다. 그만큼 연산 자원과 비용 부담도 커진다.
네모트론3 슈퍼는 필요한 연산만 선택적으로 활용하는 구조를 적용해 비용 효율을 높였다. 전체 1200억개 매개변수 가운데 실제 연산에는 일부만 활용하는 방식이다.
또 한 번에 기억할 수 있는 데이터량을 크게 늘려 이전 작업 결과를 반복적으로 불러오는 비효율을 줄였다. 최대 100만 토큰 길이의 문맥을 처리할 수 있어 복잡한 작업을 수행하는 AI 에이전트에 적합하다. 특히 최신 ‘블랙웰’ 칩에서 구동할 경우 이전 세대 ‘호퍼’ 칩보다 추론 속도가 최대 4배 빠르다는 게 회사측 설명이다.
업계에서는 엔비디아가 칩 개발에 이어 AI 모델을 개방형으로 공개한 배경에 주목하고 있다. 성능이 높은 모델을 자사 GPU에 최적화해 제공하면 고객이 다른 AI 칩으로 이동하기 어려워지는 ‘록인(lock-in)’ 효과를 기대할 수 있기 때문이다.
젠슨 황 엔비디아 최고경영자(CEO)는 “개방형 모델은 AI 발전 과정에서 핵심 역할을 한다”며 “연구자와 스타트업, 기업뿐 아니라 국가 단위까지 개방형 모델을 기반으로 AI 경쟁에 참여하고 있다”고 말했다.
아울러 엔비디아는 이날 네덜란드 암스테르담에 본사를 둔 AI 클라우드 기업 네비우스와 전략적 파트너십을 체결하고 20억 달러를 투자한다고도 밝혔다.
양사는 AI 데이터센터 설계와 추론·에이전트 기술 최적화, 차세대 엔비디아 칩 조기 도입 등에서 협력할 예정이다. 네비우스는 2030년까지 5기가와트(GW) 규모의 엔비디아 시스템 구축을 추진한다.
황 CEO는 “AI는 새로운 전환점을 맞고 있다”며 “에이전트 AI가 막대한 연산 수요를 만들어내며 인프라 구축을 가속하고 있다”고 말했다.
한편, 엔비디아는 지난 1월 네비우스 경쟁사인 코어위브에도 20억 달러를 투자했다. 최근에는 영국 클라우드 기업 엔스케일의 자금 조달에도 참여했다.
전대현 기자
jdh@chosunbiz.com
고객님만을 위한 맞춤 차량
