‘한번 더 AI 혁명’ 엔비디아, "컴퓨팅 모든 영역 다시 쓴다"
||2025.05.19
||2025.05.19
[타이페이(대만)=디지털투데이 석대건 기자] 엔비디아가 한번 더 차세대 AI 인프라 혁명을 이끌 핵심 기술들을 대거 공개했다.
블랙웰 GPU와 NV링크 퓨전을 중심으로 개인용부터 대규모 데이터센터용까지 모든 규모의 AI 컴퓨팅 솔루션을 선보였다. 젠슨 황 CEO는 "데이터센터가 AI 팩토리로 진화하는 새로운 시대"라고 강조했다.
젠슨 황 엔비디아 CEO는 19일 대만 타이페이에서 열린 컴퓨텍스 2025 키노트에서 인프라로 전환하는 엔비디아의 미래 비전을 전했다.
젠슨 황 CEO는 "엔비디아는 기술 회사만이 아닌 필수 인프라 기업"이라며 "세계 모든 지역이 데이터 센터를 구축할 수 있도록 지원해야 한다"고 말했다. 이어 "현재는 1조 달러 규모의 데이터센터 시장을 넘어 조 단위로 측정될 AI 인프라 산업으로 확장하고 있다"고 설명했다.
이날 엔비디아는 AI 인프라 확장과 개인용 AI 시스템부터 기업용 AI 솔루션까지 다양한 영역의 기술을 대거 공개했다. 젠슨 황 CEO는 'NVLink 퓨전', 'DGX 스파크', 'DGX 스테이션', 'RTX 프로 서버' 등 AI를 위한 솔루션을 직접 소개하며 이들 기술이 AI 컴퓨팅 성능을 획기적으로 향상시킬 것이라고 강조했다.
키노트에는 엔비디아 차세대 GPU 아키텍처인 블랙웰에 가장 관심이 모아졌다. 젠슨 황 CEO는 블랙웰을 "엔지니어링의 경이로움"이라고 표현하며, AI 추론 성능을 비약적으로 향상시킨다고 설명했다.
젠슨 황 CEO는 "우리는 생각할 때 머릿속에서 많은 토큰을 생성하고, 답을 내놓기 전에 뇌에서 반복한다"며 "이전에는 원샷 AI였다면 이제 생각하는 AI, 추론하는 AI가 될 것이며, 이는 훨씬 더 많은 계산을 필요로 한다"고 말했다.
여기서 원샷 AI란 'OSL(One-shot learning)'로, 각 클래스(범주)에 대해 단 하나의 예시만을 보고도 새로운 데이터를 해당 클래스로 분류하거나 인식할 수 있도록 학습 방법이다.
이어 "우리는 추론 시간 스케일링, 즉 믿을 수 없을 정도로 빠른 사고를 가능하게 하는 새로운 컴퓨터를 만들어 왔다"며 블랙웰 GPU를 이를 실현하게 할 것이라고 설명했다.
◆ 젠슨 황 "블랙웰, 엔지니어링의 경이로움"
블랙웰 GPU는 TSMC의 CoWoS-L 공정을 통해 제작되며, 두 개의 칩을 연결하는 방식으로 더 큰 규모의 처리 능력을 제공한다. 여기에는 약 200억 개의 트랜지스터를 포함하며, 각 계층이 12인치 웨이퍼에 하나씩 구축된다.
젠슨 황 CEO는 블랙웰 기반 시스템인 'GB200'과 곧 출시될 'GB300'를 소개하며, GB300이 GB200보다 1.5배 높은 추론 성능, 1.5배 많은 HBM 메모리, 2배 높은 대역폭을 제공한다고 설명했다.
젠슨 황 CEO은 "GB200 노드 하나는 40 페타플롭스의 성능을 제공하는데, 이는 2018년 1만8000개의 볼타 GPU를 사용한 시에라 슈퍼컴퓨터와 동등한 성능"이라며 "6년 만에 성능이 4000배가 증가했다"고 말했다.
엔비디아는 GPU 간 통신을 위한 'NV링크(LVLink)'도 소개했다. 젠슨 황 CEO는 LV링크에 대해 "세계에서 가장 빠른 스위치"라고 강조하며, 이 기술이 전체 데이터센터를 하나의 거대한 컴퓨팅 유닛으로 변환시킬 것이라고 강조했다.
이날 새롭게 공개된 'NVLink 퓨전'은 이러한 NV링크 기술을 산업체가 더 유연하게 활용할 수 있도록 확장한 버전이다. 각 지역에 산발적으로 흩어진 데이터센터를 연결하는 고리로 활용하겠다는 시도다.
젠슨 황은 "수십 년 만에 처음으로 데이터 센터를 근본적으로 재설계해야 하는 거대한 변화가 진행 중"이라며 "AI가 모든 컴퓨팅 플랫폼에 융합되고 있다"고 말했다. 이어 "NV링크 퓨전은 파트너들이 특화된 AI 인프라를 구축할 수 있도록 엔비디아의 AI 플랫폼과 생태계를 개방한다"고 설명했다.
이미 미디어텍, 마벨, 알칩 테크놀로지스, 아스테라 랩스, 시놉시스, 케이던스 등이 NV링크 퓨전을 채택했다. 각 기업은 모델 학습 및 에이전틱 AI 추론과 같은 데이터센터 기업의 워크로드 요구사항을 충족하는 맞춤형 실리콘 스케일업을 지원하고 있다. 또 NV링크 퓨전을 사용하면 후지쓰와 퀄컴 테크놀로지스의 CPU를 엔비디아 GPU와 통합할 수 있다.
GB200 NVL72와 GB300 NVL72 랙이 하나로 결합된 '5세대 NVLink 플랫폼'은 GPU당 총 1.8TB/s의 대역폭을 제공한다. 이는 PCIe Gen5보다 14배 빠른 속도다. 젠슨 황은 이 시스템이 "AI 팩토리 처리량과 성능을 가장 전력 효율적인 방식으로 극대화하기 위해 설계되었다"고 설명했다.
하나의 랙이 하나의 마더보드로 기능하는 이 시스템은 GPU 성능, 메모리 용량, 네트워킹 대역폭 모두에서 획기적 제공한다. 한 랙에 72개의 GPU가 들어가는 이 시스템은 총 120킬로와트의 전력을 사용하기 때문에 모든 구성요소가 수냉식으로 설계됐다.
젠슨 황은 이런 랙 시스템을 "AI 팩토리"로 표현하며 "우리가 구축하는 것은 데이터센터와 서버가 아니라 AI 팩토리"라고 강조했다.
엔비디아는 대규모 데이터센터 솔루션에 대해 소규모 AI 솔루션도 업데이트했다. 이날 공개된 'DGX 스파크'는 개발자, 학생, 연구자를 위한 1페타플롭스 성능의 개인용 AI 시스템으로, 데스크톱 옆에 두고 사용할 수 있는 AI 클라우드 역할을 한다. DGX 스파크는 델, HPI, 에이수스, 기가바이트, 레노버 등의 파트너사를 통해 출시될 예정이다.
또 더 큰 규모의 개인용 슈퍼컴퓨터인 'DGX 스테이션'도 공개됐다. 이 시스템은 표준 콘센트에서 얻을 수 있는 최대 성능을 제공하며, 1조 파라미터 AI 모델을 실행할 수 있는 능력을 갖추고 있다.
젠슨 황 CEO 는 "이는 일반 벽면 콘센트에서 얻을 수 있는 최대 성능"이라며 "부엌에 놓을 수도 있지만, 전자레인지와 동시에 사용하는 것은 어려울 수 있다"고 농담을 섞어 설명했다.
기업용 솔루션으로는 'RTX 프로 서버'가 공개됐다. 이 서버는 RTX 6000 Ada 세대 GPU를 탑재하고 있으며, 전통적인 기업 IT 환경과 AI 워크로드를 동시에 지원한다. x86 호환성을 갖춰 VM웨어, IBM 레드햇, 누타닉스 등 전통적인 하이퍼바이저와 쿠버네티스를 지원한다.
여기에는 새로운 CX8 네트워킹 칩을 탑재해 800Gbps의 대역폭으로 GPU 간 통신을 크게 개선한다. 성능 비교에 따르면, RTX 프로 서버는 H100 HGX의 1.7배 성능을 달성했으며, 딥시크1 모델은 H100 대비 4배의 성능을 제공한다.
이외에도 비구조화 데이터를 처리할 수 있는 AI 최적화 스토리지 플랫폼과 AIQ 쿼리 시스템도 소개했다. 라마 뉴트론 추론 모델은 기존 솔루션보다 15배 빠른 검색 증강 생성(RAG) 성능을 제공한다고 밝혔다.
이날 젠슨 황은 대만에 최초의 대규모 AI 슈퍼컴퓨터를 구축하는 계획도 발표했다. 이는 엔비디아의 첨단 컴퓨팅 기술이 지역 AI 생태계 발전과 시너지를 내는 첫 번째 대규모 사례가 될 전망이다.
이 프로젝트는 150개 이상의 기업이 참여해 3년 간 진행되며, 블랙웰 칩을 활용한 대규모 시스템 구축을 목표로 한다. 젠슨 황 CEO는 "대만 정부, 엔비디아, TSMC가 협력해 대만의 AI 인프라와 생태계를 위한 최초의 거대 AI 슈퍼컴퓨터를 구축할 것"이라고 말했다.
이 AI 슈퍼컴퓨터는 1700개 이상의 GPU를 갖춘 엔비디아 HGX H200 시스템, 두 개의 엔비디아 GB200 NVL72 랙 규모 시스템, 엔비디아 퀀텀 인피니밴드 네트워킹으로 상호 연결된 차세대 엔비디아 블랙웰 울트라 플랫폼 기반의 엔비디아 HGX B300 시스템으로 구성됐다.
◆ AI 시대에 기업 IT부서 역할은 '디지털 직원 HR'
젠슨 황 CEO는 기업 IT 생태계 변화에 있어 AI가 미칠 영향력에 대한 메시지도 전했다. 황 CEO는 "기업 IT는 컴퓨팅, 스토리지, 네트워킹의 세 가지 층으로 구성됐다"며 "AI가 이들 모두를 변화시킬 것"이라고 설명했다.
이어 "기업이 인간 직원을 위한 HR이 있듯이, IT 부서가 디지털 직원을 위한 HR이 될 것"이라고 전망했다. 이에 대비해 엔비디아는 IT 산업과 IT 전문가들이 기업 내 AI 에이전트를 관리·개선·평가할 수 있는 도구를 개발하고 있다.
젠슨 황 CEO은 이런 시대적 변화에 엔비디아 미래에 대한 강한 자신감을 표현했다. 젠슨 황 CEO는 "AI 데이터센터는 이제 정보를 제공하고 저장하는 과거의 데이터센터가 아닌, 에너지를 투입하면 매우 가치 있는 것을 생산하는 AI 팩토리로 진화하고 있다"며 "엔비디아는 이 새로운 시대의 중심에 서 있다"고 강조했다.
고객님만을 위한 맞춤 차량