엔비디아, 루빈 CPX에도 HBM 탑재 가능성↑...공급망 변수로
||2026.02.27
||2026.02.27
[디지털투데이 석대건 기자] 엔비디아가 차세대 AI 추론 가속기 '루빈 CPX'의 메모리를 GDDR7에서 고대역폭메모리(HBM)로 되돌릴 것이라는 시장 관측이 제기되고 있다. 현실화되면 SK하이닉스와 삼성전자의 HBM 수요 전망치가 전면 수정돼야 하는 만큼 반도체 업계의 관심이 집중된다.
업계에 따르면 실제 대규모 생산 환경에서 프리필 작업조차 높은 메모리 대역폭과 용량을 요구하며 GDDR7으로는 성능 효율성이 부족하다는 평가가 나오고 있다. 루빈 CPX는 AI 추론 워크로드 중 메모리 사용량이 상대적으로 적은 프리필(prefill) 작업을 분담하도록 설계됐다. HBM 대신 GDDR7을 채택해 추론 비용을 블랙웰 대비 10분의 1로 낮추겠다는 전략 제품이다. 하지만 GDDR7의 용량 한계와 초기 수급 불안이 소비자용 그래픽카드 시장을 넘어 데이터센터 영역까지 확대 해석되면서, 엔비디아가 결국 HBM으로 선회할 것이라는 관측이다.
이 같은 관측이 나온 힘을 얻는 배경에는 엔비디아 4분기 실적 컨퍼런스콜에서 확인된 추론 수요의 폭발적 증가가 있다. 25일(현지시간) 진행된 컨퍼런스콜에서 젠슨 황 엔비디아 최고경영자(CEO)는 "컴퓨트는 곧 매출(compute equals revenues)"이라며 에이전틱 AI 전환이 토큰 수요를 끌어올리고 있다고 말했다. 엔비디아의 4분기 데이터센터 매출은 620억달러로 전년 동기 대비 75% 증가했다. 연간 기준으로는 1940억달러를 기록하며 지난 2023년 챗GPT 등장 이후 약 13배 성장했다.
문제는 추론 워크로드 팽창이 메모리 용량에 대한 요구를 동시에 높이고 있다는 점이다. 젠슨 황 CEO는 에이전틱 시스템이 다수의 에이전트를 동시에 생성하면서 토큰 생성량이 급격히 증가하고 있다고 설명했다. 앤스로픽의 클로드 코워크(Claude Cowork)와 오픈AI 코덱스(Codex)를 사례로 들며, "유용한 지능(useful intelligence)에 도달했다"며 컴퓨팅 용량 확보에 대한 긴급성이 높아졌다고도 했다. 콜레트 크레스 최고재무책임자(CFO)는 "선진 아키텍처의 공급 부족이 지속될 것"이라고 설명했다.
◆GTC서 루빈 로드맵 공개 예정...HBM 수급 전망 향방 주목
추론 시장 성장 속도도 가팔라 HBM 수급 전망을 좌우할 변수로까지 부상하고 있다. 젠슨 황 CEO에 따르면 메타와 앤스로픽이 "수백만 대의 블랙웰 및 루빈 GPU"를 배치 중이다. 엔비디아는 앤스로픽에 100억달러를 투자하기로 했다. 2026년 상위 5개 클라우드 업체의 설비투자(CapEx) 전망치는 연초 대비 약 1200억달러 늘어 7000억달러에 육박한다고 크레스 CFO는 밝혔다.
이 같은 환경이 '루빈 CPX HBM 유턴설' 배경이다. 최근 마이크론이 GDDR7 용량이 성능 병목이 될 수 있다고 언급한 데다, GDDR7 초기 수급 문제로 엔비디아의 컨슈머용 그래픽카드(RTX 50 SUPER 시리즈 등) 출시 지연 우려까지 불거졌다. 소비자용 시장에서 시작된 GDDR7 공급 불안이 데이터센터 영역으로 확대 해석되면서 유턴설이 힘을 얻었다.
다만 기술적으로 GDDR7에서 HBM으로의 전환은 단순한 부품 교체에서 끝나지 않는다. HBM은 실리콘 관통 전극(TSV) 기술과 2.5D 패키징(CoWoS)이 필수적인 반면, 루빈 CPX는 이를 배제하고 표준 PCB 기판을 활용해 단가를 낮추도록 설계돼 메모리를 변경하게 된다면 사실상 칩 재설계를 의미한다.
관건은 루빈 CPX의 GDDR7 전략이 대규모 추론 환경에서 메모리 수요를 감당할 수 있느냐다. 유턴설 자체는 시장 추측에 그칠 가능성이 높지만, 이후로도 128GB GDDR7를 통해 에이전틱 AI 성능을 뒷받침할 수 있을지는 미지수다. 오는 3월 16일 엔비디아는 산호세 GTC 기조연설에서 루빈 플랫폼의 구체적 로드맵을 공개할 예정이다. HBM 수급 전망의 향방도 이때 윤곽이 드러날 것으로 보인다
고객님만을 위한 맞춤 차량
