추론AI 칩 놓고 ‘별들의 전쟁’...엔비디아판 첫 추론 전용칩 뜬다
||2026.03.14
||2026.03.14
[디지털투데이 황치규 기자]엔비디아가 AI 응답 속도를 높이는 추론 전용 칩 출시를 준비 중이다. 엔비디아 최고경영자 젠슨 황은 16일(현지시간)부터 열리는 GTC 개발자 컨퍼런스에서 신형 칩을 공개할 예정이라고 파이낸셜타임스가 13일(현지시간) 보도했다.
이번 칩은 지난해 12월 200억달러 규모에 그록 창업자들을 영입한 이후 처음 나오는 결과물이다. 엔비디아는 기록 기반 언어처리장치(LPU를 차세대 주력 GPU인 베라 루빈과 함께 제품군으로 선보일 계획이다. 그록은 복잡한 AI 질의에 빠르게 응답하도록 설계된 LPU를 개발했고 삼성과 협력해 제품을 생산해왔다.
엔비디아는 그동안 한 GPU로 학습과 추론을 모두 처리할 수 있다고 주장해왔지만 에이전틱 코딩 시스템 같은 AI 툴들이 정교해지면서 이같은 전략을 수정했다고 FT는 전했다.
뱅크오브아메리카 애널리스트들은 2030년 AI 데이터센터 시장이 약 1조2000억 달러에 달할 때 추론이 전체 지출에서 75%를 차지할 것으로 추정하고 있다.
엔비디아가 선보일 신형 고대역폭 메모리(HBM) 대신 SRAM을사용한다. HBM은 가격이 비싸고 삼성전자, SK하이닉스, 마이크론 등 메모리 업체들이 AI 수요를 따라가지 못해 공급이 부족한 상황이다. SRAM은 공급이 원활하고 AI 추론 작업 속도를 높이는데 적합하다고 FT는 전했다.
ㆍ[테크인사이드]엔비디아 그록 인수가 AI데이터센터판에 던지는 메시지
ㆍ[Tech Insight]엔비디아의 그록 인수, HBM 리스크 관점으로 보라
엔비디아 행보로 추론 AI 칩을 둘러싼 유력 회사들 간 경쟁은 더욱 고조될 전망이다. 아마존웹서비스(AWS)도 AI 반도체 스타트업 세레브라스와 다년간 파트너십을 맺고 세레브라스 추론 칩을 데이터센터에 투입한다고 발표했다. 메타도 AI 워크로드를 겨냥해 자체 개발한 맞춤형 칩 4종을 공개했다.
ㆍAWS, 세레브라스와 동맹...AI 추론 시장 정조준
ㆍ메타, 대규모 엔비디아·AMD 계약 후 자체 AI 칩 공개
고객님만을 위한 맞춤 차량
