오라클, 엔비디아 블랙웰 기반 OCI 슈퍼클러스터 발표
||2024.09.13
||2024.09.13
[디지털투데이 황치규 기자]AI 컴퓨팅 기술 업체 엔비디아는 오라클(Oracle)과 협력해 기업들을 대상으로 AI와 데이터 처리 가속화를 지원한다고 13일 밝혔다.
미국 라스베이거스에서 열린 오라클 클라우드월드(Oracle CloudWorld) 컨퍼런스에서 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrasturcutre, OCI)는 엔비디아 블랙웰(Blackwell) 플랫폼으로 가속화된 제타스케일 OCI 슈퍼클러스터(Supercluster)를 발표했다.
OCI 슈퍼클러스터는 기업이 10만 개 이상 엔비디아 최신 GPU를 사용해 차세대 AI 모델을 훈련하고 배포할 수 있도록 지원한다.
OCI 슈퍼클러스터를 통해 고객은 다양한 엔비디아 GPU 중에서 필요에 따라 선택할 수 있으며, 온프레미스, 퍼블릭 클라우드, 소버린 클라우드(sovereign cloud) 등 어디에나 배포할 수 있다.
내년 상반기에 출시될 예정인 블랙웰 기반 시스템은 최대 13만1072개 블랙웰 GPU를 RoCEv2 또는 엔비디아 퀀텀-2 인피니밴드(Quantum-2 InfiniBand) 네트워킹용 엔비디아 커넥트X-7 NIC(ConnectX-7 NIC)으로 확장해 클라우드에 2.4제타플롭의 놀라운 AI 컴퓨팅을 제공할 수 있다고 엔비디아는 설명했다.
오라클은 이번 행사에서 생성형 AI 애플리케이션을 지원하는 엔비디아 GB200 NVL72 수냉식 베어메탈 인스턴스도 미리 선보였다. 이 인스턴스는 퀀텀-2 인피니밴드를 통해 대규모 훈련이 가능하며, 확장된 72-GPU 엔비디아 NV링크(NVLink) 도메인 내에서 수조 개의 매개변수 모델을 실시간으로 추론할 수 있다. 이 도메인은 단일 대형 GPU처럼 작동할 수 있다.
올해 OCI는 NV링크와 NV링크 스위치(NVLink Switch)를 통해 엔비디아 HGX H200을 제공할 예정이다. OCI는 중급 AI 워크로드, 엔비디아 옴니버스(Omniverse)와 시각화를 위한 엔비디아 L40S GPU 가속 인스턴스도 정식 출시했다.