엔비디아 AI CPU ‘베라’ 첫 벤치마크 공개…AMD·에픽과 어깨 나란히

디지털투데이|홍진주 기자|2026.05.29

베라 루빈 [사진: 엔비디아]
베라 루빈 [사진: 엔비디아]

[디지털투데이 홍진주 기자] 엔비디아의 차세대 인공지능(AI) 특화 CPU '베라'(Vera)가 공개 벤치마크에서 AMD 에픽(EPYC) 상위 제품군에 근접하거나 일부 구간에서는 앞서는 성능을 기록한 것으로 나타났다. 

29일(현지시간) 온라인 매체 기가진에 따르면, 베라는 단일 소켓 기준 테스트에서 가장 빠른 수준을 보였으며, 일부 코드 컴파일 작업에서는 듀얼 소켓 AMD 플래그십 CPU와 유사한 성능을 냈다.

이번 성능 평가는 리눅스 전문 매체 포로닉스가 엔비디아 본사 초청으로 진행한 공개 벤치마크를 기반으로 이뤄졌다. 베라는 2026년 하반기 가동을 목표로 하는 데이터센터용 AI·고성능 컴퓨팅 CPU로, 전 세대 '그레이스'(Grace)가 Arm 네오버스 V2 코어를 사용한 것과 달리 엔비디아 자체 설계 '올림푸스'(Olympus) 코어를 탑재한 것이 특징이다.

칩 구성도 크게 바뀌었다. 베라는 88코어, 176스레드 구조를 갖추고 FP8 연산을 지원한다. LPDDR5X 메모리와 결합해 최대 1.2TB/s의 메모리 대역폭을 제공하며, 코어당 L2 캐시는 2MB, 통합 L3 캐시는 164MB로 구성됐다. PCIe 6세대와 CXL 3.1도 지원한다. 랙 단위 제품인 ‘베라 루빈 NVL72’는 루빈 GPU 72개와 베라 CPU 36개로 구성되며, CPU 단품 형태로도 공급될 예정이다.

테스트는 88코어 풀 구성 베라 시스템에서 진행됐으며, 메모리는 96GB LPDDR5-9600 모듈 8개가 사용됐다. 피크 TDP는 450W로 제시됐고, 실제 소비 전력은 30W 미만 수준으로 언급됐다.

성능이 가장 두드러진 영역은 코드 컴파일 작업이었다. 베라는 듀얼 소켓 구성의 5.0GHz AMD 에픽 9575F와 비슷한 수준의 결과를 보였으며, 단일 소켓 기준으로는 테스트 대상 중 가장 빠른 성능을 기록했다. Node.js 컴파일에서는 그레이스 대비 절반 이하 시간으로 작업을 완료했고, 코어당 성능은 AMD 고클럭 에픽 제품군과 유사한 수준으로 평가됐다.

리눅스 커널 빌드 테스트에서도 베라는 20초 수준으로 가장 빠른 결과를 기록했다. 다만 allmodconfig x86_64 커널 빌드에서는 코어 수가 더 많은 듀얼 소켓 에픽 9575F 및 9755 구성에 근소하게 뒤졌지만, 단일 소켓 시스템 기준으로는 가장 높은 성능을 보였다.

엔비디아는 이번 결과에 대해 베라가 코드 컴파일, 파일 압축, 동영상 트랜스코딩, 파이썬·자바 실행, 데이터베이스 처리 등 다양한 CPU 집약형 작업에서 세대 간 성능 향상을 보여줬다고 강조했다. 회사는 이러한 워크로드가 향후 AI 에이전트와 ‘AI 팩토리’ 환경에서 핵심적인 연산 영역이 될 것이라고 설명했다.

이번 벤치마크는 엔비디아가 GPU 중심 AI 인프라를 넘어 CPU 설계 역량까지 직접 보여준 사례로 읽힌다. 특히 기존 '그레이스' 이후 차세대 서버 CPU에서 자체 코어 설계로 전환한 뒤, 실제 컴파일과 시스템 작업 성능이 어느 수준까지 올라왔는지가 처음 구체적으로 드러났다는 점에서 의미가 있다는 평가다. 2026년 하반기 베라가 본격 투입되면, AI 서버 시장에서 AMD 에픽과 인텔 제온을 상대로 한 엔비디아의 CPU 경쟁도 본격화할 전망이다.

    본 서비스는 패스트뷰에서 제공합니다.