인텔·삼바노바, AI 추론 새 판 짰다…칩 역할 분담으로 효율↑
||2026.04.13
||2026.04.13
[디지털투데이 AI리포터] 인텔과 삼바노바 시스템즈가 대규모 AI 추론 작업을 효율적으로 처리하기 위한 새로운 하드웨어 구조를 공개했다. 여러 칩을 역할별로 나눠 쓰는 방식으로 성능과 효율을 동시에 높이겠다는 전략이다.
12일(현지시간) IT 매체 테크레이더에 따르면, 양사는 GPU, 삼바노바의 RDU, 인텔 제온6 CPU를 결합한 이기종 컴퓨팅 구조를 제시했다. 이는 하나의 칩이 모든 작업을 처리하는 대신, 각 장비가 잘하는 역할만 맡아 처리하는 방식이다.
구조를 보면, GPU는 입력 데이터를 빠르게 준비하는 프리필(prefill) 단계, RDU는 실제 답을 만들어내는 디코딩(decoding) 단계, 그리고 제온6 CPU는 전체 흐름을 관리하는 컨트롤 타워 역할을 맡는다. 특히 CPU는 작업 분배, 코드 실행, 여러 시스템 간 조율까지 담당하며 단순 보조가 아닌 핵심 역할을 수행한다.
이러한 역할 분담은 실제 성능 개선으로도 이어진다. 삼바노바 측은 제온6가 기존 암(Arm) 기반 서버보다 컴파일 속도가 더 빠르고, 데이터 처리 성능에서도 높은 효율을 보인다고 설명했다. 즉, 여러 칩이 협력할 때 전체 시스템 속도가 크게 올라간다는 것이다.
또한 이 설계는 기존 데이터센터 환경에서도 별도 설비 변경 없이 바로 적용할 수 있도록 만들어졌다. 이는 추가 전력이나 냉각 부담 없이 AI 처리 능력을 확장할 수 있다는 의미다. 업계에서는 이처럼 여러 하드웨어를 조합하는 방식이 앞으로 AI 인프라의 주요 흐름이 될 것으로 보고 있다.
결국 이번 협력은 하나의 칩에 의존하던 기존 구조에서 벗어나, 역할을 나눠 처리하는 새로운 대안을 제시한 사례로 평가된다. 특히 엔비디아 중심의 시장에 변화를 줄 수 있을지 주목된다.
고객님만을 위한 맞춤 차량
