[현장] 네이버 AI 심장부 ‘각 세종’…서비스형 GPU 사업 전초기지 '세팅 완료'
||2025.10.28
||2025.10.28
26일 네이버 AI 데이터센터 '각 세종'서 테크밋업
GPU·인프라 기술 확보로 '풀스택 AI 인프라' 갖춰
데이터 이중화·운영 자동화로 서비스 안정성 확보
AI 인프라, GPUaaS 형태로 개방…외연 확장 본격화

네이버클라우드가 '서비스형 GPU(GPUaaS)'를 중심으로 AI(인공지능) 인프라 사업을 본격 확대한다. GPUaaS는 클라우드 기반 GPU(그래픽처리장치) 대여 서비스를 뜻한다. 자체 구축한 AI 데이터센터 '각 세종'을 전초기지로 삼아 GPU 운영 효율을 극대화하고, 산업 전반이 활용할 수 있는 국산 AI 인프라 생태계를 조성한다는 전략이다.
이상준 네이버클라우드 CIO(최고정보책임자)는 26일 세종시에 위치한 데이터센터 '각 세종'에서 열린 테크밋업에서 "AI 인프라의 경쟁력은 GPU를 얼마나 많이 확보하는가를 넘어 확보한 자원을 얼마나 안정적이고 효율적으로 운영하는지에 달려 있다"며 "네이버클라우드는 GPU 확보와 운영 기술 내재화의 균형을 통해 AI 인프라 경쟁력을 완성하고 있다"고 말했다.
네이버클라우드는 AI 인프라 경쟁력을 'GPU 자원 확보'와 'AI 인프라 기술 역량 확보' 두 축으로 정의한다. 네이버는 2019년 엔비디아의 슈퍼컴퓨팅 인프라 '슈퍼팟'을 국내 최초로 도입해 한국어 AI 모델 학습 기반을 마련했다. 2023년에는 차세대 인프라인 '슈퍼닷'을 도입해 생성형 AI, 멀티모달, AI 에이전트 등으로 활용 영역을 확장했다.
네이버클라우드는 그간의 서비스 운영 경험을 토대로 AI 인프라를 구성하는 모든 기술 단계를 자체적으로 갖췄다고 보고 있다. 물리 인프라부터 플랫폼까지 통합형 AI 인프라 체계를 구축했다는 설명이다.
AI 인프라의 중심, 네이버 기술력 결집된 '각 세종'
네이버클라우드 AI 인프라 전략의 중심에는 국내 최초 AI 데이터센터 각 세종이 있다. 각 세종은 데이터 저장 및 처리 중심의 기존 데이터센터를 넘어, AI 학습과 추론이 동시에 이뤄지는 고밀도 GPU 연산 공간으로 설계됐다.
회사는 GPU 서버의 전력 밀도 증가에 대응하기 위해 서버 냉각 방식을 꾸준히 고도화하고 있다. AI 연산이 집중되는 데이터센터에서 가장 중요한 요소는 발열 관리다. GPU 전력 밀도가 높아지면서 냉각은 효율과 안정성을 좌우하는 핵심 요소가 됐다.
현재 각 세종은 직접 외기·간접 외기를 상황에 맞게 전환하는 하이브리드 냉각 시스템 '나무3'를 채택하고 있다. 연중 약 90% 기간 중 외기 냉방을 활용해 서버를 식히고, 이를 통해 전력 효율을 73%까지 끌어올렸다.
2027년 완공될 2차 서버실부터는 DLC(직접 액체 냉각) 방식을 본격 도입할 계획이다. 현재 각 세종에서는 DLC 방식에 대한 PoC(개념검증)를 진행 중이다.
노상민 네이버클라우드 센터장은 "공기 냉각과 액체 냉각 방식을 병행하는 식이 될 것이고, 후자가 더 큰 비중을 차지할 수 있겠으나 서비스 트렌드에 맞춰 어떠한 냉각 방식을 채택할 지 살펴보고 있다"고 부연했다.
2차 서버 증설이 마무리되면 현재 규모(서버 10만 유닛)에 약 10만 유닛이 추가된다. 최종적으로는 각 세종에 최대 60만 유닛 수용을 목표로 한다.

데이터 이중화·운영 자동화로 서비스 '무중단' 구현
각 세종은 전력·냉각·서버 운용 체계를 분리하면서도 유기적으로 통합한 이중화 구조로 설계됐다. GPU 서버는 고전력 특성에 맞춰 UPS(무정전 전원 장치)와 배전 설비를 재배치해 장애 전파를 구조적으로 차단했다. 전력망의 경우, 135MW급 전력 이중화와 세종변전소와의 인입선로 연결(약 2km), 비상발전 72시간 운영 체계를 갖췄다. 네트워크도 이중화해 랙 단위까지 고대역폭 처리가 가능하다.
GPU 클러스터에는 자원 관리·배치·복구 자동화가 적용돼 대규모 환경에서도 일관된 효율·안정성을 유지한다. 반복적 장애 대응과 자원 조정은 시스템이 자동 처리하며, 이러한 운영 기술은 데이터센터 전반으로 확장 중이다.
네이버클라우드는 타사 데이터센터와 비교했을 때 각 세종의 장점으로 데이터 이중화를 꼽았다. 데이터 이중화의 경우, 국가정보자원관리원 화재로 인한 국가 재난 피해로 데이터센터 안정성에 대한 관심도가 상당한 상황이다.
이 CIO는 "어떠한 하드웨어든 화재 등 이슈가 발생할 수 있지만 네이버는 기본적으로 한 쪽에 문제가 생겼을 때 다른 쪽으로 빠르게 백업시키는 데 역량을 쏟고 있다"며 "문제가 생긴 부분을 되살리는 것도 방법이나 서비스를 우회하거나 여러 데이터센터에 데이터를 분산해서 서비스를 이어가는 등 문제를 복원할 수도 있다. 돌발 상황에 대한 준비가 비교적으로 잘 돼 있다고 본다"고 설명했다.

네이버 AI 인프라 경쟁력, GPUaaS로 외연 확장
네이버클라우드는 내부에서 검증한 AI 인프라와 플랫폼을 GPUaaS 형태로 개방하며, 외부 산업으로 확장을 본격화한다는 방침이다.
이 CIO는 "현대차, 삼성전자, 한국수력원자력, 한국은행 등 여러 산업군에 GPU를 납품하고 산업 특화 AI 모델을 함께 개발하는 버티컬 AI 사업을 추진하고 있다"며 "정부 GPU 인프라 사업에서도 약 3000장 규모의 실적을 확보했다"고 성과를 밝혔다.
네이버클라우드는 GPUaaS를 모델 개발-학습-추론-서빙까지 통합 제공하는 형태로 고도화해, 기업이나 기관이 초기 투자 없이도 고성능 AI 기술이나 서비스를 구현 및 활용하도록 지원할 계획이다.
이 CIO는 "네이버클라우드는 축적한 AI 인프라 운영 역량을 GPUaaS 모델로 발전시켜 국내 기업들이 손쉽게 AI를 활용할 수 있는 생태계를 만들 것"이라며 "이를 통해 AI 인프라가 특정 기업의 자산을 넘어, 산업 전반의 성장 기반이 될 수 있도록 하겠다"고 강조했다.
©(주) 데일리안 무단전재 및 재배포 금지
고객님만을 위한 맞춤 차량
