카카오 클라우드, AMD 에픽 CPU 퍼스트 인프라 전략 확대...왜?
||2025.03.28
||2025.03.28
[디지털투데이 석대건 기자] 카카오엔터프라이즈(Kakao Enterprise)가 AMD 에픽(EPYC) CPU를 도입해 서버 효율성과 성능을 개선한 사례가 AMD 웹사이트에 소개됐다.
카카오엔터프라이즈는 AMD 프로세서 도입을 통해 데이터센터 공간은 50% 줄이고 성능은 30% 향상시키는 성과를 거뒀다. 총소유비용(TCO)은 50% 감소했으며, 전력 소비 역시 절반으로 줄였다.
카카오엔터프라이즈는 카카오 그룹 내 인하우스 기업이었던 AI랩에서 분사되어 설립됐다. 회사는 AI, 클라우드, 검색 기술을 기반으로 기업에 맞춤형 서비스를 제공하고 있다. 클라우드 인프라 서비스(IaaS), 서비스형 플랫폼(PaaS), 서비스형 소프트웨어(SaaS) 등 전 부문에서 운영 기반 서비스를 제공 중이다.
이때문에 무엇보다 워크로드 유연성 확보가 관건이었다. 카카오엔터프라이즈는 연계 서비스의 원활한 지원을 위해 광범위한 워크로드에서도 높은 성능을 제공할 수 있는 HPC 및 스토리지 서버가 필요했다.
클라우드 서비스 제공업체로서, 회사는 대부분의 컴퓨팅 서버를 사용자에게 가상머신(VM) 제공으로 제공한다. 이를 통해 사용자들은 웹서버, 컴퓨팅 파워를 필요로 하는 자체 워크로드를 실행하게 된다.
황병식(Bruce Hwang) 카카오엔터프라이즈 개발 팀리더(Team Leader, Kakao Enterprise)는 "워크로드는 최종 고객에 따라 달라진다"며 "클라우드 서비스 제공업체로서, 우리는 대부분의 컴퓨팅 서버를 사용자에게 가상머신(VM)을 제공하여 웹서버, 컴퓨팅 파워가 필요한 백엔드 서비스, 게임과 같은 자체 워크로드를 실행할 수 있게 한다"고 말했다.
특히 카카오게임즈 서비스에서 수요가 컸다. 황 리더는"게임은 많은 컴퓨팅 파워가 필요하다"며 "우리는 고성능 CPU를 기반으로 최적화된 튜닝을 통해 고객이 원하는 수준을 제공해야 했다"고 말했다.
이어 "가장 큰 도전 과제는 게임 서버가 원활하게 실행될 수 있도록 필요한 컴퓨팅 성능을 확보하는 것"이라며 "게임 서비스의 특성상 최적의 사용자 경험을 제공하기 위해 초저지연 및 높은 안정성이 요구됐다"고 강조했다.
기능 복잡도가 높아지면서 점점 요구 사양이 커지자, 카카오엔터프라이즈는 CPU 활용 효율성을 높이는 데 어려움을 겪었다. 이에 카카오엔터프라이즈는 AMD 프로세서 기반 VM 서비스를 선택했다.
AMD EPYC 프로세서는 이러한 문제를 해결할 수 있는 가능성을 제시했다고 회사 측은 설명했다. 양사 협업의 첫 배포는 3세대 AMD EPYC CPU로 이뤄졌다.
황 리더는 "48코어 이상의 AMD CPU가 다른 벤더의 프로세서보다 우리 서비스의 밀도 요구사항에 더 적합하다는 것을 발견했다"고 말했다. 이어 "우리는 48코어 기반 CPU를 사용하여 더 적은 서버를 구매할 수 있었고, 4세대 AMD EPYC 프로세서로 96코어로 확장함에 따라 더욱 적은 서버가 필요해졌다"고 덧붙였다.
비용적인 부분도 카카오엔터프라이즈가 AMD를 선택한 이유다. 황 리더는 "AMD EPYC CPU로 업그레이드한 이후, 우리는 이제 40% 정도의 서버만 사용하면서도 성능은 30% 향상됐다"며 "TCO는 50% 감소했다"고 설명했다.
이어 "AMD EPYC 프로세서의 메모리 암호화 보안 기능도 활용하고 있지만, 주요 이점은 밀도와 전력 효율성"이라며 "AMD EPYC CPU로 전환하면서 전력 소비를 약 50% 절약했다"고 말했다.
현재 카카오엔터프라이즈는 델 파워엣지(Dell PowerEdge) R6525 서버를 기반으로 게임 서버용 노드를 약 500개 운영 중이다. 이 서비스는 3세대 AMD EPYC 7643 CPU를 사용했다.
현재 같은 48코어 사양의 고주파수 4세대 AMD EPYC 9474F 프로세서로 전환하고 있다. 전체 인프라는 AMD로 업그레이드 진행 중이며, 전체의 약 70%가 전환됐다고 밝혔다.
황 리더는 "가장 강력한 특징은 전력 효율성과 공간 감소"라며 "공유 인프라에 대한 요구사항을 절반으로 줄였다"고 말했다.
카카오엔터프라이즈는 데이터센터 공간 부족 문제 해결에도 고밀도 CPU를 활용해 풀어간다는 계획이다. 카카오클라우드는 고밀도 서버를 위한 세 가지 주요 축으로 게임 서버, 데이터 저장 서비스, AI 및 데이터 분석 플랫폼을 운영 중이다.
고밀도 서버의 경우 96코어 4세대 AMD EPYC 9004 시리즈 CPU로 이동하고 있다. 스토리지 서버에는 낮은 TDP를 갖춘 EPYC 8004 시리즈 프로세서가 활용됐다.
황 리더는 "미래에 카카오클라우드는 거의 모든 가상 머신을 AMD EPYC CPU에 배포하고, 고객 요구에 따라서만 타사 프로세서를 사용할 계획"이라면서 "우리 서비스는 결국 AMD EPYC CPU만 사용하게 될 것"이라고 말했다.
이어 "카카오엔터프라이즈는 한국의 클라우드 서비스 제공에 있어 상대적으로 후발주자이지만, AMD EPYC CPU 덕분에 짧은 기간에 많은 것을 달성할 수 있었다"고 강조했다.
고객님만을 위한 맞춤 차량