부활의 여정 걷는 인텔, 데이터센터 혁신에서 배우는 교훈 [권용만의 긱랩]
||2025.12.31
||2025.12.31
지난 수십 년간 IT 업계에서 ‘인텔(Intel)’은 그 자체로 상징성적인 존재였다. 인텔은 PC 시대의 서막을 열었고, 인터넷 시대와 더불어 데이터센터 시장을 장악했다. 최근 AI 시대에는 주목도가 다소 낮아졌지만, 지속적으로 신제품을 선보이며 다시 본격적인 경쟁에 나설 준비를 갖추는 모습이다. 당장 2026년을 겨냥한 신제품들은 PC와 데이터센터 모두에서 본격적으로 새로운 시대를 열 것으로 기대를 모은다.
이러한 부활의 여정의 근간에는 IT 기술이 있다. 인텔은 15개 데이터센터 사이트에서 53개 데이터센터 모듈, 46만4000대의 서버와 133메가와트(MW) 규모의 IT 인프라를 관리하고 있다. 사용자 수는 대략 10만명에 달한다. 이러한 대규모 조직에서 축적한 성공적인 인프라 운영 경험은 제품과 솔루션 구성에도 반영돼 경쟁력을 높이는 선순환 구조를 만든다. 인텔 외에도 많은 글로벌 기업들이 ‘내부 경험’ 사례를 만드는 데는 이러한 장점들이 있다.
인텔은 10년 이상 자사 데이터센터 운영 현황에 대한 백서를 꾸준히 발간해 왔다. 올해 백서는 지난 9월 공개됐다. 이번 보고서는 단순히 한 해를 살펴보는 수준을 넘어 지난 2010년부터 약 15년간의 변화를 제시한 점이 눈에 띈다. 이 기간 인텔은 내부 데이터센터 운영을 통해 약 114억달러(약 16조8480억원)를 절감했다고 밝혔다. 이 과정에서 도입한 기술들은 향후 많은 기업들이 데이터센터 운영 효율화 전략을 수립할 때 참고할 만한 사례로 꼽힌다.
전략적 데이터센터 자원 배치로 효율성 높이기
인텔의 데이터센터 총면적은 최근 10년간 큰 변화가 없었으며, 2003년과 비교하면 대략 18%정도 줄었다. 데이터센터 모듈 수도 2003년 152개에서 2016년에는 60개로 감소했다. 2025년 기준으로는 53개까지 줄었다. 이러한 재구성을 통해 물리적인 ‘부동산’에 들어가는 비용을 최적화했다. 물론 데이터센터의 전력 용량은 2012년 이후 13년간 약 166% 증가했다. 인텔은 향후 컴퓨트 수요 증가에 대응하기 위해 전력 공급에 연료전지 기술을 사용하는 것도 고려하고 있는 것으로 알려졌다.
데이터센터 수를 줄인 방법에는 ‘선택과 집중’ 전략이 있다. 기존 데이터센터의 필요성을 재평가하고 자원들을 재배치하며, 자원이 집약되는 시설에서는 규모와 효율을 끌어올렸다. 인텔은 이미 2000년대 중반의 ‘2세대’ 데이터센터에서 전력사용효율(PUE) 1.2 수준을 달성했다. 현재의 ‘3세대’ 시설에서는 PUE 1.06을 달성하고 있다. 이는 공급되는 전력 대부분이 냉각 부담 없이 IT에 사용되고 있다는 의미다.
이 ‘3세대’ 데이터센터의 대표적인 사례가 미국 캘리포니아주 산타클라라에 위치한 ‘D2’ 공장이다. 이 시설은 2009년 운영을 중단했지만, 인텔은 이 시설을 활용해 PUE 1.06의 데이터센터를 만들었다. 당시 인텔 관계자는 “반도체 공장을 전환한 시설인만큼 전력 공급이나 건물의 허용 하중 측면에서도 상대적으로 자유로웠다”고도 설명한 바 있다. 최근 국내에서도 기존 공단 부지를 활용한 데이터센터 구축 사례가 있는데, 같은 맥락으로 볼 수 있다.
스토리지 영역에서는 성능과 비용을 동시에 만족시키기 위해 용도와 요구 성능에 따른 4개 계층으로 서비스를 구분했다. 기존에 각각 파편화돼 있던 스케일업 형태 스토리지를 공유 형태의 스케일아웃 스토리지로 재편했고, 중복제거 기술 등을 적용해 효율을 높였다. 스토리지 서버 교체에서도 신형 고성능 서버 한 대가 여러 대의 구형 서버를 대체하는 등으로 효율을 높였다. 현재 인텔의 데이터센터에서 스토리지의 용량과 성능은 크게 높아졌지만 차지하는 면적은 2011년 대비 절반 수준이고, 디자인 팀의 스토리지 활용률은 80% 수준까지 높아졌다.
네트워크도 빠르게 바뀌고 있다. 인텔은 2019년부터 내부 네트워크에 100Gb(기가비트)를 본격적으로 도입하기 시작했고, 이제는 그 이상의 대역포으로 전환을 준비하고 있다. 이는 궁극적으로는네트워크 포트 수를 줄여 복잡성을 줄일 것으로도 기대된다. 내부 네트워크 연결의 복잡성 해결에서도 흥미로운 부분이 있는데, 인텔은 일반적인 ‘L2(Layer2)’ 기반 구성 대신 ‘L3(Layer3)’ 기반 구조 위에서 오버레이와 링크 결합, 터널링 기법 등을 사용해 ‘소프트웨어 정의’ 네트워크를 확장하고 있다.
교체도 부분적으로 하는 모듈형 서버 디자인
지금까지 거의 모든 서버는 프로세서와 메모리, 저장 장치와 네트워크, 인터페이스 등이 모두 긴밀하게 ‘결합’된 구조였다. 이는 생산과 배치, 유지보수 단계에서 복잡성을 줄일 수 있지만 어느 한 부분을 바꿔야 할 때 그 외의 부분도 바꿔야 하는 ‘낭비’ 요소도 있었다. 그럼에도 인프라 생애주기 전반에서 복잡성을 줄여 얻는 이득이 낭비되는 부분보다 컸기 때문에 이런 구조가 유지돼 왔다. 하지만 서버 디자인 수준에서의 효율을 높이려면 결국 이 부분을 바꿔야 했고, 그래서 등장한 것이 ‘분리형(Disaggregated) 서버 아키텍처’다.
‘분리형’이라 하지만 개념은 단순하다. 지금까지 플랫폼, 제품 수준에서 긴밀하게 통합된 구조를 기능 단위로 분리해 쉽게 교체할 수 있게 한 것이다. 대표적인 구성이 프로세서와 메모리 등의 핵심 부와 스토리지, 네트워크 등의 입출력 부, 전원부 등을 분리하고 각 모듈 간 연결은 PCIe(PCI Express)와 같은 인터페이스를 활용한다. 물리적, 논리적으로 각 모듈 간 연결의 호환성을 유지해 추후 업그레이드나 구성 변경에서 다른 부품을 바꾸지 않아도 된다는 장점이 있다.
인텔은 이러한 ‘분리형’ 개념을 2016년 처음 제시했지만, 뿌리는 2005년 선보인 ‘블레이드’ 서버까지 거슬러 올라간다. 블레이드 서버 또한 전원과 네트워크 등을 공용 섀시에서 제공하고, 각 블레이드에는 컴퓨트를 위한 요소만 갖춘 ‘분리형’ 구조였다. 인텔의 2017년 사례에서는 14개 블레이드가 장착된 3U 블레이드 서버를 교체할 때 전체 교체 대비 블레이드만 교체하면 17%의 비용 절감 효과가 있고, 만약 각 블레이드가 분리형 아키텍처를 사용해 블레이드 내부 프로세서와 메모리 모듈만 교체하면 44%의 비용 절감 효과가 있다고 제시한 바 있다.
사실 이 분리형 서버 아키텍처에서 서버를 열고 내부를 교체하는 작업은 결국 사람 손으로 해야 하고, 복잡성과 비용 발생의 원인이 된다. 하지만 내부를 적절히 모듈형으로 설계해 이러한 수고를 최대한 줄일 수 있으면 다른 곳에서 더 큰 절감 효과를 기대할 수 있다. 예를 들면 스토리지 등 기존 하드웨어의 재사용을 통해 비용 절감 뿐만 아니라 운영체제 재설치를 줄여 시스템 교체 후 가동까지의 수고를 줄인다거나, 자재 반입량을 줄여 물류 비용을 줄이는 것 등이 대표적이다.
이러한 ‘분리형 서버 아키텍처’는 이미 인텔의 레퍼런스 디자인이나 주요 서버 업체들의 최신 서버 설계에 기본적으로 반영돼 있다. 하지만 아직 많은 서버들이 이 모듈형 아키텍처의 혜택을 같은 세대 안에서만 공유하고 세대가 바뀔 때는 섀시 디자인 등에서 이전 세대와 호환성을 두지 않는 점 등은 조금 아쉬운 모습으로도 보인다.
IT 효율의 시작은 구축, 완성은 관리
연산 성능이 경쟁력으로 이어지는 시대에 인텔은 이미 2000년 중반부터 제품 설계팀 등에 활용되는 자체적인 HPC(고성능 컴퓨팅) 환경을 만들었고, 현재는 7세대에 이르렀다. HPC 구축 이전인 2005년과 비교하면 현재 7세대 HPC 환경의 연산 성능은 631배 높아졌고, 설계 과정에 영향을 미치는 문제 발생 건수는 322배 줄이면서 성능과 신뢰성 모두 비약적인 향상을 보였다. 소프트웨어 최적화와 고속 솔리드 스테이트 드라이브(SSD)의 데이터 캐시로의 활용 등을 통해 성능 효율을 높였다.
이제 기업 내부에서도 가상화를 기반으로 한 ‘프라이빗 클라우드’가 일상화돼 있다. 프라이빗 클라우드의 장점은 필요할 때 자원을 바로 할당받아 사용할 수 있다는 것과 패턴에 따라서는 물리적 자원의 활용도를 극한까지 높일 수 있다는 것이다. 하지만 사용자의 입장에서는 상대적으로 관리에 소홀해질 수 있다. 예를 들면 사용이 끝난 가상 머신을 제대로 제거하지 않고 방치한다거나 하는 경우다. 이런 낭비되는 자원을 잘 정리하는 것도 운영 효율을 높이는 데 도움이 된다.
인텔의 오피스·기업용 인프라 운영 사례에서는 서버의 성능 향상에 따라 서버 수가 줄어들면서도 가상 머신 수는 크게 늘었다. 2018년 전사적인 정리 이후 가상 머신 수는 일시적으로 감소했으나, 2019년에는 전사적 자원 재배분 등으로 대폭 늘었다. 이후 정책적으로 활용도가 낮은 가상 머신의 자원 반환을 강화하면서 2024년에는 다시 큰 폭으로 줄었다. 2023년 스토리지 용량이 줄어든 이유는 데이터 정리 작업의 영향이다. 2009년과 비교하면 2024년 가상 머신 수는 11.6배 늘어났다.
전반적으로 최신 서버 등 최적화된 기술과 운영은 기대 이상의 비용 절감 효과로 이어졌다. 이러한 결과에서 얻을 수 있는 결론은 ‘적절한 시점의 교체가 가장 경제적’이라는 점이다. 비용을 절감한다고 단지 ‘쓰지 않고’ 있으면 경쟁력에서 손해가 누적되는 만큼, 지출이 필요한 시점에는 과감한 투자가 필요하다는 것이다. 이러한 사례는 교체 주기를 맞이한 기업의 데이터센터 뿐만 아니라 기업과 개인의 IT 운영 전반에 시사점을 던진다.
권용만 기자
yongman.kwon@chosunbiz.com
고객님만을 위한 맞춤 차량
