AI 추론 시대, 스토리지 전략도 바뀐다 [테크리포트]
||2026.01.21
||2026.01.21
인공지능(AI) 인프라의 무게중심이 학습에서 추론으로 이동하면서, 그래픽처리장치(GPU) 성능을 뒷받침할 스토리지의 역할이 다시 주목받고 있다. 이에 따라 보수적이던 기업용 스토리지 시장에서도 고성능이 요구되는 영역을 중심으로 올플래시 스토리지 전환이 빠르게 확산되는 분위기다. 올플래시 스토리지는 하드디스크(HDD) 대신 반도체 기반 플래시 메모리만으로 구성된 스토리지로, 지연 시간이 짧고 처리 성능이 뛰어난 것이 특징이다. 이미 핵심 애플리케이션과 가상화 환경에서는 올플래시가 사실상 표준으로 자리 잡았다.
퓨어스토리지는 ‘올플래시 스토리지’ 시장을 연 혁신가 중 하나로, 고성능 스토리지를 중심으로 빠르게 성장해 왔다. 올플래시 스토리지가 주류로 자리 잡은 현재, 퓨어스토리지는 주요 3대 업체 중 하나로 평가되며 기존 대형 스토리지 기업들과 어깨를 나란히 할 위치에 있다. 초기에는 고성능 이미지가 강했지만, 최근에는 비용 효율성과 서비스형 스토리지 모델에서도 경쟁력을 강화하고 있다.
퓨어스토리지는 지난 14일 핵심 고객을 초청해 개최한 ‘톱 커스터머 데이 2026’ 행사에서 올해 주목할 시장으로 기존 기업용 고성능 스토리지 시장 외에 ‘인공지능(AI)’과 ‘백업’ 시장을 꼽았다. AI용 고성능 스토리지 분야에서 이미 선도적 위치를 확보한 퓨어스토리지는 성능은 물론 플랫폼 전략에서도 차별화된 경쟁력을 선보인다는 계획이다. 또한 복원력이 중요해진 환경에서 올플래시 스토리지가 백업 솔루션으로 경쟁력을 갖출 수 있음을 제시했다.
고성능 스토리지, 애플리케이션 넘어 AI와 백업에서도 주목
IT에 있어 성능이야 높을수록 좋다지만 현실적으로는 비용과 타협하게 된다. 퓨어스토리지의 올플래시 스토리지는 그동안 성능에서는 최고 수준으로 평가받았지만 모든 용도에서 범용으로 쓰기에는 비용 등 여러 가지로 부담스러운 존재였던 것도 분명하다. 물론 퓨어스토리지는 이러한 심리적 장벽을 넘어 실제 사용하기 시작한 다음부터는 고객 만족도가 높은 것으로 정평이 나 있다. 이를 잘 반영하는 것이 순추천고객지수(NPS: Net Promoter Score)로, 퓨어스토리지는 지난해까지도 NPS 81점을 기록했다.
고객들은 고가의 고성능 스토리지로 알려진 퓨어스토리지의 올플래시 스토리지를 어떻게 쓰고 있을까. 보통은 성능이 중요한 ‘핵심 애플리케이션’을 위한 프라이머리 스토리지로 가장 많이 쓴다. 또한 많은 고객들이 스토리지 입출력 성능이 중요한 가상화 환경에서도 퓨어스토리지의 제품을 사용하는 것으로 알려져 있다. 사실 이 정도의 사용처는 이미 예전부터 충분히 짐작 가능했던 부분이다. 아무 데서나 쓸 수 없는 고가의 고성능 스토리지를 가장 필요한 곳에 집중 투입하는 ‘선택과 집중’이 잘 반영된 모습이다.
하지만 퓨어스토리지가 주목하는 최근 수요가 늘고 있는 영역은 일반적인 예상을 조금 벗어난다. 바로 ‘AI 데이터 스토리지’와 ‘백업 스토리지’다. AI를 위한 데이터 스토리지는 빠르면 좋지만 ‘용량’이 문제가 됐다. 데이터의 양이 AI의 성과를 좌우하는 입장에서, 예산이 한정됐다면 용량을 우선하는 것이 일반적이다. 그리고 올플래시 스토리지는 비용 대비 용량에서 불리한 위치에 있다는 것이 지금까지의 일반적인 인식이었다.
하지만 QLC(Quad-Level Cell)와 데이터 압축, 중복제거 기술 등을 활용하면 올플래시 스토리지도 용량과 경제성에서 상당한 경쟁력을 갖출 수 있게 됐다. 특히 경제성 측면에서는 스토리지 장치 자체의 가격적 측면 뿐만 아니라 이를 운용하는 데 드는 전력, 상면 비용 등을 고려하면 이제 상황에 따라서는 하드 디스크 기반 스토리지를 경제성으로 역전할 수도 있는 상황이다. 신뢰성 측면에서도 스토리지 설계 측면에서 충분히 우려를 불식시킬 수 있을 것으로 보인다.
고성능 올플래시 스토리지가 ‘백업 스토리지’에 사용된다는 것도 일반적인 통념을 조금 벗어났다고 여길 수 있다. 지금까지 백업 스토리지는 용량과 비용을 최우선하는 것이 정석이었기 때문이다. 하지만 최근에는 현실적인 선택의 기준이 바뀌었다. 백업된 데이터를 실제로 ‘얼마나 빨리’ 복구할 수 있는지가 중요해지면서 스토리지 시스템 전반에서 ‘성능’이 중요해졌다. 최근 국내에서도 여러 사고 사례에서 실제로 복구가 지연되는 사태들이 벌어지면서, 실제 복원 시간에 대한 요건들이 까다로워지고 있는 상황이다.
한편, 퓨어스토리지는 올해 기업의 가상화 환경에서도 변화를 기대했다. 최근 몇 년간 기업의 가상화 환경은 브로드컴의 VM웨어(VMware) 인수와 라이선스 정책 문제, 기존 가상화 환경에서 클라우드 네이티브로의 전환 과제 등이 복잡하게 얽힌 상황이었다. 이를 해결하는 방안으로는 ‘쿠베버트(KubeVirt)’를 필두로 컨테이너 환경 안에 가상화를 통합하는 방법이 논의되고 있다. 퓨어스토리지 또한 ‘포트웍스(Portworx)’를 통해 이러한 환경을 지원하며, 올해 다시금 많은 기업들의 전환 시도가 있을 것으로 기대하고 있다.
기업의 데이터 활용 수준 바꾸는 ‘엔터프라이즈 데이터 클라우드’
퓨어스토리지는 올해 엔터프라이즈 스토리지 시장의 화두로 내부 데이터 활용 확대, 데이터셋 관리, 가상화 환경의 변화, 격리 복구 환경의 중요성을 제시한다. 김영석 퓨어스토리지 상무는 이에 대해 “올해는 AI가 공개된 데이터보다는 숨겨져 있던 내부 데이터와 합성 데이터를 더 적극적으로 활용할 것이다. 또한 더 많은 조직들이 일관된 데이터셋을 만들기 위해 정제를 잘 할 수 있는 방법에 집중할 것”이라며 “인프라와 운영, 데이터셋 관리 모두에서 변화가 필요하다”고 제시한다.
퓨어스토리지는 엔터프라이즈 스토리지 플랫폼의 전략적 방향성으로 ‘엔터프라이즈 데이터 클라우드’를 제시했다. 이는 기업 내의 다양한 위치에 있는 스토리지들을 단일 데이터 플레인으로 통합하고, 이를 지능형 컨트롤 플레인을 통해 정책 기반으로 운영한다는 것이다. 또한 올플래시 스토리지와 지능형 운영 환경을 기반으로 모든 유형의 워크플로우를 지원하고, SLA(Service Level Aggrement) 기반의 서비스형 운영으로 복잡성을 줄일 것을 제시했다.
이러한 통합 운영에서는 ‘퓨어 퓨전(Pure Fusion)’의 역할을 주목할 만하다. ‘퓨어 퓨전’은 다양한 위치에 분산 배치된 다양한 유형의 스토리지들을 단일 풀로 통합하고, 클라우드 스토리지처럼 사용자에 필요한 자원을 제공하는 환경을 구현한다. 또한 관리 환경에 LLM(거대언어모델)을 적용해 단순한 자연어 기반으로 스토리지를 운영할 수도 있게 했고, 문제가 생기기 전에 대응하는 사전 예방적 운영도 가능하게 한다.
기업의 ‘엔터프라이즈 AI’ 스토리지 환경을 위해서는 기존의 ‘스토리지’를 넘어선 ‘데이터셋 관리’ 측면에서의 추가적인 역량이 필요하다. 지금까지는 이러한 부분들을 인프라보다는 ‘AI 플랫폼’ 소프트웨어 스택으로 다뤘지만, 퓨어스토리지는 이를 스토리지 인프라 플랫폼 수준에서 언급한다. 이를 통해 스토리지 플랫폼 차원에서 AI를 위한 데이터를 준비해 전체 AI 파이프라인에서 80% 이상의 시간을 사용하는 데이터 전처리 과정을 크게 줄여 전반적인 AI 가치 창출 주기를 가속화한다는 전략이다.
퓨어스토리지의 ‘AI 데이터 플랫폼’은 기업 내에서 검색증강생성(RAG)을 구현하는 데 필요한 주요 데이터 준비 과정에 대해 엔비디아의 GPU 서버 인프라와 주요 모델들과의 연결을 미리 사전 정의해 준비함으로써, 사용자가 실제 데이터를 준비하는 과정에 드는 시간을 크게는 몇 달에서 몇 분까지로 줄인다. 이러한 접근법은 각 과정별로 사용자들의 요구 사항에 대한 분석과 인프라의 성능 요건들이 긴밀하게 결합돼 구현된 결과다.
또한 스토리지로 ‘KV(Key-Value) 캐시’를 오프로딩해 가속 처리하는 ‘KVA(Key-Value Accelerator)는 지금까지 GPU 메모리에 올라가 있던 KV 캐시를 스토리지 단으로 옮겨 인프라 전반의 밸런스를 재구성하고 성능을 최적화한다. 퓨어스토리지는 이 KVA를 vLLM 기반 구동 환경, 엔비디아 다이나모(Dynamo) 라이브러리와 결합됐을 때 최대 20배 더 빠른 추론 성능과 GPU 활용률 극대화 효과를 제공한다고 제시했다. 퓨어스토리지는 엔비디아가 CES 2026서 발표한 ICMSP(Inference Context Memory Storage)와 관련해서도 주요 협력 업체 중 하나로 소개된 바 있다.
기업 데이터 백업과 복원의 ‘뉴 노멀’ 등장
최근 국내에서도 데이터 백업과 복원 관련된 여러 가지 사건들이 있었다. 김진환 퓨어스토리지 이사는 백업과 복원의 중요성에 대해 “오늘날 엔터프라이즈 기업에서 한 시간 정도의 시스템 중단은 100만달러(약 14억7000만원)의 피해액으로 이어진다”며 “실제 문제 발생시 복구에는 45일 이상이 걸리고, 그 동안 브랜드 이미지 하락 등 무형 자산까지 고려하면 피해액은 더 커진다”고 지적했다.
오늘날 거의 모든 조직들이 어떤 방식으로든 ‘백업’은 하고 있다. 하지만 백업이 있다고 해서 언제나 복구가 성공하는 것은 아니며, 최근까지 다양한 이유로 제법 많은 ‘복구 실패’ 사례가 나왔다. 실패 판정 이유는 여러 가지다. 백업된 데이터의 시점과 복구가 필요한 시점 사이의 차이를 극복하지 못한 경우도 있고, 아예 백업 데이터까지 파괴된 경우도 종종 있었다. 혹은 복구까지 너무 오랜 시간이 걸리고, 이중화 구성까지 했지만 시스템을 원격지의 백업 시스템으로 제대로 넘기지 못한 경우도 많았다.
퓨어스토리지는 현재 백업 환경의 문제에 대해 ‘예상 불가능한 복구 성능’과 ‘높은 운영비용’, ‘운영 복잡성’ 등 세 가지 요소를 지적한다. 사실 이 세 가지 요소는 모두 다른 요소들과 복잡하게 엮여 있는 상황이다. 예를 들면 백업해야 할 데이터는 많지만 비용은 부담되니 최대한 백업 용량을 줄이기 위해 용량 위주의 백업 환경에 증분 백업과 중복제거, 압축 등을 복잡하게 적용한다. 이러한 기술은 복구에서 데이터를 다시 원래대로 풀어내는 과정을 복잡하게 만들어, 복구 시간을 예상보다 오래 걸리게 만드는 요인으로 꼽힌다.
빠른 ‘복원력’에 대한 문제는 의외의 관점에서 해결의 실마리가 보인다. 바로 백업 스토리지에 입출력 처리 성능이 높은 제품을 사용하는 방법이다. 실제 서비스에 사용되는 프로덕션 스토리지의 성능도 복구 성능에 핵심 요소인 만큼, 궁극적으로는 프로덕션과 백업 스토리지 모두를 올플래시 스토리지로 구성하는 것이 이상적이다. 백업과 복원의 복잡성을 줄이기 위해, 이제는 시대가 지난 VTL(가상 테이프 라이브러리) 기반 백업 체계를 디스크와 플래시 스토리지, 최신 서비스 환경에 적합한 형태로 바꾸는 것도 필요하다.
QLC 메모리 기반 올플래시 스토리지는 백업 스토리지에서도 성능과 경제성 모두 ‘게임 체인저’가 될 만하다. 특히 퓨어스토리지의 주요 스토리지 제품군 중 QLC를 사용한 ‘플래시어레이//E’ 블록 스토리지만 해도 백업과 복구 워크로드에서 시간당 5.4TB를 읽고 2.7TB를 쓸 수 있으며, ‘플래시블레이드//E’ 오브젝트 스토리지는 시간당 30TB를 읽고 10TB를 쓸 수 있다. 이러한 스토리지 몇 개를 분산 배치하는 정도로 구성하면, 상당수의 기업들에서 데이터 복구 시간을 몇 시간 정도로까지 줄일 수 있다.
실제 도입 사례에서는 이러한 경제성 측면이 더 극적으로 나타난다. 퓨어스토리지는 물리 용량 9페타바이트(PB)급 백업 스토리지를 구성할 때 기존 하드 드라이브 기반 구성 대비 상면 비용은 89%, 전력 비용은 85% 절감하면서도 복구 속도는 10배 높다고 제시했다. 경제성 측면에서도 운영 비용에서 87% 절감 뿐만 아니라 초기 도입 비용에서도 42% 절감 효과가 가능하다고 제시했다. 특별한 이유가 아니면 올플래시 스토리지 기반 백업 구성을 피할 필요가 없을 정도다.
이 외에도 퓨어스토리지는 랜섬웨어 등으로 인한 백업 데이터 파괴 시도에 대응하기 위한 방안으로 ‘변경 불가능한 스냅샷’ 기능을 제시했다. 관리 환경에서의 복구 프로세스를 단순화하고 백업 데이터를 상시 검증함으로써 복원 가능성에 대한 신뢰성을 높였다는 설명이다. 플래시 메모리의 하드웨어 신뢰성 측면에서는 “DFM(DirectFlash Module)의 장애율이 0.02% 수준”이라고 밝혔다. 이런 낮은 장애율조차도 스토리지 어레이의 다중화 구성이나 '서비스형 모델의 서비스 수준 계약(SLA)' 을 통해 보장받을 수 있다.
권용만 기자
yongman.kwon@chosunbiz.com
고객님만을 위한 맞춤 차량
