오라클, AI·클라우드 시대 ‘오픈 멀티클라우드’로의 전환 [테크리포트]

우리의 삶은 물론 기업과 사회 전반에도 ‘변화의 바람’이 분다. 모든 비즈니스의 기반이 되는 IT 또한 중요한 변화의 시점에 섰다. 변화의 핵심은 ‘인공지능(AI)’이다. 모든 기업이 같은 의견을 가지는 것은 아니겠지만 대부분의 기업은 이 ‘AI’에 대해 향후 비즈니스의 판도를 바꿀 ‘게임 체인저’로 인식하고 있다. 이 AI로의 여정은 지금까지 10년 가까이 진행되던 ‘클라우드’로의 변화와도 맞물려 더 복잡한 상황을 만들고 있다.

오라클은 전통적인 ‘관계형 데이터베이스’로 잘 알려져 있지만 지금은 전통적인 ‘데이터베이스’만 가진 ‘소프트웨어’ 기업만은 아니다. 소프트웨어 포트폴리오는 데이터베이스를 넘어 이미 기업 운영 전반에 걸쳐 있으며 클라우드 서비스 사업자로도 전세계 5위권의 규모를 갖췄을 정도다. 오라클의 AI와 클라우드 시대의 전략은 지금까지와의 ‘경쟁’과는 사뭇 다른 ‘오픈 멀티클라우드’로의 방향성이 눈에 띈다. 지난 17일 한국오라클이 본사에서 진행한 기자간담회에서 발표한 내용을 바탕으로 오라클의 기술과 전략을 자세히 살펴봤다.

클라우드의 확장, 이제는 ‘오픈 멀티클라우드’

‘AI’로의 변화에 대한 화제가 워낙 강렬하지만 여전히 ‘클라우드’로의 변화는 기업의 IT 현대화에 있어 최우선 과제다. 예전에는 단순히 온프레미스 환경을 클라우드로 옮기거나 프라이빗 클라우드로 전환하는 게 과제였다면 이제는 여러 클라우드 환경을 아우르면서 필요할 때 필요한 서비스를 쓰는 ‘멀티 클라우드’ 시대다. 여기에 기존과는 상당히 다른 ‘AI’ 워크로드가 들어오면서, 이 또한 또 다른 멀티 클라우드 환경으로 접근하게 됐다.

기업들이 기존의 대규모 자체 구축 ‘온프레미스’ 환경에서 ‘클라우드’ 환경으로 전환하는 것은 여전히 어렵다. 일단 온프레미스 환경에서 쓰고 있는 애플리케이션들의 기술 기반은 클라우드 환경에서 쓸 수 있는 기술 기반과 아주 상이한 경우가 많다. 특히 퍼블릭 클라우드의 경우 아예 기존의 기술 기반을 포기하고 처음부터 다시 만들어야 할 수도 있는데 개발과 검증 등에 들어가는 시간과 비용이 절대 만만치 않다. 이를 모두 감수하고도 장점이 있으면 과감히 투자하는 것이고 그렇지 않다면 다음 기회를 생각할 수밖에 없다.

이 ‘클라우드’ 시대로의 변화 또한 오라클의 중요한 고민 중 하나였다. 기본적으로 오라클의 관계형 데이터베이스 소프트웨어는 설치형, 구축형이었다. 즉, 기본적으로는 고객의 데이터센터 내에 별도의 서버로 ‘설치’되거나 ‘엑사데이타(Exadata)’ 어플라이언스를 놓고 쓰는 것이다. 이 ‘데이터베이스’의 존재는 퍼블릭 클라우드로 가거나 하이브리드 클라우드를 쓰는 데 있어 제법 큰 장애물로 인식됐다. 다른 퍼블릭 클라우드에서는 이 오라클의 데이터베이스를 쓸 수 있는 방법이 마땅치 않고, 비용 문제도 복잡할 수 있기 때문이다.

다른 관점에서 보면, ‘오라클 클라우드(OCI: Oracle Cloud Infrastructure)’의 경쟁력도 여기에 있었다. ‘오라클 데이터베이스도 서비스형으로 쓸 수 있는’ OCI는 클라우드 환경에서 오라클 데이터베이스를 쓰고자 하는 사람들에 가장 매력적일 수밖에 없는 존재다. 하지만 반대로, 이런 오라클 데이터베이스의 제한에 부담을 느낀 사용자들은 과감히 수십년간 쓰던 오라클을 ‘전환’하는 결정을 내릴 수밖에 없다. 특히 AI 시대를 맞아 ‘관계형’ 데이터베이스의 영향력이 떨어진 지금이라면 말이다.

오라클의 ‘오픈 멀티클라우드’는 단순한 연결 이상의 전략이다. / 권용만 기자

최근 오라클의 발표는 이러한 ‘오라클 데이터베이스’의 한계를 넘기 위한 색다른(예전이라면 섣불리 생각하기 어려웠던) 행보를 보여준다. 가장 눈에 띄는 발표라면 ‘오라클 데이터베이스’를 타사 클라우드 서비스에서 공식 제공하는 ‘오라클 데이터베이스@AWS’ 나 ‘오라클 데이터베이스@애저’다. 이제 AWS나 애저를 기반으로 인프라를 구축하더라도 데이터베이스는 익숙한 ‘오라클’을 쉽게 사용할 수 있게 됐다. 이 서비스는 지원 리전이 빠르게 확장되고 있다.

이들 서비스는 데이터센터간 직접 연결을 지원하는 ‘인터커넥트’와는 또 다른 개념이다. 최신 오라클 데이터베이스는 ‘엑사데이타’ 어플라이언스를 기본 환경으로 전제하며, ‘오라클 데이터베이스@AWS’나 ‘애저’도 오라클 데이터베이스를 AWS나 애저의 고성능 인스턴스 기반에서 구동하는 것이 아니라 물리적인 엑사데이타 어플라이언스를 설치해 제공하는 형태다. 어찌 보면 ‘전용(Dedicated)’ 구성이긴 한데, 오라클은 엑사데이타 이외의 네트워크 연결이나 관리, 과금 체계 등은 모두 각 사업자들의 시스템에 통합돼 ‘전용’과는 또 다른 의미라는 설명이다.

이런 서비스의 등장은, 다른 클라우드 사업자의 서비스로 인프라를 전환하고자 할 때 꼭 전통적인 오라클 데이터베이스를 다른 데이터베이스로 전환하는 부담을 감당할 필요를 줄인다. 물론 한 번 아프게 휘둘리면 다음에는 좀 더 ‘덜 휘둘릴’ 선택을 하는 것이 당연하겠지만, 이에 대한 부담은 기술 성숙도 등 시기에 따라 달라질 것이다. 이에 모든 것을 바꾸는 혼란기에 데이터베이스까지 바꿀 것이냐 데이터베이스는 이미 검증된 것을 쓸지를 선택하는 것이 가능해졌다는 것도 중요한 의미로 다가올 듯 하다.

전용 클라우드 구성의 진입 장벽도 ‘3개 랙’으로 많이 낮아졌다. / 권용만 기자

클라우드로의 IT 현대화 여정에서 또 다른 선택은 ‘전용 클라우드’다. 이는 사실 수 년 전부터 제공되고 있어 새로운 개념은 아니다. 이 ‘전용 클라우드’는 서비스 사업자들이 고객에 서비스를 제공하기 위한 기본 인프라를 고객의 데이터센터 안에 직접 설치, 관리하는 형태다. 특히 서비스와 데이터의 ‘위치’가 중요하고 까다로운 규제를 적용받는 기업들이 클라우드를 쓰면서도 각종 규제를 준수할 수 있는 선택이다. 전용 인프라로 성능 등에 대한 경합도 적고, 기업의 인프라 관리 부담도 줄일 수 있다는 점도 매력이다.

오라클의 최신 ‘전용 클라우드’ 구성에서 눈에 띄는 부분은 최소 구성을 갖추기 위한 시설 마련 부담이 제법 줄었다는 점이다. 처음 이 ‘전용 클라우드’가 나왔을 때는 최소한 랙 45개를 놓을 수 있는 공간이 필요했는데 이 정도면 아예 소규모 데이터센터를 따로 지어야 할 수준이었다. 얼마 전까지는 이 규모가 13개 랙까지 줄어서 기존 데이터센터 공간을 정리해 어떻게든 설치할 수 있는 수준까지 왔다.

최신 구성에서는 13개 랙 126대 서버의 최소 구성이 ‘3개 랙 36대 서버’까지 줄었다. 이 정도면 데이터센터의 자투리 공간에 넣을 수도 있고 꼭 3개 랙이 함께 있어야 하는 것도 아니다. 공장에서부터 모듈화된 표준 설계를 써서 현장에서 설치하고 운영을 시작하는 데 들어가는 시간도 최소화했다. 고객의 데이터센터에 설치되지만 오라클이 관리하는 인프라인 만큼 랙 단위에서는 잠금장치 등의 보안성도 확보했다. 나중에 성능과 용량이 더 필요하면 ‘확장 킷’을 써서 64개 랙, 혹은 이후 수천 개의 랙까지 확장할 수도 있다.

전용 클라우드 구성은 ‘클라우드’지만 꼭 인터넷에 상시 연결되어야 하는 것은 아니다. 특정 영역에서는 망분리 등으로 인터넷 연결이 허용되지 않지만 내부망에서 프라이빗 형태로 클라우드를 구성해야 하는 경우도 있다. 오라클은 이런 경우에도 오라클 클라우드 환경을 사용할 수 있도록 ‘격리형(Isolated)’ 리전 구성도 제공하고 있다. 퍼블릭 클라우드라 하면 데이터가 꼭 ‘외부’로 나가는 것으로 생각하지만 이제는 꼭 그런 것만은 아니다.

AI로의 확장, ‘데이터베이스’와 ‘클라우드’ 경계 넘어

오늘날 AI 기술로의 접근 전략은 기업의 생존을 가르는 주제가 될 정도다. 오라클 또한 기존에 수십년간 이어 오던 설치형 ‘관계형 데이터베이스’ 중심의 이미지를 바꿔야 할 때가 됐고, 그 변화는 이미 ‘클라우드’ 시대에서부터 이어지고 있었다. 이미 오라클은 전 세계적으로 규모 있는 클라우드 서비스 제공자의 위치에 있다. 주요 제품 포트폴리오도 이미 클라우드를 우선으로 제공하고 있다. 예를 들면 ‘오라클 데이터베이스 23ai’는 클라우드로 제공되지만 아직 온프레미스 버전은 등장 예정이다.

오라클에 있어 ‘클라우드’로의 변화 다음의 과제는 ‘AI 시대’로의 변화다. 이번 변화의 조건은 이전보다 더 까다롭다. 이전의 ‘클라우드’로의 변화에서는 워크로드의 ‘환경’이 관건이었다면 이번에는 워크로드 자체의 ‘성격’이 관건이다. AI가 태생적으로 기업에서 출발한 기술이 아닌 만큼 기술의 기반 또한 기업의 환경과는 제법 다르다. 사실 ‘다르다’는 정도로 표현될 정도가 아니라 유연성이나 확장성 등 여러 가지 이유로 기존의 ‘관계형 데이터베이스’ 기술을 의도적으로 배제한 것으로 보일 정도다.

지금까지 기업의 정보 처리에서 핵심 시스템에는 ‘관계형 데이터베이스’가 사용됐다. 하지만 현재 ‘거대언어모델(LLM)’ 등에는 다양한 데이터를 담을 수 있는 비정형 데이터베이스가 주로 사용된다. 모델의 환각 현상을 줄이기 위해서는 ‘벡터 데이터베이스’가 사용된다. 이에 기업들이 LLM 기반에서 기업의 정보를 사용하기 위해서는 관계형, 비정형, 벡터 데이터베이스를 모두 갖추고, 이를 잘 연결하고 검증해야 하는 부담이 있었다.

AI 시대 데이터베이스에서 오라클의 전략 또한 이러한 현실을 겨냥한 모습이다. 오라클은 최신 ‘오라클 데이터베이스 23ai’에서 ‘AI’를 주요 테마로 제시하면서 핵심 역량으로 ‘컨버지드 데이터베이스’를 꼽는다. 이 ‘컨버지드 데이터베이스’는 하나의 데이터베이스에서 관계형, 비정형, 벡터 데이터베이스를 모두 제공해 복잡성을 줄인다. 특히 제대로 변환하기 어려운 기존 오라클 기반 데이터베이스를 완전히 사용할 수 있고, 사용자에게도 익숙하다는 점이 장점이다.

오라클 데이터베이스 23ai는 내부적으로 관계형, 비정형, 벡터 데이터베이스를 모두 갖추고 데이터에 접근하는 데도 관계형, 비정형, 벡터 데이터베이스에서 쓰던 방식을 쓸 수도, 교차할 수도 있게 했다. 이를 위해 중간에 몇몇 변환 계층이 놓이는데 이로 인한 효율 손실은 필연적이지만 오라클은 이 또한 극복할 수 있다는 점을 강조한다. 이러한 손해를 감수해도, 이를 통해 얻을 수 있는 이점이 더 크고 경쟁 제품 대비 성능에서도 우위를 유지할 수 있다는 입장이다.

이러한 ‘오라클 데이터베이스 23ai’를 기반으로 오라클은 앱 개발에 ‘생성형 개발(GenDev)’ 개념을 제시한다. 이 ‘생성형 개발’은 애플리케이션 개발에 LLM 등을 활용해 효율성을 더 높이면서 이로 인한 위험을 완화할 수 있게 도움을 주는 것을 목표로 한다. 오라클은 “앞으로는 AI가 데이터와 애플리케이션을 생성하고 새로운 것을 만드는 과정에서 데이터를 사용하게 될 것이다. 오라클 데이터베이스 또한 AI가 사용하는 데 원활한 환경이 돼야 한다”고 제시한다.

‘생성형 개발’의 지원에서 핵심은 데이터와 애플리케이션 모두에서의 ‘의도’다. 사용자가 어떤 목적으로 데이터를 사용하려 하는지, 그리고 사용자가 어떤 이유로 데이터를 생성했는지 모두가 이 ‘의도’로 요약된다. 오라클은 사용자와 데이터, 애플리케이션간의 ‘의도’를 기록하기 위한 새로운 체계를 도입해 이 부분을 강화했다. 또한 ‘JSON 관계형 이중성 뷰’는 JSON 뷰 방식으로 데이터를 조회하고 관계형의 방식으로 데이터를 관리해 양 쪽의 장점을 모두 취할 수 있게 해 준다.

AI 워크로드를 위한 오라클 클라우드의 GPU 인프라 주요 특징 / 권용만 기자

데이터베이스와 AI가 연결되는 데 있어서도 ‘클라우드’의 역할은 중요하다. 오라클은 이 부분에서 ‘오라클 데이터베이스@AWS’ 등의 서비스로 타사의 기술 기반과 오라클 데이터베이스의 연결 가능성을 열어 뒀고, 오라클의 클라우드 서비스 내부에서도 AI 관련 역량을 지속적으로 높이고 있다. 오라클은 최신 오라클 데이터베이스의 역량과 함께 LLM을 운영할 수 있는 데이터 관리 체계와 최신 모델을 효과적으로 운영할 수 있는 최적의 환경을 제공한다는 방침을 제시한다.

특히 오라클의 ‘OCI 슈퍼클러스터’는 이제 13만개 이상의 GPU를 구동하는 대규모 인프라로 확장됐다. 스토리지와 네트워크에서도 ‘성능 보장’ 등에서 높은 경쟁력을 제공하고 있다. 13만개 이상의 그래픽처리장치(GPU)간 연결을 위해 네트워크 연결 또한 초당 104페타비트(Pb/s) 규모의 전송 성능을 갖췄다. 스토리지에서는 용량당 특정 전송 성능을 보장하는 서비스와 함께 ‘러스터(Lustre)’ 스토리지의 서비스형 모델도 제공해 AI 인프라의 효율성 문제를 최소화했다.

클라우드 기반에서 편리하게 사용할 수 있는 최신 모델 기반의 ‘관리형’ 서비스들도 있다. 현재 오라클의 오퍼링은 크게 ‘라마(Llama)’ 계열 모델과 ‘코히어(Cohere)’ 계열 모델로 구성됐는데, 라마 계열 모델은 범용 LLM 구현에, 코히어 계열 모델은 엔터프라이즈 특화에 RAG(검색증강생성) 관련에서 성과가 높은 모델로 꼽힌다. 이와 함께, 허깅페이스(HuggingFace)와의 협력으로, 허깅페이스에 올라와 있는 모델을 OCI의 관리형 모델로 이관해 활용할 수 있는 방법도 제공한다.

한편, 오라클은 사용자의 의도에 맞춘 코드를 생성형 AI로 만들어서 개발 효율을 높이는 ‘코드 어시스트’의 베타 버전을 일반 공개했다. 오브젝트 스토리지에 데이터를 올리면 RAG 애플리케이션을 자동 생성하는 노코드형 서비스인 ‘생성형 AI 에이전트’도 선보였다. 향후 생성형 AI 에이전트는 ‘히트웨이브(HeatWave)’의 벡터 저장소와의 통합이나 SQL 에이전트 등의 기능 추가가 예정돼 있는 것으로 알려졌다.

권용만 기자 yongman.kwon@chosunbiz.com