디노티시아, VLM 기반 전처리 고도화…기업 AI 상용화 지원 서비스 선봬
||2026.03.24
||2026.03.24
[디지털투데이 석대건 기자] 디노티시아가 기업 AI 프로젝트 조기 실패의 주요 원인으로 꼽혀 온 비정형 문서 전처리 문제를 자동화 기술로 지원한다. 24일 회사는 씨홀스 클라우드(Seahorse Cloud) SaaS 서비스를 정식 출시해 문서 업로드부터 파싱·구조화·벡터화까지 전 과정을 단일 환경에서 처리할 수 있도록 지원한다고 전했다.
생성형 AI와 AI 에이전트를 업무에 적용하려면 PDF·이미지·문서 등 비정형 데이터를 AI가 처리할 수 있는 형태로 먼저 변환해야 한다. 그러나 형식이 제각각인 비정형 데이터는 별도의 데이터 파이프라인이나 수작업 전처리가 필요했다.
이번 서비스는 벡터 데이터베이스 기반 RAGOps(검색증강생성 운영)와 AI 에이전트 운영 기능인 AgentOps를 통합한 관리형 서비스다. 기업은 별도 인프라 구축 없이 벡터 데이터 처리, RAG 구성, 에이전트 설계 및 운영을 하나의 환경에서 수행할 수 있다.
문서 파싱에는 VLM(비전언어모델) 기반 레이아웃 분석 기술을 적용해 페이지 구조와 표·이미지 영역을 구분한다. 이후 OCR(광학문자인식)과 LLM(거대언어모델) 기반 텍스트 정돈 과정을 거쳐 문서를 의미 단위로 구조화하는 방식이다. 표는 별도로 검출·복원해 정보 손실을 최소화했으며, 질의응답 정확도도 높였다. 순서도 등 이미지 기반 문서도 텍스트 변환을 지원해 AI 에이전트가 문맥 검색에 활용할 수 있다.
아마존웹서비스(AWS) 환경에서 제공되며, 공식 홈페이지와 제어 콘솔을 통해 바로 이용할 수 있다. 기존 클라우드 인프라를 유지한 채 서비스를 도입할 수 있도록 했다. 초기 사용자에게는 서비스 체험용 크레딧을 제공한다.
디노티시아 관계자는 "기업은 수많은 비정형 문서를 하나의 통합 SaaS 환경에서 처리하고 데이터 기반 인텔리전스를 도출할 수 있다"고 말했다.
고객님만을 위한 맞춤 차량
