트웰브랩스, 신형 영상 이해 모델 ‘마렝고 3.0’ 공개...맥락 이해 역량 강화
||2025.12.02
||2025.12.02
[디지털투데이 황치규 기자]영상 이해 기반 멀티모달 AI 기술 개발 스타트업 트웰브랩스(TwelveLabs)가 차세대 영상 AI 모델 ‘Marengo 3.0(이하 마렝고 3.0)’을 공식 출시했다고 2일 밝혔다.
이번 신제품은 단순히 영상을 ‘보는’ 수준을 넘어, 영상 속 장면 텍스트·음성·움직임·상황 맥락을 통합적으로 이해하는 차세대 비디오 파운데이션 모델(Video Foundation Model)이라고 회사 측은 강조했다.
트웰브랩스에 따르면 마렝고 3.0은 영상 속 대사와 몇 분 후에 등장하는 동작을 연결해 해석하고, 사물·행동·감정·상황 변화를 시간 흐름에 따라 추적한다.
이미지와 텍스트를 동시에 검색할 수 있는 ‘복합 이미지 검색(Composed Image Retrieval)’ 기능과 ‘사람’이나 ‘제품’을 별도로 등록해 찾아볼 수 있는 ‘고유명사 검색(Entity Search)’ 기능도 도입됐다.
이번 모델은 36개 언어를 지원하 수차례 정교한 테스트를 통해 스토리지 비용 50% 절감, 인덱싱 속도 2배 향상 등 효율성도 개선됐다.
이재성 트웰브랩스 대표는 “전 세계 디지털 데이터 90%가 영상인데 사람이 직접 분석하기에 너무 오래 걸리고, 기존 기술로는 모든 것을 파악하기가 어려워서 그동안 대부분 제대로 활용되지 못했다”며 “이 문제를 해결하는 것이 우리의 목표였다”고 말했다. 이어 “마렝고 3.0은 그동안 영상 이해 기술이 가졌던 한계를 완전히 뛰어넘는 모델로, 기업과 개발자에게 기존과 다른 혁신적인 기준을 제시할 것”이라고 말했다.
AWS AI 인프라 부문 부사장 니샨트 메타(Nishant Mehta)는 "트웰브랩스 영상 이해 기술은 그동안 수작업 중심이었던 영상 분석 프로세스에 전례 없는 속도와 효율성을 제공하며 산업 전반에 혁신을 이끌고 있다"며 "마렝고와 페가수스 모델이 아마존 베드록에서 큰 성과를 거둔 데 이어, 마렝고 3.0은 높은 수준 영상 이해 능력을 필요로 하는 고객들에게 최적의 솔루션이 될 것으로 기대한다"고 말했다.
고객님만을 위한 맞춤 차량
