미스트랄, 오픈소스 AI 음성 모델 ‘복스트랄’ 공개…위스퍼급 성능
||2025.07.16
||2025.07.16
[디지털투데이 AI리포터] 인공지능(AI) 음성 기술 경쟁이 뜨거워지는 가운데, 프랑스 AI 스타트업 미스트랄이 기업용 오픈소스 음성 모델 '복스트랄'(Voxtral)을 발표했다.
15일(현지시간) IT매체 테크크런치에 따르면 미스트랄은 기업용 오디오 모델인 복스트랄을 발표하며, 폐쇄형 시스템에 대한 대안으로 오픈소스 음성 AI를 내세웠다. 복스트랄은 실용적인 음성 지능을 제공하는 첫 오픈소스 모델로, 기존의 저렴하지만 부정확한 시스템과 폐쇄형 고비용 시스템의 중간점을 찾았다는 평가다.
미스트랄에 따르면 복스트랄은 최대 30분의 오디오를 자동으로 변환할 수 있으며, LLM 백본 미스트랄 스몰 3.1을 활용해 최대 40분까지 이해할 수 있다. 이를 통해 음성 내용을 요약하거나 명령을 실시간으로 실행하는 기능을 제공한다. 영어, 스페인어, 프랑스어, 포르투갈어, 힌디어, 독일어, 네덜란드어, 이탈리아어 등 다국어 지원도 가능하다.
복스트랄은 두 가지 버전으로 나뉜다. '복스트랄 스몰’(Voxtral Small)은 240억 개의 매개변수로 대규모 배포에 적합하며, 일레븐랩스 스크라이브, GPT-4o-미니, 제미나이 2.5 플래시와 경쟁한다. ‘복스트랄 미니’(Voxtral Mini)는 30억 개의 매개변수로 로컬 및 엣지 배포에 최적화됐으며, ‘복스트랄 미니 트랜스크라이브’(Voxtral Mini Transcribe)는 트랜스크립션 전용으로 오픈AI 위스퍼보다 빠르고 저렴하다고 한다.
사용자는 허깅페이스에서 API를 다운로드하거나 미스트랄의 챗봇 '르샤'에서 모델을 테스트할 수 있다. API 통합 비용은 분당 0.001달러부터 시작한다.
한편, 이번 발표는 미스트랄이 추론 모델 ‘마지스트랄’(Magistral)을 공개한 지 한 달 만에 이뤄졌으며, 회사는 아부다비 MGX 펀드를 포함한 투자자들로부터 최대 10억달러를 유치할 계획이다.
고객님만을 위한 맞춤 차량