메타, 1600개 언어 지원하는 오픈소스 음성인식 AI 공개
||2025.11.11
||2025.11.11
[디지털투데이 AI리포터] 메타가 1600개 이상의 언어를 지원하는 음성인식 인공지능(AI) '옴니링구얼 ASR'(Omnilingual ASR)을 공개했다.
11일(현지시간) 온라인 매체 기가진에 따르면, 이 시스템은 기존 AI보다 적은 학습 데이터로도 높은 정확도를 달성하며, 언어 확장도 용이하다.
옴니링구얼 ASR은 70억개 파라미터로 구성된 음성 인코더 wav2vec 2.0을 활용해 데이터 요구량을 대폭 줄였다. 그 결과, 지원 언어 중 78%가 문자 오류율(CER) 10% 미만을 기록했으며, 195개 언어는 10시간 미만의 학습 데이터로도 높은 정확도를 보였다.
또한 옴니링구얼 ASR은 대규모 언어 모델에서 활용되는 인컨텍스트 학습(In-Context Learning)을 지원해, 적은 조작만으로도 언어를 확장할 수 있다. 이는 기존 모델인 위스퍼(Whisper)와 비교해도 지원 언어 수에서 압도적인 우위를 점하고 있다.
옴니링구얼 ASR의 데모 페이지는 허깅 페이스(Hugging Face)에서 제공되며, 소스 코드와 문서는 깃허브(GitHub)에서 확인할 수 있다. 또한 옴니링구얼 ASR 개발 시 수집된 음성 데이터셋 '옴니링구얼 ASR 코퍼스'(Omnilingual ASR Corpus)도 공개됐다.
고객님만을 위한 맞춤 차량
