아마존, 생성형 AI 음성 모델 ‘노바 소닉’ 공개…알렉사+ 강화
||2025.04.09
||2025.04.09
[디지털투데이 AI리포터] 아마존이 새로운 생성형 인공지능(AI) 음성 모델인 '노바 소닉'(Nova Sonic)을 공개했다.
8일(현지시간) 실리콘앵글에 따르면 이 모델은 알렉사 플러스에 적용돼 테이크아웃 주문, 항공권 예약 등 다양한 고객 요청 작업을 자동으로 수행할 수 있는 최신 음성 처리 모델이다.
기존 음성 처리 시스템은 음성을 텍스트로 변환한 후, 이를 다시 텍스트 기반 생성 모델과 음성 합성 엔진으로 변환하는 3단계 프로세스를 거쳐야 했다. 이 과정은 개발을 복잡하게 만들고, 응답 지연을 초래하는 단점이 있었다.
하지만 노바 소닉은 이 모든 과정을 단일 모델로 통합해 개발을 단순화하고 성능을 향상시켰다. 아마존에 따르면 노바 소닉은 평균 1.09초 만에 응답을 시작하는데, 이는 오픈AI와 구글 모델보다 빠른 수준이라고 한다.
또한 노바 소닉은 사용자 행동에 따라 음성을 조정하며, 대화 중 톤을 변경하거나 추가 질문을 던질 수 있다. 이에 더해 외부 시스템에서 데이터를 검색해 제품 재고 확인이나 주문 처리 같은 작업도 수행할 수 있다. 처리된 음성은 텍스트로 변환돼 API를 통해 다른 AI 모델과 연동할 수 있으며, 고객 감정 분석 같은 기능도 지원한다.
노바 소닉은 출시 초기 영어 및 다양한 억양을 지원하며, 향후 추가 언어와 억양도 도입될 예정이다. 개발자들은 아마존웹서비스(AWS)의 아마존 베드락을 통해 이 모델을 활용할 수 있다.
로히트 프라사드 아마존 인고이능 부문 수석부사장은 "노바 소닉은 인터페이스를 빠르고 정밀하게 구축할 수 있는 차세대 기반 기술"이라며 "더 자연스럽고 정확한 고객 경험을 만드는 데 핵심 역할을 할 것"이라고 강조했다.
고객님만을 위한 맞춤 차량