中 텐센트, AI 기반 동영상 생성 모델 ‘훈위안비디오’ 공개…음향 효과도 OK
||2025.03.10
||2025.03.10
[디지털투데이 AI리포터] 중국 텐센트가 새로운 오픈 소스 모델인 훈위안비디오-I2V(HunyuanVideo-I2V)를 출시하면서 중국의 AI 동영상 생성 기술 경쟁이 한층 더 치열해지고 있다.
지난 7일(현지시간) 홍콩 사우스차이나모닝포스트(SCMP)에 따르면, 이 모델은 사용자가 정적인 사진을 720픽셀의 고해상도 동영상 클립으로 변환할 수 있도록 지원한다. 텐센트는 깃허브와 허깅페이스와 같은 개발자 플랫폼을 통해 해당 모델을 제공하고 있다.
텐센트에 따르면 사용자는 동영상에 립싱크된 음성 및 배경 음향 효과도 추가할 수 있다. 회사가 공개한 데모 영상에서는 알버트 아인슈타인이 사과를 먹으면서 아삭거리는 소리가 연출됐다.
챗GPT 개발사인 오픈AI가 텍스트-비도오 모델인 소라(Sora)로 전 세계 개발자를 놀라게 한 지 1년 이상 지난 지금, 중국의 자체 개발 AI 동영상 생성 제품 분야 경쟁은 더욱 치열해지고 있다. 텐센트 외에도 콰이쇼우, 바이트댄스, 알리바바 등 등 여러 중국 기업들이 이 분야에 뛰어들고 있다.
알리바바는 최근 완2.1(Wan2.1) 시리즈의 동영상 생성 모델을 오픈 소스로 공개했다. 이는 중국어와 영어로 텍스트 효과를 지원하는 최초의 모델로 평가받고 있다. 바이트댄스는 최근 옴니휴먼-1(OmniHuman-1) 모델을 출시하며 주목받았고, 콰이쇼우는 클링 AI(Kling AI) 모델로 시장을 확장하고 있다.
한편, AI 모델 개발에 대한 오픈 소스 접근 방식이 중국 현지에서 상승 모멘텀을 얻고 있다. 이는 부분적으로 항저우에 본사를 둔 딥시크의 최근 성장 덕분이다. 이 스타트업은 대규모언어모델(LLM) 프로젝트에 대해 주요 기술 기업들에 일반적으로 요구되는 비용과 컴퓨팅 파워의 일부만으로 고급 오픈 소스 AI 모델인 V3와 R1을 구축했다.