텍스트만 넣으면 3D 이미지 뚝딱…AI 모델 ‘트렐리스’ 주목
||2024.12.11
||2024.12.11
[디지털투데이 AI리포터] 텍스트 입력으로 다용도의 고품질 3D 이미지를 자동 생성할 수 있는 새로운 3D 생성 인공지능(AI) 모델 '트렐리스'(TRELLIS)가 주목받고 있다.
10일(현지시간) 온라인 매체 기가진에 따르면 청화대학교, 중국과학기술대학교, 마이크로소프트 리서치 공동 연구팀은 새로운 3D 생성 AI 모델 '트렐리스'를 발표했다.
이 모델은 텍스트나 이미지 입력만으로 고품질의 3D 에셋을 생성할 수 있는 기능을 제공하며, 'SLAT(Structured LATents)'라는 새로운 기법을 사용한 것이 특징이다. 이는 3D 객체의 표면에만 집중하여 효율적인 데이터 처리를 가능케 하고, 하나의 표현에서 여러 형태의 3D 에셋을 생성할 수 있다.
SLAT는 약 26만 개의 픽셀로 이루어진 드문드문한 형식의 3D 그리드를 기본 구조로 사용하며, 이 중 실제로 사용되는 것은 3D 오브젝트의 표면에 위치한 약 2만 개의 복셀뿐이다. 각 복셀에서는 '위치 정보'와 '특징 정보'를 얻을 수 있으며, 이를 통해 다양한 종류의 3D 모델을 생성하고, 용도에 따라 최적의 형식을 선택할 수 있다.
트렐리스는 이러한 SLAT에 의한 표현을 사용하여 3D 에셋을 생성하며, 베이직(Basic), 라지(Large), 엑스-라지(X-Large)의 3가지 모델 사이즈가 개발되었다. 연구팀은 모델 크기가 커질수록 생성 품질이 향상된다고 밝혔다.
해당 모델은 허깅 페이스(Hugging Face)에서 무료로 사용할 수 있으며, 생성된 3D 애셋은 GLB 파일로 저장할 수 있다.