애플, 이미지 생성·편집을 하나로…올인원 AI ‘유니젠1.5’ 공개
||2025.12.19
||2025.12.19
[디지털투데이 이윤서 기자] 애플 연구진이 이미지의 이해부터 생성, 그리고 편집까지 하나의 모델에서 처리할 수 있는 올인원 인공지능(AI) 시스템 '유니젠1.5'(UniGen 1.5)를 공개했다.
지난 18일(현지시간) IT매체 나인투파이브맥에 따르면, 이번 연구는 지난 5월 애플이 발표한 멀티모달 대규모언어모델(MLLM) '유니젠'의 후속작이다. 기존 유니젠이 이미지 이해와 생성을 통합하는 데 초점을 맞췄다면, 이번 1.5 버전은 여기에 정교한 '편집' 기능까지 더해 단일 프레임워크로 완성한 것이 특징이다.
통상적으로 AI 업계에서는 이미지를 이해하는 모델과 생성하는 모델, 편집하는 모델을 별도로 개발해 운용해 왔다. 각 작업에 필요한 접근 방식이 다르기 때문이다. 하지만 애플 연구진은 "통합된 모델이 오히려 이미지 이해 능력을 활용해 생성 성능을 높일 수 있다"고 주장하며 시스템 통합에 성공했다.
연구진은 특히 이미지 편집 과정에서 AI가 "배경은 그대로 두고 옷 색깔만 바꿔 줘"와 같은 미묘하거나 복잡한 지시를 제대로 수행하지 못하는 한계를 극복하기 위해 '편집 명령어 정렬'이라는 새로운 사후 학습 단계를 도입했다. 이는 AI가 곧바로 이미지를 수정하는 대신, 원본 이미지와 편집 요청을 분석해 '결과물이 어떤 모습이어야 하는지'에 대한 상세한 텍스트 설명을 먼저 추론하도록 훈련하는 방식이다. 이 중간 과정을 통해 AI는 사용자의 편집 의도를 더 명확히 내재화한 뒤 최종 이미지를 생성하게 된다.
또한, 연구진은 이미지 생성과 편집이라는 서로 다른 작업에 동일한 보상 체계를 적용하는 강화 학습 기법을 구현했다. 이는 작업의 성격이 다른 두 기능을 하나의 시스템 안에서 효율적으로 학습시켰다는 점에서 이번 논문의 가장 중요한 기술적 기여로 평가받는다.
성능 또한 입증됐다. 유니젠1.5는 지시 이행 능력과 시각적 품질을 측정하는 주요 산업 벤치마크 테스트에서 기존의 최첨단(SOTA) 오픈 소스 및 독점 모델들과 대등하거나 그 이상의 성능을 기록했다.
다만 한계도 존재한다. 연구진은 보고서를 통해 "유니젠1.5가 이미지 내 텍스트 생성 능력이나, 특정 상황에서 피사체의 정체성을 일관되게 유지하는 부분에서는 여전히 어려움을 겪고 있다"고 밝혔다.
업계에서는 이번 유니젠1.5가 향후 애플의 AI 기능인 '애플 인텔리전스'(Apple Intelligence)의 이미지 관련 기능을 한층 고도화하는 데 기여할 것으로 내다보고 있다.
고객님만을 위한 맞춤 차량
