얼마나 빠르길래…AI 처리 속도 대폭 올린 구글 ‘제미나이 디퓨전’
||2025.05.23
||2025.05.23
[디지털투데이 AI리포터] 구글이 연례 개발자 콘퍼런스인 '구글 I/O 2025'에서 각종 인공지능(AI) 기술을 선보인 가운데, 업계 내부자의 주목을 받은 기술이 있었다. 바로 대규모 언어모델(LLM) '제미나이 디퓨전'(Gemini Diffusion)이다.
제미나이 디퓨전은 텍스트 문장 조각인 토큰을 초당 1000~2000개 생성할 수 있는 엄청난 속도를 자랑한다. 이는 구글이 공개한 제미나이 중 가장 빠른 모델보다 4~5배 빠른 처리 속도다.
22일(현지시간) 온라인 매체 기가진에 따르면 제미나이 디퓨전은 언어 모델로서는 이례적으로 확산 모델(Diffusion Model)을 채택해 생성 속도의 혁신을 이뤄냈다. 기존 AI 언어 모델은 텍스트를 한 글자씩 순차적으로 생성하는 반면, 제미나이 디퓨전은 이미지 생성 모델처럼 노이즈를 점진적으로 제거하며 최종 텍스트를 출력한다. 이를 통해 빠른 처리 속도뿐 아니라 생성 과정에서 오류를 수정할 수 있는 장점도 갖췄다.
구글은 제미나이 디퓨전이 1초당 1479토큰을 생성할 수 있으며, '제미나이 2.0 플래시-라이트'와 유사한 벤치마크 점수를 기록했다고 밝혔다. AI 성능 테스트로 유명한 사이먼 윌리슨 데이터셋 설립자는 제미나이 디퓨전의 대기자 명단에 참여해 코드 생성 속도를 테스트한 결과, 1초당 857토큰을 생성했다고 전했다. 또한 이는 '챗앱 시뮬레이션'과 같은 복잡한 요청에도 빠르게 응답하며 실시간 코드 미리보기를 제공했다고 한다.
매체는 "기존 AI 언어 모델이 단순한 텍스트 생성에 그쳤다면, 제미나이 디퓨전은 코드 생성과 자동 수정 기능까지 갖춰 개발자들에게 강력한 도구가 될 것"이라고 평가했다.
한편 확산 모델을 활용한 언어 모델은 새로운 개념은 아니다. 지난 2월 AI 기업 인셉션이 유사한 방식의 '머큐리 코더'(Mercury Coder)를 발표한 바 있다.
고객님만을 위한 맞춤 차량