GPT-4o부터 제미나이2.5까지…2025년 최신 AI 모델 총정리
||2025.04.01
||2025.04.01
[디지털투데이 홍진주 기자] 생성형 인공지능(AI) 시장이 빠르게 변화하는 가운데, 구글, 오픈AI, 앤트로픽 등 주요 기업들이 새로운 AI 모델을 속속 공개하고 있다. 하지만 AI 모델들은 종종 기술적 벤치마크로만 홍보되며, 실제 사용자나 기업들에게 어떻게 활용되는지는 명확하지 않아 혼란을 야기하는 경우가 많다.
이러한 혼란을 줄이기 위해 IT매체 테크크런치는 2024년 이후 출시된 가장 진보된 AI 모델의 사용 방법 및 강점 등을 소개했다. 매체는 오픈소스 커뮤니티인 허깅 페이스(Hugging Face)가 보유한 약 140만 개 이상의 AI 모델 중 일부 상위 모델을 비교 분석했다.
먼저 구글이 최근 발표한 '제미나이 2.5 프로 익스페리멘탈'(Gemini 2.5 Pro Experimental)은 웹 앱과 코드 에이전트를 구축하는 데 뛰어난 추론 모델이다. 이 모델은 강력한 추론 성능을 기반으로 일반적인 코딩, 수학 및 과학 벤치마크에서 뛰어난 점수를 기록했으며, 기존 제미나이 2.0 모델보다 코딩 능력이 향상됐다고 구글 측은 밝혔다.
다만 이는 인기 있는 코딩 벤치마크에서 앤트로픽 클로드 3.7 소넷(Claude 3.7 Sonnet)보다 성능이 떨어졌고, 월20달러 유료 플랜 '제미나이 어드밴스드'(Gemini Advanced) 사용자 대상 앱에서 우선 제공되고 있다.
오픈AI는 기존 GPt-4o 모델을 업그레이드하여 텍스트뿐만 아니라 이미지도 생성할 수 있도록 했다. 이 모델은 지브리 스튜디오 스타일의 이미지를 생성하며 빠르게 입소문을 탔다. 하지만 최근 샘 알트먼 오픈AI 최고경영자(CEO)는 GPT-4o의 이미지 생성 모델의 폭발적인 이용으로 서버에 부하가 걸리고 있다며, 해당 기능의 무료 사용을 일시적으로 제한한다고 밝힌 바 있다.
또한 오픈AI는 이보다 앞서 차세대 프론티어 모델 'GPT-4.5'(코드명 오리온)을 역대 최대 규모라고 소개하며, 강력한 세계 지식과 감정 기능을 강조했다. 이는 심플QA 벤치마크에서 정확도 면에서는 GPT-4o, o1, o3-미니를 능가하는 것으로 나타났지만, 코딩(SWE-벤치, SWE-랜서) 및 학술(AIME, GPQA) 벤치마크에서는 딥시크, 클로드 3.7 소넷 등에 미치지 못했다.
아울러 오픈AI는 실제 웹 브라우저를 직접 사용해 다양한 작업을 자동으로 처리해주는 오픈AI 오퍼레이터(OpenAI Operator)와 에이전트 기반 연구 기능으로, 다단계 웹 검색 및 데이터 분석을 자동화하여 전문 연구 분석가 수준의 보고서를 생성하는 AI 도구인 딥 리서치(Deep Research)도 선보였다.
이미지 생성 스타트업 스태빌리티 AI(Stability AI)는 단일 2D 이미지를 3D 비디오로 변환하는 새로운 AI 모델을 공개했다. 이는 복잡한 작업 없이 2D 이미지를 깊이와 원근감이 있는 몰입감 있는 3D 비디오로 바꿔주나, 인간이나 흐르는 물과 같은 복잡한 것들을 다루는 장면에서는 여전히 어려움을 겪고 있는 것으로 알려졌다. 이 모델은 허깅페이스에서 비상업적 연구 목적으로 사용할 수 있다.
코히어(Cohere)는 첫번째 비전언어모델(VLM)인 아야 비전(AyA Vision)을 출시했다. 회사에 따르면 이 모델은 다국어 텍스트 생성과 이미지 이해 관련 벤치마크에서 최상위 성능을 기록했으며, 다른 모델들과 달리 영어 이외의 언어에서도 뛰어난 성능을 보였다. 이는 왓츠앱에서 무료로 이용할 수 있다.
이외에도 미스트랄은 멀티모달 AI 개인 비서인 르 챗(Le Chat)의 앱 버전을 출시했으며, 일론 머스크의 AI 회사 xAI는 최신 플래그십 모델 그록3를 발표하며, 수학, 과학, 코딩 분야에서 다른 선도 모델들을 능가한다고 주장했다.
고객님만을 위한 맞춤 차량