챗GPT·제미나이·클로드, 이미지 분석 테스트…누가 더 정확할까?

디지털투데이|AI리포터|2025.12.04

 AI의 이미지 해석 능력은 기술 발전의 핵심 지표다. [사진: 셔터스톡]
 AI의 이미지 해석 능력은 기술 발전의 핵심 지표다. [사진: 셔터스톡]

[디지털투데이 AI리포터] 최신 인공지능(AI) 모델들이 저마다 최고의 성능을 자부하고 있지만, 실제 사용자가 체감하는 성능 차이는 존재한다. 이에 3일(현지시간) IT매체 테크레이더는 GPT 5.1, 제미나이3 프로, 클로드 오푸스 4.5를 대상으로 타임스퀘어, 미켈란젤로의 최후의 심판, 어수선한 방 사진을 입력해 비교한 결과를 전했다.

GPT 5.1은 타임스퀘어를 여러 구역으로 나누어 각 구역의 주요 간판과 표지판을 식별했으며, “이 모든 것이 주의를 끌기 위해 경쟁하고 있다”는 감정적인 평가를 덧붙였다. 제미나이3 프로는 색채와 각도, 공간 구조를 정밀히 분석하며, “녹색 빛이 인접 건물의 표면에 반사된다”는 세부 사항을 언급했다. 클로드 오푸스 4.5는 문학적 표현을 더해 전체적인 분위기를 “뉴욕시의 야간 사진”이라고 규정하고, 주요 간판과 그림자를 상세히 나열했다.

최후의 심판에서는 GPT 5.1이 주요 인물과 구역을 명확히 구분했지만, 인물 이름을 섣불리 특정하지 않는 신중함을 보였다. 제미나이3 프로는 “역동적인 그리스도를 중심으로 한 방사형 구성”을 강조하며, 그림자의 방향과 구름의 미묘한 차이를 포착했다. 클로드 오푸스 4.5는 "신성한 심판을 통해 소용돌이치는 육체들의 웅장한 소용돌이"라며 서정적인 묘사에 집중했다.

어수선한 방 사진에서는 GPT 5.1이 전선의 위치와 서류의 종류를 나열했지만, 일부 항목은 모호하게 표현했다. 제미나이3 프로는 재질, 색상, 형태까지 상세히 기록했으며, “낡은 패턴 카펫이 서류 더미 아래에 놓여있다”라는 새로운 사실을 발견했다. 클로드 오푸스 4.5는 객체를 분류하는 데는 정확했지만, 접힌 방수포를 의류 가방으로 착각하는 등 보이지 않는 부분에 대해 과도한 추론을 내놓기도 했다.

테스트 결과,  제미나이3 프로는 겹쳐진 객체 구분, 텍스트 인식, 공간 관계 파악, 그리고 환각을 최소화하는 데 가장 우수한 점수를 받았다. 따라서 일상적인 이미지 분석뿐 아니라 복잡한 시각 정보를 정확히 해석해야 하는 경우, 제미나이3 프로가 가장 적합한 선택이라고 테크레이더는 평가했다. 

본 서비스는 패스트뷰에서 제공합니다.