"GPT-5,천장보다 바닥을 높였다...환각률 감소 주목해야"
||2025.08.12
||2025.08.12
[디지털투데이 황치규 기자]오픈AI가 신형 AI 모델 GPT-5를 공개한 것과 관련 크게 좋아진게 없는거 같다부터 오류가 줄었다까지 다양한 평가들이 나오고 있다.
AI 및 테크 분야 뉴스레러를 발행하는 알베르토 로메로(Alberto Romero)는 GPT-5에서 가장 주목할 포인트로 ‘바닥’을 끌어올렸다는 것을 꼽아 눈길을 끈다.
GPT-5는 기술적인 ‘천장’보다 일상 활용에 대한 ‘바닥’을 높이는 전략을 주목해야 한다는 것이다.
일부 사용자들은 그래프 오류나 기대 이하 성능을 지적하며 실망감을 표했지만, 사용자 경험 차원에서 ‘덜 틀리고 덜 속이는 AI’의 가치는 분명하다는게 그의 입장이다.
그가 최근 GPT-5를 써본 경험을 자신의 웹사이트에 공유한 글에 따르면 GPT-5는 GPT-4o 대비 환각률을 20.6%에서 11.6%로, 추론형 대화의 경우 22%에서 4.8%로 낮췄다. 복잡한 사실 탐색형 질문에서는 1% 미만 환각률을 보이기도 했다.
기만률( deception rates( 역시 표준 대화 기준 o3는 4.8%였던 반면 GPT-5에선 2.1%로 감소했다.
반면 창의적인 글쓰기 역량으 부족하고 인공일반지능(AGI)과도 여전히 거리가 멀다는 지적이 적지 않다.
그러나 로메로는 "환각률은 아직 0%가 아니며 결코 0%에 도달하지 않을 수도 있지만, GPT-5 환각률이 GPT-4o보다 44% 낮다. 이같은 개선은 AI가 엉뚱한 답변을 하거나 거짓 정보를 주는 문제를 줄여, 7억명 이상 이용자가 더 신뢰할 수 있는 환경을 제공한다"고 강조했다.
고객님만을 위한 맞춤 차량
