앤트로픽, 더 강해진 ‘클로드 오퍼스 4.8’ 공개…코딩·추론↑ 가격 그대로
||2026.05.29
||2026.05.29
[디지털투데이 유승아 인턴기자] 앤트로픽(Anthropic)이 새 인공지능(AI) 모델 '클로드 오퍼스 4.8'(Claude Opus 4.8)을 공개하고 전 세계에 출시했다.
28일(이하 현지시간) IT매체 나인투파이브맥 등 외신에 따르면, 이번 업데이트는 지난 4월 16일 오퍼스 4.7 공개 이후 약 6주 만에 이뤄졌다.
이번 버전의 핵심은 성능 개선과 응답 방식 조정이다. 앤트로픽은 클로드 오퍼스 4.8이 이전 모델보다 더 효과적인 협업자 역할을 수행하도록 설계됐다고 설명했다. 회사는 오퍼스 4.7을 기반으로 판단력을 더욱 정교하게 다듬고, 작업 진행 상황에 대해 더 정직하게 응답하며, 장시간 독립적으로 작업할 수 있는 능력을 강화했다고 밝혔다.
앤트로픽은 초기 테스트 결과를 근거로 클로드 오퍼스 4.8이 작업 과정에서 불확실성을 더 자주 표시하고, 근거 없는 주장을 내놓는 빈도는 줄였다고 설명했다. 회사는 "새 모델이 더 높은 신뢰성과 더 날카로운 판단력을 보였고, 사실 근거가 부족한 주장을 내놓는 경향도 감소했다"라고 밝혔다.
특히 클로드 오퍼스 4.8은 스스로 생성한 코드의 결함을 놓칠 가능성이 오퍼스 4.7 대비 4분의 1 수준으로 감소했다. 코드 검수와 반복 수정이 많은 개발 환경에서 오류 탐지 정확도를 높이는 방향으로 개선된 셈이다.
정렬성 평가에서도 변화가 있었다. 앤트로픽은 클로드 오퍼스 4.8이 사회적으로 바람직한 특성 지표에서 새로운 최고 수준을 기록했고, 오퍼스 4.7 대비 비정렬 행동 비율도 크게 낮아졌다고 밝혔다. 작업 수행 능력을 강화하면서도 통제 가능성과 안전성을 함께 끌어올렸다는 설명이다.
벤치마크 수치도 공개했다. 에이전트형 코딩 점수는 64.3%에서 69.2%로 상승했고, 도구 활용 기반 다분야 추론 점수는 54.7%에서 57.9%로 올랐다. 에이전트형 컴퓨터 사용 점수는 82.8%에서 83.4%로 개선됐으며, 지식 작업 점수는 1753에서 1890으로 높아졌다. 에이전트형 금융 분석 점수 역시 51.5%에서 53.9%로 상승했다.
가격 정책은 유지했다. 앤트로픽은 오퍼스 4.7과 오퍼스 4.8의 가격을 동일하게 유지한다고 밝혔다. 대신 빠른 모드의 성능과 비용 구조를 조정했다. 일반 요금은 입력 토큰 100만개당 5달러, 출력 토큰 100만개당 25달러다. 2.5배 속도로 작동하는 오퍼스 4.8용 고속 모드는 입력 토큰 100만개당 10달러, 출력 토큰 100만개당 50달러로 책정됐다. 회사는 빠른 모드가 이전보다 약 2.5배 빨라졌고, 비용은 3분의 1 수준으로 낮아졌다고 설명했다.
개발자용 환경인 클로드 코드(Claude Code)도 함께 개편했다. 오퍼스 4.8은 기본적으로 높은 연산 노력 수준에서 작동한다. 앤트로픽은 이 설정이 코딩 작업에서 오퍼스 4.7과 비슷한 수준의 토큰을 사용하면서도 더 높은 성능을 제공한다고 밝혔다. 추가 성능 및 최대 성능 설정에 맞춰 클로드 코드의 사용 한도도 상향 조정할 계획이다.
대규모 작업을 겨냥한 기능도 추가됐다. 연구 미리보기 형태로 제공되는 동적 워크플로는 클로드 코드가 더 큰 규모의 작업을 처리할 수 있도록 지원하는 기능이다. 클로드 코워크(Claude Cowork)와 claude.ai에는 모델 선택기 옆에서 응답에 투입할 연산 노력 수준을 조정할 수 있는 제어 기능도 추가됐다.
메시지 API 역시 변경됐다. 메시지 배열 내부에서 시스템 항목을 받을 수 있도록 구조가 바뀌면서 개발자는 사용자 차례를 거치지 않고도 작업 중간에 지시사항을 수정할 수 있게 됐다. 동시에 프롬프트 캐시와 라우팅 기능도 유지할 수 있다.
앤트로픽은 후속 계획도 공개했다. 회사는 비슷한 성능을 제공하는 저비용 모델을 준비 중이며, 프로젝트 글래스윙(Project Glasswing) 기반의 강화된 사이버 안전장치를 적용한 뒤 향후 몇 주 안에 '미토스'(Mythos)급 모델도 더 넓게 공개할 계획이라고 밝혔다.
오픈AI와의 경쟁이 치열해지는 가운데 이번 업데이트는 실사용 성능 개선에 초점을 맞춘 행보로 평가된다. 특히 코딩 오류 탐지, 장시간 자율 작업, 응답의 정직성 등을 전면에 내세우며 개발자와 기업 고객 확보 경쟁에 속도를 내는 분위기다.
고객님만을 위한 맞춤 차량
