딥시크 V4 프로, GPT-5급 성능 근접…"중국산 AI 중 최고" 평가

디지털투데이|홍진주 기자|2026.05.13

딥시크(deepseek) [사진: 셔터스톡]
딥시크(deepseek) [사진: 셔터스톡]

[디지털투데이 홍진주 기자] 딥시크의 최신 모델 '딥시크 V4 프로'가 미국 최상위 인공지능(AI) 모델과 비교해 약 8개월 뒤처졌다는 미국 정부 산하 평가가 나왔다.

12일(현지시간) 온라인 매체 기가진에 따르면, 미국 국립표준기술연구소(NIST) 산하 AI 표준 및 혁신센터(CAISI)는 딥시크 V4 프로 평가 보고서를 공개하고, 이 모델이 중국산 AI 가운데 가장 높은 성능을 보였지만 최신 미국 모델과는 격차가 있다고 판단했다.

핵심은 성능 위치다. CAISI는 공개 가중치 모델인 딥시크 V4 프로를 5개 분야, 9개 벤치마크로 평가한 뒤 "최신 AI에 비해 약 8개월 뒤처져 있다"고 밝혔다. 평가 결과상 딥시크 V4 프로는 2026년 4월 공개된 모델이지만, 성능은 오픈AI가 2025년 8월 내놓은 GPT-5와 비슷한 수준으로 집계됐다.

다만 중국 내 경쟁 모델과 비교하면 격차는 뚜렷했다. 딥시크 V4 프로는 기존 중국산 AI 최고 점수 모델로 언급된 '키미 K2.5'보다 약 200포인트 높은 점수를 기록했다. CAISI는 "5개 영역 종합 점수에서 200포인트 차이는 특정 작업을 해결할 확률이 3배가 되는 것을 뜻한다"고 설명했다.

이번 평가는 사이버, 소프트웨어 엔지니어링, 자연과학, 추상 추론, 수학 등 5개 분야를 대상으로 진행됐다. 세부적으로는 해킹 역량을 측정하는 CTF-아카이브-다이아몬드(CTF-Archive-Diamond), 코딩 능력을 보는 SWE-벤치 베리파이드(SWE-Bench Verified), 연구 수준 과학 추론을 보는 프론티어사이언스(FrontierScience), 추상 추론용 ARC-AGI-2 세미 프라이빗(ARC-AGI-2 semi-private), 수학 추론용 OTIS-AIME-2025 등 9개 테스트가 반영됐다.

성능 평가와 별개로 비용 경쟁력은 강점으로 제시됐다. CAISI는 딥시크 V4 프로가 '동등한 성능을 가진 다른 AI 모델보다 비용 효율이 우수하다'고 평가했다. 특히 미국 모델 가운데 비용 효율이 가장 높다고 제시된 오픈AI의 GPT-5.4 미니와 비교해도, 딥시크 V4 프로는 7개 벤치마크 중 5개에서 더 높은 비용 효율을 보였다. 전체 기준으로는 GPT-5.4 미니보다 41~53% 우수한 것으로 집계됐다.

가격 구조도 이런 평가의 배경으로 제시됐다. 개발자 보고 기준 딥시크 V4 프로의 입력 토큰 가격은 캐시 미적용 시 100만토큰당 1.74달러, 캐시 적용 시 0.0145달러였고, 출력 토큰 가격은 3.48달러였다. GPT-5.4 미니는 입력 토큰이 캐시 미적용 0.75달러, 캐시 적용 0.075달러, 출력 토큰이 4.5달러로 제시됐다.

이번 보고서는 딥시크의 자체 성능 주장과 외부 평가 간 차이도 드러냈다. 딥시크는 자사 공개 자료에서 딥시크 V4 프로가 클로드 오퍼스 4.6, GPT-5.4와 비슷한 수준이라고 제시했지만, CAISI의 실측 결과는 GPT-5급에 머물렀다. 같은 모델을 놓고도 자체 발표와 외부 평가 사이에 간극이 확인된 셈이다.

CAISI는 비용 효율 비교에서 일부 벤치마크가 빠진 이유도 공개했다. 포트벤치(PortBench)는 자사 비용 비교 방식이 아직 지원하지 못했고, ARC-AGI-2의 경우 GPT-5.4 미니 평가 과정에서 기술적 문제가 있었다고 설명했다. 이에 따라 이번 비용 비교는 9개 전체가 아니라 7개 벤치마크 기준으로 제시됐다.

딥시크는 2026년 4월 말 최신 모델군 '딥시크 V4'를 공개했다. 이 가운데 딥시크 V4 프로는 총 파라미터 1조6000억개 규모의 상위 모델이다. 이번 평가는 중국 AI가 성능 면에서 미국 선두권을 완전히 따라붙지는 못했지만, 공개 가중치와 비용 경쟁력을 앞세워 존재감을 키우고 있음을 보여준다. 동시에 외부 검증 기준에서는 최신 최상위 모델과의 격차가 아직 남아 있다는 점도 함께 확인됐다.
 

    본 서비스는 패스트뷰에서 제공합니다.