딥시크, 추론 능력 갖춘 ‘딥시크-R1-0528’ 새롭게 선봬
||2025.05.29
||2025.05.29
[디지털투데이 AI리포터] 중국 인공지능(AI) 기업 딥시크(DeepSeek)가 생성형 인공지능(AI) 모델 '딥시크-R1-0528'(DeepSeek-R1-0528)을 공개했다.
이번 모델은 기존 딥시크 R1을 마이너 업그레이드한 버전으로, 6850억개의 파라미터를 탑재해 더 강력한 추론 능력을 갖췄다. 특히 코드 생성 및 실행 능력이 향상됐으며, 특정 작업에서 최대 30~60분간 심층적인 추론이 가능하다고 밝혔다고 29일(현지시간) 온라인 매체 기가진이 알렸다.
딥시크는 새로운 모델이 구글 AI처럼 깊이 있는 추론을 수행하며, 빠르면서도 신중한 분석을 제공한다고 강조했다. 실제로 코드 생성 및 수정, 출력 예측 등의 벤치마크를 측정하는 라이브코드벤치(LiveCodeBench)에서 딥시크-R1-0528은 오픈AI의 o4-미니(mini)와 비슷한 성능을 기록하며 4위에 올랐다. 딥시크는 트랜스포머(Transformer) 아키텍처를 설명한 논문 '어텐션 이즈 올 유 니드'(Attention Is All You Need)를 모델에 입력해 요약하도록 하는 등 실험을 통해 모델의 추론 능력을 검증하고 있다.
딥시크-R1-0528은 MIT 라이선스를 통해 무료로 공개되며, 누구나 모델 데이터를 다운로드해 사용할 수 있다. AI 시장에서 오픈AI와 경쟁을 선언한 딥시크가 이번 모델을 통해 얼마나 영향력을 확대할지 주목된다.
고객님만을 위한 맞춤 차량