中 AI 모델 ‘딥시크 V3’ 공개…메타 라마 능가
||2024.12.27
||2024.12.27
[디지털투데이 AI리포터] 중국 인공지능(AI) 회사 딥시크(DeepSeek)가 AI 모델 '딥시크 V3'(DeepSeek V3)을 공개했다.
26일(현지시간) IT매체 테크크런치에 따르면 딥시크 V3은 허가 라이선스로 출시됐다. 개발자는 라이선스를 다운로드해 상업용을 포함한 대부분의 애플리케이션에 맞게 수정할 수 있다.
딥시크 V3은 프롬프트(지시어)에 따른 코딩, 번역, 에세이, 이메일 작성 등 다양한 텍스트 기반 워크로드와 작업을 처리할 수 있다.
딥시크의 내부 벤치마크 테스트 결과, 딥시크 V3은 다운로드 가능한 개방형 모델이나 API를 통해서만 액세스할 수 있는 폐쇄형 모델보다 더 우수한 성능을 보였다. 또한 프로그래밍 경연 대회 플랫폼인 코드포스(Codeforces)에서 딥시크 V3은 메타의 라마 3.1 405B, 오픈AI의 GPT-4o, 알리바바의 큐웬 2.5 72B 등의 모델도 능가했다.
딥시크 V3은 모델이 기존 코드에 통합되는 새 코드를 성공적으로 작성할 수 있는지를 측정하는 테스트인 에이더 폴지글롯(Aider Polgyglot)에서도 경쟁사를 압도했다.
딥시크는 딥시크 V3가 14조8000억개의 토큰으로 구성된 데이터 세트에서 학습됐다고 주장했다. 학습 세트만 방대한 것이 아니다. 딥시크 V3은 6850억개의 매개변수로 이루어진 엄청난 크기다. 이는 4050억개의 파라미터를 가진 라마 3.1 405B의 약 1.6배에 달하는 크기다.
단점은 모델의 정치적 견해가 약간 필터링 된다는 것이다. 예를 들어 천안문 광장에 대해 질문하면 딥시크 V3은 대답하지 않는다.
고객님만을 위한 맞춤 차량