딥시크가 쏘아올린 오픈소스 논쟁…AI 경쟁 변수로
||2025.02.11
||2025.02.11
[디지털투데이 홍진주 기자] 중국 스타트업 딥시크가 자체 개발한 인공지능(AI) 모델 R1을 오픈소스로 공개한 가운데, 기술 업계에서 오랫동안 논의되어 온 오픈소스 소프트웨어의 잠재적 위험과 이점을 둘러싼 논쟁이 다시금 뜨거워지고 있다. 관련해 9일(현지시간) 블룸버그가 딥시크와 오픈소스 모델이 AI 산업에 미치는 영향을 짚었다.
딥시크는 지난 1월 20일 오픈소스 추론 모델 R1을 공개하면서 AI 업계에 큰 파장을 일으켰다. 이는 오픈AI의 최첨단 모델인 o1과 성능을 견줄 만큼 뛰어났지만, 상대적으로 저렴한 비용으로 훈련되었다는 점에서 적잖은 충격을 선사했다.
일반적으로 오픈소스는 소스 코드를 자유롭게 사용할 수 있는 소프트웨어를 뜻한다. 캘리포니아에 본사를 둔 비영리 단체 오픈소스이니셔티브(OSI)에 따르면, 소프트웨어가 오픈소스로 인정받기 위해서 특정 배포 및 접근 조건을 준수해야 한다. 이는 개발자가 해당 모델에 대한 훈련 데이터의 상세 정보를 제공하고, 어떤 목적으로든 시스템을 연구, 사용 및 수정할 수 있도록 해야 한다는 설명이다.
오픈소스 지지자들은 이를 통해 개발 비용을 절감하여 더 넓은 AI 채택을 가속화하고, AI 시스템을 만드는 개발자들에게 더 많은 책임감을 부여할 수 있을 것이라고 주장한다. 반면 오픈소스 모델이 국가 안보에 위협을 줄 수 있다는 우려도 함께 나온다.
그렇다면 주요 AI 개발자 중 오픈소스 소프트웨어를 제공하는 곳이 있을까?
많은 기술 기업들이 자사의 AI 소프트웨어를 오픈소스라고 홍보하지만, 실제로 모두가 이 기준에 부합하는 것은 아니다. 딥시크를 포함해 메타, 미스트랄 등은 모두 자사 AI 모델이 오픈소스라고 주장했지만, 실제로 해당 모델들은 오픈 웨이트(Open weights) 모델에 더 가까운 것으로 알려졌다. 이는 AI 모델의 성능을 좌우하는 가중치(변수 간 연결 강도) 값을 공개한 모델로, 훈련 데이터에 대한 세부 정보를 공개하지 않는 것을 뜻한다.
OSI는 지난해 메타의 AI 모델인 라마(Llama) 시리즈가 오픈소스 기준에 미치지 못한다고 발표한 바 있으며, 최근 딥시크의 R1 역시 오픈소스라고 부르기에 부족하다는 비판에 직면해 있다.
그럼에도 불구하고 딥시크가 오픈소스를 표방한 이유는 무엇일까.
블룸버그에 따르면 딥시크는 더 개방적인 접근 방식을 채택함으로써 중국의 기술 통제에 대한 전 세계 사용자들의 우려를 일부 완화하고, 서구 시장에서 자사 챗봇의 영향력을 확장했을 가능성이 높다.
한편 딥시크의 R1은 오픈AI 및 구글을 포함한 미국의 주요 개발자들의 최신 AI 모델과 마찬가지로 강화학습(반복적인 시행착오) 기법을 활용해 효율성을 높인 것으로 알려졌다. 미국에서는 일부 기술 및 정책 리더들이 이러한 발전을 인정하면서도, 중국 회사가 서구 기술을 기반으로 챗봇을 구축하여 막대한 대규모언어모델(LLM) 개발 비용을 피했는지에 대한 의문을 제기했다.
오픈AI는 "딥시크가 경쟁 소프트웨어를 구축하기 위해 우리 모델을 부적절하게 증류(한 회사의 AI 출력을 사용하여 다른 모델을 훈련)했을 가능성"을 검토 중이라고 밝혔다. 회사는 이것이 자사 사용 약관을 위반하는 행위라고 주장했다.
앞서 바이든 행정부는 지난해 오픈소스 AI 모델 규제가 시기상조라고 결론 내린 바 있지만, 딥시크 논란 이후 백악관 AI 차르 데이비드 색스는 미국 기업들의 AI 모델을 민간 개발자들의 증류로부터 보호하기 위한 노력을 제안하기도 했다.
고객님만을 위한 맞춤 차량