전 세계 AI 모델 120만 개… 한국은 0.1%에 불과
||2024.12.18
||2024.12.18
인공지능(AI) 시대가 본격화되면서 수많은 AI 모델이 쏟아져 나오고 있다. 글로벌 AI 기업인 오픈AI, 앤트로픽, 구글, 메타, 아마존을 중심으로 AI 모델들이 개발되고 있지만 이제는 각국에서도 자국의 AI 모델 개발에 집중하는 양상이다.
특히 중국은 알리바바, 바이두, 텐센트 등 주요 기업들의 AI 개발 속도가 빠르게 진행되고 있다. 한국 역시 네이버와 LG AI연구원 등을 중심으로 AI 모델 개발과 상용화에 속도를 내고 있다.
그렇다면 실제 한국에서 개발한 AI 모델은 어느 정도 수준일까. 글로벌 AI 개발자 커뮤니티이자 오픈소스 AI 모델 공유 플랫폼인 허깅페이스(Hugging Face)에서 한국어 기반 또는 한국에서 개발한 AI 모델의 현황을 살펴봤다.
허깅페이스에 등록된 한국 AI 모델 1046개
허깅페이스에서 ‘korea’ 또는 ‘kr’로 검색한 결과, 17일 기준으로 한국 AI 모델은 총 1046개로 확인됐다. 전체 AI 모델 수가 약 120만 개에 이르는 점을 감안하면 한국 모델은 전체의 0.1% 미만에 불과하다.
업스테이지와 NIA(한국지능정보사회진흥원)에서 제공하는 리더보드에는 약 670개의 한국 AI 모델이 등록되어 있지만, 실제 활발히 활용된다고 판단할 수 있는 모델은 100여 개에 못 미치는 것으로 나타났다. 허깅페이스의 다운로드 수와 활용도를 종합해 순위를 매긴 결과다.
등록된 AI 모델은 크게 자체 개발 LLM(대규모 언어 모델)과 오픈소스 LLM 기반 모델로 나눌 수 있지만, 90% 이상이 오픈소스를 활용한 모델인 것으로 분석됐다.
국내 주요 AI 모델
한국인공지능진흥협회의 ‘한국 리더보드’를 기준으로 살펴보면, LG AI연구원이 개발한 엑사원(EXAONE)이 선두에 있다. 공개된 모델은 엑사원-3.5의 2.4B, 32B, 7.8B 등이다. 엑사원 3.5는 LG AI연구원이 지난 10일 공개한 최신 모델로 답변 성능과 인프라 비용을 최적화 한 모델이다. 특히 온디바이스용 초경량 모델 ‘2.4B’의 경우 다운로드 수 5800회를 기록하며 허깅페이스 전체 순위에서 64위를 차지했다.
LG 관계자는 “허깅페이스를 통해 이전 모델에서 피드백을 많이 받았고 이를 반영해 장문 처리 능력, 단계별 추론 등 성능을 한층 개선했다. 특히 2.4B 모델은 초경량이면서 기존 7B, 10B 규모의 오픈소스 모델들과 비교해 더 높은 성능을 낸다”고 설명했다.
업스테이지의 솔라(Solar) 시리즈도 주목받고 있다. 솔라 10.7B 모델은 다운로드 수 6만8000건을 기록하며 가장 활발히 활용되는 모델 중 하나다. 여기에 ‘솔라 프로 프리뷰’, ‘타이니솔라’, ‘솔라1-미니’ 등 다양한 모델도 공개됐다.
야놀자는 자체 단어 확장 방식을 적용한 이브(EEVE) 모델을 선보였다. 허깅페이스에 등록된 ‘EEVE-Korean-Instruct-10.8B’ 모델은 현재까지 다운로드 수 2만6000건을 기록하며 꾸준한 활성도를 보이고 있다.
이 외에도 이스트소프트의 ai-human-lab/EEVE-Korean_Instruct-10.8B-expo, 모레의 moreh/Llama-3-Motif-102B-Instruct, 엔씨소프트의 NCSOFT/VARCO-VISION-14B 등이 한국 AI 모델로 등록돼 있다.
한국인공지능진흥협회 김태봉 사무총장은 “허깅페이스는 전세계 AI 개발자 700만명이 모여있는 가장 큰 플랫폼으로, AI가 어떤 기업에서 어떻게 발전하고 있는지를 파악할 수 있다. 한국에서 만든 모델들이 증가하고 있지만 주요 국가들에 비해서는 아직 미미한 수준”이라고 말했다.
조상록 기자 jsrok@chosunbiz.com