AI, 희귀 언어까지 정복하나…제미나이, 키냐르완다어서 4.5점 이상 기록
||2026.04.18
||2026.04.18
[디지털투데이 AI리포터] 최신 대형언어모델(LLM)이 희귀 언어에서도 빠르게 성능을 끌어올리고 있다.
17일(현지시간) IT매체 테크레이더에 따르면 RWS의 트레인AI 다국어 LLM 합성 데이터 생성 연구에서 구글 제미니 프로는 키냐르완다어 평가에서 5점 만점에 4.5점을 넘는 점수를 기록했다. 키냐르완다어는 르완다, 우간다, 콩고민주공화국 등에서 약 1200만명이 사용하는 희귀 언어다.
이번 연구는 이전 세대 모델이 취약했던 희귀 언어에서도 최신 모델의 성능이 개선되고 있음을 보여줬다. 영어와 일부 주요 언어에 집중됐던 AI 개발이 점차 더 넓은 언어권으로 확장되고 있다는 의미다.
트레인AI의 바사기 코탄다파니 최고경영자는 이번 연구가 인간의 전문성을 대체하는 것이 아니라 적절한 기술로 이를 끌어올리는 전환점이라고 말했다. 다만 기업이 다국어 서비스에 투입할 모델을 고를 때 과거 성능만 기준으로 삼기는 어렵다. 연구진은 모델 버전이 바뀌며 성능이 예상과 다르게 달라지는 벤치마크 드리프트 현상을 확인했다.
기업은 공개 리더보드보다 고품질의 문화 맥락을 반영한 데이터를 바탕으로 성능을 계속 검증해야 한다. 합성 벤치마크에서 4.5점을 받았더라도 실제 환경에서 유창성이 보장되는 것은 아니라는 지적도 나왔다. 최근 일부 AI 연구소는 고품질 영어 데이터가 줄어들면서 다국어 데이터로 눈을 돌리고 있다.
고객님만을 위한 맞춤 차량
