허깅페이스, 로봇용 AI 모델 ‘SmolVLA’ 발표…맥북에서도 구동
||2025.06.05
||2025.06.05
[디지털투데이 AI리포터] 글로벌 인공지능(AI) 모델 공유 플랫폼 허깅페이스(Hugging Face)가 로보틱스를 위한 새로운 오픈소스 AI 모델 'SmolVLA'를 공개했다고 4일(현지시간) IT매체 테크크런치가 전했다.
허깅페이스는 블로그를 통해 커뮤니티가 공유한 데이터셋으로 훈련된 SmolVLA가 대규모 로봇 AI 모델보다 성능이 뛰어나며, 가상 및 실제 환경에서 모두 우수한 성능을 보인다고 주장했다.
허깅페이스는 SmolVLA는에 대해"비전-언어-행동(VLA) 모델의 접근성을 높이고, 범용 로봇 에이전트 연구를 가속화하는 것을 목표로 한다"라며 "이는 강력한 성능을 갖춘 경량 모델일 뿐만 아니라 범용 로봇 기술을 훈련하고 평가하는 방법론"이라고 설명했다.
SmolVLA는 450M 파라미터 규모로, 허깅페이스의 AI 개발 플랫폼에서 공유된 로보틱스 데이터셋을 활용해 훈련된 것으로 알려졌다. 허깅페이스는 이 모델이 소비자용 GPU나 맥북에서도 실행 가능하며, 자사의 로보틱스 시스템을 포함한 저렴한 하드웨어에서도 테스트 및 배포할 수 있다고 강조했다.
흥미로운 점은 SmolVLA가 '비동기 추론 스택'(asynchronous inference stack)을 지원한다는 것이다. 허깅페이스는 이 기능을 통해 로봇이 보는 것과 행동을 분리해 처리할 수 있으며, 변화하는 환경에서도 빠르게 대응할 수 있다고 설명했다.
SmolVLA는 허깅페이스에서 다운로드 가능하며, 이미 한 사용자는 엑스(구 트위터)를 통해 이 모델을 활용해 서드파티 로봇 팔을 제어했다고 주장했다.
SmolVLA — feels like a BERT moment for robotics
— Xingdong Zuo (@XingdongZ) June 4, 2025
I tried it on the Koch Arm:
Inference on RTX 2050 (4GB), fine-tuned with just 31 demos, and matches/outperforms single-task baselines
Big thanks to @RemiCadene @danaubakirova @mustash97 @francesco__capu pic.twitter.com/TiBkAZGwkM
고객님만을 위한 맞춤 차량