SmolVLA даёт старт open-source роботам: запускай с дивана, управляй в реале

450 млн параметров и ни одного GPU в обмороке.


y4l10lzxey1cigewskfxl3cw231mf8kl.jpg


Создавать проекты в сфере робототехники теперь стало проще. Платформа Hugging Face представила открытую модель SmolVLA — компактный ИИ, способный управлять роботами как в симуляции, так и в реальных условиях. По словам разработчиков, SmolVLA превосходит более крупные модели при работе в физическом и виртуальном мире.

Модель обучена на совместимых с открытой лицензией наборах данных, опубликованных сообществом в рамках инициативы LeRobot . Объём модели составляет 450 миллионов параметров — этого достаточно для выполнения задач на недорогом оборудовании, включая обычный ноутбук.

Hugging Face подчёркивает, что SmolVLA — это не только сама модель, но и методика её обучения и оценки, ориентированная на создание универсальных роботов. В блоге компании говорится, что модель создана для расширения доступа к системам типа vision-language-action (VLA) и ускорения исследований в этой области.

Одной из особенностей SmolVLA стала поддержка асинхронной архитектуры: модель обрабатывает сенсорную информацию и действия отдельно, что позволяет роботам быстрее реагировать на изменения среды. Такой подход к манипулированию объектами становится особенно важным для создания адаптивных роботизированных систем.

SmolVLA входит в линейку инициатив Hugging Face, направленных на развитие открытых решений для робототехники. Ранее компания запустила проект LeRobot с набором моделей, датасетов и инструментов, которые можно использовать для обучения и тестирования.

По заявлениям разработчиков, модель уже используется вне лабораторий: один из пользователей соцсети X подключил SmolVLA к стороннему роботизированному манипулятору и опубликовал видео с демонстрацией .

Интерес к доступной робототехнике активно растёт. Помимо Hugging Face, подобными разработками занимаются Nvidia и стартап K-Scale Labs, создающий компоненты для «open-source гуманоидов». Также в сегменте работают Dyna Robotics, поддерживаемая Джеффом Безосом Physical Intelligence и компания RLWRLD, недавно привлёкшая 14,4 млн долларов инвестиций. Google DeepMind также активно развивает направление воплощённого ИИ для роботов.

На фоне роста интереса к практическому применению ИИ в робототехнике, компактная SmolVLA может стать удобным инструментом для разработчиков, которым важно запускать модели на повседневных устройствах. Особенно это актуально в контексте исследований, показывающих, что современные ИИ-системы способны к самообучению и адаптации без постоянного человеческого участия.