Представь: ты пришёл поиграть в бадминтон, а там сюрприз — робо-собака с ракеткой

Вчера падал на ровном месте, сегодня — отбивает смэш: как ИИ учится в прыжке.

Исследователи из Швейцарского федерального технологического института (ETH Zurich) разработали четырёхногого робота , способного автономно играть в бадминтон против человека. Его активность контролируется с помощью алгоритма обучения с подкреплением , который позволяет отслеживать траекторию волана, предсказывать его полёт и оперативно занимать нужную позицию на площадке для отражения удара.

В качестве базы учёные использовали платформу ANYmal-D, оснащённую стереокамерой и рукой с ракеткой.

Разработчики подчёркивают, что их система может пригодиться далеко не только на спортивной арене. Она особенно полезна в ситуациях, где нужно быстро принимать решения — например, в спасательных операциях или на производстве . Бадминтон в этом смысле — отличная проверка на прочность: чтобы не упустить волан, роботу приходится одновременно следить за ним, двигаться по площадке и точно бить по цели. Всё это требует мгновенной реакции и слаженной работы сенсоров и «мышц».

До сих пор подобные задачи оставались трудновыполнимыми: системы зрения не успевали фиксировать быстрые цели, и движения получались чересчур заторможенными.

Инженеры ETH Zurich создали универсальный контроллер, который объединяет зрение и движение в единую модель. Он обучался в виртуальной среде, где учитывались все искажения, возникающие при резких поворотах камеры и изменении ракурса. Такой способ помог сократить разницу между симуляцией и реальным поведением робота.

В основе лежит асимметричная архитектура типа actor-critic: робот проходит серию обучающих эпизодов, где отрабатывает удары по мишеням с разными параметрами. Это позволяет добиться плавного и адаптивного поведения, где сочетается предсказание траектории волана, реакция на особенности окружения и учёт физики самого тела.

Один из ключевых элементов системы — совместное обучение движений рук и ног. Управление конечностями не разделено: робот сам находит , как сбалансировать работу разных частей тела, чтобы сохранять устойчивость и точно отбивать удары.

В ходе испытаний ANYmal-D уверенно двигался по площадке, справлялся с воланами, летящими со скоростью до 12 м/с, и выдерживал до десяти обменов подряд. В некоторых случаях он вставал на задние лапы, чтобы не терять цель из виду — это помогало точно попадать по волану и сохранять равновесие.

Однако при особенно резких атаках — например, смэшах — технология пока теряет эффективность. В перспективе авторы планируют сократить задержку между действиями соперника и реакцией робота, которая сейчас составляет в среднем 375 миллисекунд. Очевидно, это возможно за счёт более современных камер и дополнительных сенсоров, которые сделают игру более динамичной и позволят удерживать мяч в розыгрыше дольше.