Представь: ты пришёл поиграть в бадминтон, а там сюрприз — робо-собака с ракеткой
NewsMakerВчера падал на ровном месте, сегодня — отбивает смэш: как ИИ учится в прыжке.
Исследователи из Швейцарского федерального технологического института (ETH Zurich) разработали четырёхногого робота , способного автономно играть в бадминтон против человека. Его активность контролируется с помощью алгоритма обучения с подкреплением , который позволяет отслеживать траекторию волана, предсказывать его полёт и оперативно занимать нужную позицию на площадке для отражения удара.
В качестве базы учёные использовали платформу ANYmal-D, оснащённую стереокамерой и рукой с ракеткой.
Разработчики подчёркивают, что их система может пригодиться далеко не только на спортивной арене. Она особенно полезна в ситуациях, где нужно быстро принимать решения — например, в спасательных операциях или на производстве . Бадминтон в этом смысле — отличная проверка на прочность: чтобы не упустить волан, роботу приходится одновременно следить за ним, двигаться по площадке и точно бить по цели. Всё это требует мгновенной реакции и слаженной работы сенсоров и «мышц».
До сих пор подобные задачи оставались трудновыполнимыми: системы зрения не успевали фиксировать быстрые цели, и движения получались чересчур заторможенными.
Инженеры ETH Zurich создали универсальный контроллер, который объединяет зрение и движение в единую модель. Он обучался в виртуальной среде, где учитывались все искажения, возникающие при резких поворотах камеры и изменении ракурса. Такой способ помог сократить разницу между симуляцией и реальным поведением робота.
В основе лежит асимметричная архитектура типа actor-critic: робот проходит серию обучающих эпизодов, где отрабатывает удары по мишеням с разными параметрами. Это позволяет добиться плавного и адаптивного поведения, где сочетается предсказание траектории волана, реакция на особенности окружения и учёт физики самого тела.
Один из ключевых элементов системы — совместное обучение движений рук и ног. Управление конечностями не разделено: робот сам находит , как сбалансировать работу разных частей тела, чтобы сохранять устойчивость и точно отбивать удары.
В ходе испытаний ANYmal-D уверенно двигался по площадке, справлялся с воланами, летящими со скоростью до 12 м/с, и выдерживал до десяти обменов подряд. В некоторых случаях он вставал на задние лапы, чтобы не терять цель из виду — это помогало точно попадать по волану и сохранять равновесие.
Однако при особенно резких атаках — например, смэшах — технология пока теряет эффективность. В перспективе авторы планируют сократить задержку между действиями соперника и реакцией робота, которая сейчас составляет в среднем 375 миллисекунд. Очевидно, это возможно за счёт более современных камер и дополнительных сенсоров, которые сделают игру более динамичной и позволят удерживать мяч в розыгрыше дольше.

Исследователи из Швейцарского федерального технологического института (ETH Zurich) разработали четырёхногого робота , способного автономно играть в бадминтон против человека. Его активность контролируется с помощью алгоритма обучения с подкреплением , который позволяет отслеживать траекторию волана, предсказывать его полёт и оперативно занимать нужную позицию на площадке для отражения удара.
В качестве базы учёные использовали платформу ANYmal-D, оснащённую стереокамерой и рукой с ракеткой.

Разработчики подчёркивают, что их система может пригодиться далеко не только на спортивной арене. Она особенно полезна в ситуациях, где нужно быстро принимать решения — например, в спасательных операциях или на производстве . Бадминтон в этом смысле — отличная проверка на прочность: чтобы не упустить волан, роботу приходится одновременно следить за ним, двигаться по площадке и точно бить по цели. Всё это требует мгновенной реакции и слаженной работы сенсоров и «мышц».
До сих пор подобные задачи оставались трудновыполнимыми: системы зрения не успевали фиксировать быстрые цели, и движения получались чересчур заторможенными.
Инженеры ETH Zurich создали универсальный контроллер, который объединяет зрение и движение в единую модель. Он обучался в виртуальной среде, где учитывались все искажения, возникающие при резких поворотах камеры и изменении ракурса. Такой способ помог сократить разницу между симуляцией и реальным поведением робота.
В основе лежит асимметричная архитектура типа actor-critic: робот проходит серию обучающих эпизодов, где отрабатывает удары по мишеням с разными параметрами. Это позволяет добиться плавного и адаптивного поведения, где сочетается предсказание траектории волана, реакция на особенности окружения и учёт физики самого тела.
Один из ключевых элементов системы — совместное обучение движений рук и ног. Управление конечностями не разделено: робот сам находит , как сбалансировать работу разных частей тела, чтобы сохранять устойчивость и точно отбивать удары.
В ходе испытаний ANYmal-D уверенно двигался по площадке, справлялся с воланами, летящими со скоростью до 12 м/с, и выдерживал до десяти обменов подряд. В некоторых случаях он вставал на задние лапы, чтобы не терять цель из виду — это помогало точно попадать по волану и сохранять равновесие.
Однако при особенно резких атаках — например, смэшах — технология пока теряет эффективность. В перспективе авторы планируют сократить задержку между действиями соперника и реакцией робота, которая сейчас составляет в среднем 375 миллисекунд. Очевидно, это возможно за счёт более современных камер и дополнительных сенсоров, которые сделают игру более динамичной и позволят удерживать мяч в розыгрыше дольше.