Роботы на скейтбордах: как новый ИИ-алгоритм учит их сложным трюкам

Роботы на скейтбордах: как новый ИИ-алгоритм учит их сложным трюкам

Забудьте о шаблонных подходах – теперь машины импровизируют.

image

Четвероногие роботы уже давно перестали быть чем-то из области фантастики. Они умеют ходить, бегать, прыгать и уверенно маневрировать на сложных поверхностях. Однако до недавнего времени им было трудно справляться с задачами, где нужно не только двигаться, но и взаимодействовать с другими объектами — например, использовать скейтборд. Учёные из Университета Мичигана и Южного научно-технологического университета Китая разработали метод , позволяющий роботам освоить подобные нестандартные способы передвижения.

Основу новой разработки составляет система обучения с подкреплением под названием DHAL — Discrete-time Hybrid Automata Learning. Эта система создаёт модель движения, которая учитывает как непрерывные, так и дискретные переходы между состояниями — именно так происходит при взаимодействии с реальными физическими объектами. К примеру, когда мяч прыгает, он движется плавно в воздухе, но резко меняет направление при столкновении с землёй. Точно так же робот, вставая на скейтборд, сталкивается с подобными переходами между режимами движения.

Обычно такие переходы трудно предсказать: количество возможных состояний растёт экспоненциально, что мешает использовать традиционные методы машинного обучения. DHAL справляется с этой задачей, автоматически определяя моменты перехода между режимами и обучаясь описывать каждое движение по отдельности. Это позволяет сократить ошибки и добиться более естественного поведения робота в сложных условиях ( видеодемонстрация ).

Авторы проекта отмечают, что существующие системы управления движением четвероногих роботов не были рассчитаны на плотное взаимодействие с внешними объектами, такими как скейтборд. Новый подход устраняет это ограничение. Он не требует предварительной настройки или ручного указания режимов — все этапы распознаются автоматически, на основе данных. В лабораторных испытаниях робот не только уверенно вставал на скейт, но и проезжал по площадке, одновременно буксируя за собой маленькую тележку.

Примечательно, что в процессе движения DHAL переключается между режимами, такими как подъём на скейт, толчок, скольжение и управление. Чтобы продемонстрировать, как система отслеживает эти переходы, исследователи использовали световую индикацию: при смене режима загораются разные цвета. На графиках видно, как изменяются положения суставов робота в зависимости от времени, а смена цвета фона отражает текущий режим.

Главное преимущество DHAL заключается в том, что она подходит не только для управления движением, но и для более точной оценки состояний гибридных динамических систем. Это позволяет системам планирования и управления принимать более обоснованные решения в реальном времени. Иными словами, робот лучше «понимает», в каком именно режиме он находится, и что ему делать дальше.

Разработчики уже заявили, что в будущем планируют применить DHAL в других областях — например, в управлении манипуляторами с несколькими «пальцами» или «руками», где также требуются точные оценки взаимодействий. Чем лучше система определяет момент контакта с объектами, тем точнее можно строить стратегии управления.

Новая методика открывает двери к созданию более гибких и универсальных роботов, которые смогут не просто двигаться по заданной траектории, но и взаимодействовать с окружающей средой на уровне, ранее доступном только живым существам. В перспективе — доставка посылок на скейте по офисам, фабрикам и городским кварталам.

Взломают завтра? как математика предсказывает кибератаки

31 марта в 14:00 — SuperHardio Brothers* раскрывают, как превратить математическое моделирование времени атак в конкурентное преимущество вашей компании.

Реклама. АО «Позитив Текнолоджиз», ИНН 7718668887 *герои-эксперты харденинга