Забудьте о шаблонных подходах – теперь машины импровизируют.
Четвероногие роботы уже давно перестали быть чем-то из области фантастики. Они умеют ходить, бегать, прыгать и уверенно маневрировать на сложных поверхностях. Однако до недавнего времени им было трудно справляться с задачами, где нужно не только двигаться, но и взаимодействовать с другими объектами — например, использовать скейтборд. Учёные из Университета Мичигана и Южного научно-технологического университета Китая разработали метод , позволяющий роботам освоить подобные нестандартные способы передвижения.
Основу новой разработки составляет система обучения с подкреплением под названием DHAL — Discrete-time Hybrid Automata Learning. Эта система создаёт модель движения, которая учитывает как непрерывные, так и дискретные переходы между состояниями — именно так происходит при взаимодействии с реальными физическими объектами. К примеру, когда мяч прыгает, он движется плавно в воздухе, но резко меняет направление при столкновении с землёй. Точно так же робот, вставая на скейтборд, сталкивается с подобными переходами между режимами движения.
Обычно такие переходы трудно предсказать: количество возможных состояний растёт экспоненциально, что мешает использовать традиционные методы машинного обучения. DHAL справляется с этой задачей, автоматически определяя моменты перехода между режимами и обучаясь описывать каждое движение по отдельности. Это позволяет сократить ошибки и добиться более естественного поведения робота в сложных условиях ( видеодемонстрация ).
Авторы проекта отмечают, что существующие системы управления движением четвероногих роботов не были рассчитаны на плотное взаимодействие с внешними объектами, такими как скейтборд. Новый подход устраняет это ограничение. Он не требует предварительной настройки или ручного указания режимов — все этапы распознаются автоматически, на основе данных. В лабораторных испытаниях робот не только уверенно вставал на скейт, но и проезжал по площадке, одновременно буксируя за собой маленькую тележку.
Примечательно, что в процессе движения DHAL переключается между режимами, такими как подъём на скейт, толчок, скольжение и управление. Чтобы продемонстрировать, как система отслеживает эти переходы, исследователи использовали световую индикацию: при смене режима загораются разные цвета. На графиках видно, как изменяются положения суставов робота в зависимости от времени, а смена цвета фона отражает текущий режим.
Главное преимущество DHAL заключается в том, что она подходит не только для управления движением, но и для более точной оценки состояний гибридных динамических систем. Это позволяет системам планирования и управления принимать более обоснованные решения в реальном времени. Иными словами, робот лучше «понимает», в каком именно режиме он находится, и что ему делать дальше.
Разработчики уже заявили, что в будущем планируют применить DHAL в других областях — например, в управлении манипуляторами с несколькими «пальцами» или «руками», где также требуются точные оценки взаимодействий. Чем лучше система определяет момент контакта с объектами, тем точнее можно строить стратегии управления.
Новая методика открывает двери к созданию более гибких и универсальных роботов, которые смогут не просто двигаться по заданной траектории, но и взаимодействовать с окружающей средой на уровне, ранее доступном только живым существам. В перспективе — доставка посылок на скейте по офисам, фабрикам и городским кварталам.