Google DeepMind представляет ИИ с возможностью социального обучения.
Учёные из Google DeepMind создали искусственный интеллект, который способен осваивать новые навыки, просто наблюдая за действиями человека. Обычно для обучения алгоритмов имитации человеческих действий требуются сотни или тысячи примеров, но этот ИИ способен усваивать новые умения на лету.
Человеческая способность быстро и эффективно усваивать знания друг у друга является одним из важнейших аспектов социального обучения, также известного как культурная передача. Исследователи давно пытаются воспроизвести этот процесс в машинах, используя подход, при котором ИИ наблюдает за выполнением задачи человеком и затем пытается имитировать его поведение.
Исследователи из DeepMind сделали шаг вперёд, обучив агентов ИИ навигации в виртуальном мире в реальном времени, основываясь на действиях человека. "Наши агенты успешно имитируют человека в реальном времени в новых контекстах без использования предварительно собранных человеческих данных", - говорится в исследовании, опубликованном в Nature Communications .
Для тренировки агентов был создан специальный симулятор GoalCycle3D, который генерирует почти бесконечное количество различных сред на основе правил функционирования и изменчивости симуляции. В каждой среде агенты ИИ, похожие на маленькие капли, должны преодолевать неровную местность и различные препятствия, чтобы пройти через серию цветных сфер в определённом порядке.
Агенты обучаются навигации с помощью подкрепления. Они получают награду за прохождение через сферы в правильном порядке и используют этот сигнал для улучшения своих результатов. Однако в средах также присутствует экспертный агент, который уже знает правильный маршрут.
В ходе множества тренировок ИИ не только осваивает основы работы сред, но и понимает, что самый быстрый способ решения задачи - имитация эксперта. Чтобы убедиться, что агенты действительно учатся имитации, а не просто запоминают маршруты, команда обучала их в одной среде, а затем тестировала в другой.
Однако перевести подход в более практические области может быть сложно. Ограничением является то, что во время всех тренировочных заездов экспертный агент контролировался одним человеком, что затрудняет понимание, могут ли агенты учиться у разных людей. Кроме того, способность случайно изменять обучающую среду сложно воспроизвести в реальном мире.
Тем не менее, прогресс в социальном обучении ИИ является важным шагом. Если мы хотим жить в мире с интеллектуальными машинами, эффективные и интуитивно понятные способы передачи нашего опыта и знаний им будут крайне важны.
От классики до авангарда — наука во всех жанрах