Команда DeepMind научила ИИ мыслить творчески с помощью шахмат.
В 2020 году, когда мир охватила пандемия, Том Захави, ученый в области компьютерных наук, возродил свой интерес к шахматам. Вдохновленный книгой Гарри Каспарова и популярными шахматными шоу, он обратил внимание не столько на улучшение собственной игры, сколько на шахматные головоломки. Именно такие головоломки позволили Захави и его коллегам в Google DeepMind обнаружить скрытые ограничения шахматных программ.
Шахматы долгое время служили полигоном для испытаний в области искусственного интеллекта. Головоломка, созданная Сэром Роджером Пенроузом, выявила, что сильные шахматные программы не могут правильно оценить сложные позиции, в отличие от опытных шахматистов. Наблюдение стало для Захави отправной точкой для исследования творческих подходов к решению проблем с помощью ИИ.
В DeepMind Захави разработал метод, объединяющий до 10 различных систем ИИ, каждая из которых оптимизирована под разные стратегии игры. Такой подход позволил создать систему, которая справлялась с головоломками Пенроуза лучше, чем AlphaZero, программа DeepMind, которая достигла выдающихся результатов в шахматах. Успех был достигнут благодаря «самосотрудничеству» агентов: если один метод не приносил результатов, программа переключалась на другой.
Исследование Захави в DeepMind основывалось на принципах глубокого обучения с подкреплением, где системы ИИ учатся на основе опыта, получая награды за успешные действия. Программа AlphaZero была обучена игре в шахматы, сыграв 44 миллиона партий против самой себя, и быстро достигла уровня, позволяющего побеждать любого человека. Однако Захави заметил, что такой подход к обучению может привести к возникновению «слепых зон», когда система не способна решить задачу, с которой она не сталкивалась ранее.
Подход Захави предложил объединение множества систем ИИ, каждая из которых тренировалась в различных условиях, что позволило системе находить творческие решения сложных задач, аналогично человеческим мозговым штурмам. Испытания показали, что такая система может решить значительно больше головоломок, чем AlphaZero в одиночку.
Результаты работы указывают на возможность эффективного применения команд разнообразных систем ИИ для решения сложных задач не только в шахматах, но и в других областях, включая поиск новых лекарств и разработку стратегий для торговли на фондовом рынке. Захави предполагает, что для того, чтобы системы ИИ могли мыслить творчески, им просто нужно рассматривать больше вариантов решений. Исследование подчеркивает, что интеллект может быть лишь вопросом вычислительных возможностей и способности выбирать из большого количества оптимальных стратегий.
Наш канал — питательная среда для вашего интеллекта