ИИ научился учиться — и теперь ему не нужен человек. Он начал с Minecraft

ИИ научился учиться — и теперь ему не нужен человек. Он начал с Minecraft

ИИ ворвался в Minecraft как нуб, но уже через неделю копал туннели как гений.

image

ИИ-алгоритм Dreamer, разработанный исследователями Google DeepMind совместно с учёным из Университета Торонто, научился самостоятельно улучшать свои навыки, осваивая Minecraft за считаные дни. Как сообщается в свежем выпуске журнала Nature, Dreamer достиг уровня эксперта всего за девять дней без предварительной подготовки — ему не объясняли, как играть, а просто задали рамки возможных действий и ввели систему поощрений за поиск алмазов.

Несмотря на то что обучение ИИ на играх может показаться пустой тратой ресурсов — ведь это просто «компьютер играет с компьютером» — на деле такие эксперименты позволяют понять, как заставить ИИ адаптироваться, учиться и достигать целей в меняющихся условиях. А это уже серьёзный шаг в сторону роботов, которые смогут справляться с задачами в реальном мире без постоянного надзора и вмешательства.

В ходе эксперимента Dreamer помещался в игровую среду Minecraft, где каждый игровой сеанс длился всего 30 минут. После этого игра перезапускалась в совершенно новом виртуальном мире — с другими ландшафтами, ресурсами и условиями. Несмотря на такие ограничения, алгоритм быстро учился: он представлял себе будущее, в котором уже достиг всех целей, и концентрировался только на действиях, ведущих к этому результату. Эти навыки сохранялись и использовались в следующем виртуальном мире, помогая Dreamer стремительно улучшать свои способности.

Суть в том, что Dreamer учится не копируя чью-то стратегию, а экспериментируя и осмысленно прокладывая путь к успеху. Это открывает важные перспективы: если ИИ способен в таких условиях самостоятельно достигать сложных целей, значит, он потенциально может научиться решать реальные задачи в физическом мире — от навигации до ремонта или обслуживания. И, возможно, совсем скоро роботы действительно смогут обучать сами себя, не дожидаясь инструкций от человека.

Реальные атаки. Эффективные решения. Практический опыт.

Standoff Defend (защищать) — это онлайн-полигон, где ты сможешь испытать себя. Попробуй себя в расследовании инцидентов и поборись за победу в конкурсе

Реклама. АО «Позитив Текнолоджиз», ИНН 7718668887