Новый ИИ Gato может выполнять 604 задачи

Новый ИИ Gato может выполнять 604 задачи

Новая модель искусственного интеллекта позволит специалистам перейти на новый уровень машинного обучения

Исследовательская лаборатория DeepMind выпустила систему искусственного интеллекта под названием Gato. ИИ является системой общего назначения и способна выполнять 604 задания, включая создание описания к изображениям, участие в диалоге, укладку блоков с помощью настоящей роборуки и игру в аркаду.

Gato училась на собственном примере, запоминая миллиарды слов и изображений из реальной и смоделированной среды, нажатия кнопок, и многое другое в виде токенов. Токены служили для представления данных в понятном для Gato виде и позволяли системе, например, определять механику игры Breakout или строить грамматически правильные предложения.


Однако, при общении с человеком система часто отвечает поверхностным или неверным ответом, а иногда Gato неправильно описывает фотографии. Кроме того, система правильно складывает блоки с помощью реального робота только в 60% случаев. У Gato также есть ограничение в объеме запоминаемой информации. ИИ не может написать длинное эссе или книгу, так как не запоминает ключевые детали и теряет линию сюжета. Такая проблема касается всех ИИ систем, поэтому некоторые эксперты назвали это «ахиллесовой пятой» машинного обучения. По утверждениям DeepMind, 450 из 604 задач что Gato выполняет лучше специалиста в более чем половине случаев.


«Мы все еще не достигли уровня человеческого интеллекта и, возможно, не скоро доберемся до него. Лично я больше склоняюсь к тому, что многие небольшие модели и системы полезней общих ИИ моделей, но у общих моделей есть преимущества в производительности при выполнении задач за пределами их обучающих данных», - сказал доцент кафедры вычислительной техники в Университете Альберты Мэтью Гуздиал.

Gato имеет общие характеристики с GPT-3 от OpenAI и ту же архитектуру « Transformer ». С 2017 года Transformer является предпочтительной архитектурой для сложных задач и демонстрирует способность обобщать документы, генерировать музыку, классифицировать объекты на изображениях и анализировать последовательности белков.

По количеству параметров Gato меньше однозадачных ИИ систем и GPT-3. Параметр представляет из себя часть системы, извлеченной из обучающих данных, и определяет навыки ИИ в решении задачи. У Gato 1,2 млрд. параметров, а у GPT-3 более 170 млрд. параметров. Маленький размер позволяет Gato управлять роботизированной рукой в режиме реального времени. Возможно, в случае расширения Gato сможет справиться с любой задачей, поведением и воплощением научных интересов.

Мы нашли признаки жизни...в вашем смартфоне!

Наш канал — питательная среда для вашего интеллекта

Эволюционируйте вместе с нами — подпишитесь!