Новая модель искусственного интеллекта позволит специалистам перейти на новый уровень машинного обучения
Исследовательская лаборатория DeepMind выпустила систему искусственного интеллекта под названием Gato. ИИ является системой общего назначения и способна выполнять 604 задания, включая создание описания к изображениям, участие в диалоге, укладку блоков с помощью настоящей роборуки и игру в аркаду.
Gato училась на собственном примере, запоминая миллиарды слов и изображений из реальной и смоделированной среды, нажатия кнопок, и многое другое в виде токенов. Токены служили для представления данных в понятном для Gato виде и позволяли системе, например, определять механику игры Breakout или строить грамматически правильные предложения.
Однако, при общении с человеком система часто отвечает поверхностным или неверным ответом, а иногда Gato неправильно описывает фотографии. Кроме того, система правильно складывает блоки с помощью реального робота только в 60% случаев. У Gato также есть ограничение в объеме запоминаемой информации. ИИ не может написать длинное эссе или книгу, так как не запоминает ключевые детали и теряет линию сюжета. Такая проблема касается всех ИИ систем, поэтому некоторые эксперты назвали это «ахиллесовой пятой» машинного обучения. По утверждениям DeepMind, 450 из 604 задач что Gato выполняет лучше специалиста в более чем половине случаев.
«Мы все еще не достигли уровня человеческого интеллекта и, возможно, не скоро доберемся до него. Лично я больше склоняюсь к тому, что многие небольшие модели и системы полезней общих ИИ моделей, но у общих моделей есть преимущества в производительности при выполнении задач за пределами их обучающих данных», - сказал доцент кафедры вычислительной техники в Университете Альберты Мэтью Гуздиал.
Gato имеет общие характеристики с GPT-3 от OpenAI и ту же архитектуру « Transformer ». С 2017 года Transformer является предпочтительной архитектурой для сложных задач и демонстрирует способность обобщать документы, генерировать музыку, классифицировать объекты на изображениях и анализировать последовательности белков.
По количеству параметров Gato меньше однозадачных ИИ систем и GPT-3. Параметр представляет из себя часть системы, извлеченной из обучающих данных, и определяет навыки ИИ в решении задачи. У Gato 1,2 млрд. параметров, а у GPT-3 более 170 млрд. параметров. Маленький размер позволяет Gato управлять роботизированной рукой в режиме реального времени. Возможно, в случае расширения Gato сможет справиться с любой задачей, поведением и воплощением научных интересов.
Наш канал — питательная среда для вашего интеллекта