Персонажи взаимодействуют между собой и имеют собственную память.
Виртуальный игровой мир
Согласно статье , исследователи разработали программную архитектуру, которая «хранит, синтезирует и применяет соответствующие воспоминания для создания правдоподобного поведения с использованием большой языковой модели».
Другими словами, специалисты добавили память, отражение (вывод из воспоминаний) и код планирования (planning code) в ChatGPT для создания 25 генеративных агентов — смоделированных личностей, которые взаимодействуют и преследуют свои собственные цели, используя текстовое общение на естественном языке.
Агенты самостоятельно планируют свои дни, делятся новостями, налаживают отношения между собой и координируют групповые действия. Пользователи могут смотреть или взаимодействовать с персонажами в демонстрационном мире , работающем на экземпляре Heroku, который был создан с помощью фреймворка для онлайн-игр Phaser.
Демонстрация, посвященная агенту по имени Изабель и ее попытке спланировать вечеринку в честь Дня святого Валентина, позволяет посетителям изучить данные о состоянии смоделированных личностей. То есть пользователь может нажать на персонажа и увидеть его текстовые воспоминания и другую информацию о нём .
Агенты воспринимают свое окружение, и все восприятия сохраняются в комплексной записи опыта агента, называемой потоком памяти. Поток памяти — это просто список наблюдений с метками времени о текущем статусе агента.
Основываясь на восприятии агентов, архитектура извлекает соответствующие воспоминания, а затем использует их для определения действия. Извлеченные воспоминания также используются для формирования долгосрочных планов и создания отражений более высокого уровня, которые вводятся в поток памяти для будущего использования
Иллюстрация потока памяти
Например, в виртуальном городе Смоллвиль на вечеринку пришли 5 из 12 гостей. 3 гостя не пришли из-за конфликтов в расписании. А остальные 4 проявили интерес, но не явились. Такое поведение максимально приближено к реальной жизни. Исследователи говорят, что их архитектура генеративного поведения создала наиболее правдоподобное поведение.
Учёные также признали, что проект имеет некоторые недостатки. Например, персонажи не всегда понимали, что не могут войти в магазин после закрытия в 17:00 по местному времени. Такие проблемы, по словам ученых, можно решить с помощью более подробных описаний, например, с добавив нормативные часы работы к описаниям магазинов.
Эксперты отмечают, что генеративные агенты могут быть уязвимы для взлома памяти — когда тщательно продуманный разговор может убедить агента в существовании прошлого события, которого никогда не было. Исследователям предстоит проделать дополнительную работу для устранения предвзятости агентов, неадекватных данных модели и безопасности.
Гравитация научных фактов сильнее, чем вы думаете