Следующая ступень эволюции генеративного ИИ после DALL-E.
Долгожданный релиз Sora от OpenAI , ИИ-инструмента для создания видео с помощью искусственного интеллекта, наконец состоялся. Система, которая работает по аналогии с генератором изображений DALL-E, позволяет создавать видеоролики высокого разрешения на основе текстовых запросов. Пользователи могут описать желаемую сцену, и Sora сгенерирует полноценное видео. Инструмент также позволяет создавать клипы на основе фотографий, продлевать уже существующие ролики или заполнять отсутствующие кадры.
Официальный запуск продукта запланирован на сегодня, однако доступ к нему получат не все страны. На YouTube-канале компании представители OpenAI сообщили, что первыми Sora смогут воспользоваться пользователи из США и большинства других стран, тогда как для Европы, Великобритании и ряда других регионов сроки запуска пока не определены.
Разработка потребовала много вычислительных ресурсов и гораздо более сложных нейронных сетей, чем те, что используются в DALL-E. Работа над моделью длилась более двух лет. Но оно того стоило. За это время инженеры постарались довести генерацию движений и обработку динамических сцен до идеала (хотя, конечно, в мире технологий предела совершенству нет).
Инструмент будет доступен в рамках существующих подписок ChatGPT - Plus и Pro. За дополнительные функции доплачивать не нужно. В прямом эфире генеральный директор OpenAI, Сэм Альтман, вместе с командой продемонстрировали основные возможности их детища, включая функцию «Blend», которая объединяет два видеофрагмента, а также возможность создания бесконечно повторяющихся видеороликов.
Sora также интегрируется с другими инструментами OpenAI - DALL-E и Codex. Пользователи могут комбинировать текст, изображения и видео в рамках одного проекта.
До сегодняшнего дня доступ был ограничен небольшим кругом тестировщиков, задача которых заключалась в проверке модели на устойчивость к дезинформации, предвзятости и другим потенциальным рискам. Особое внимание уделяется проблеме дипфейков, которые сейчас стали очень популярным инструментом для среди мошенников и провокаторов.
Интерес к Sora подогревает жесткая конкуренция: OpenAI борется за лидерство на рынке генеративного ИИ с такими гигантами, как Google, Meta*, Amazon и Anthropic. Ожидается, что рынок генеративного контента в ближайшие десять лет превысит триллион долларов. Например, Meta ранее представила свой видеогенератор Lumiere, а Amazon выпустила Create with Alexa — инструмент для создания анимационного контента по текстовым запросам.
При этом, как утверждают многие аналитики, Sora выгодно отличается от похожих решений благодаря гибкости настроек. Пользователи могут задавать стиль, атмосферу и тональность видео, варьируя их от гиперреализма до фантазийных концепций.
В дополнение к техническим достижениям, OpenAI усиливает маркетинговую активность. Недавно компания наняла первого в своей истории директора по маркетингу. В октябре они также добавили функцию поиска в ChatGPT, вероятно, чтобы конкурировать с поисковыми системами Google и Bing. Компания также начала сотрудничать с образовательными учреждениями, предлагая интеграцию своих инструментов в учебные программы.
Не обходится и без критики. Группа художников, участвовавших в программе раннего доступа, заявила, что OpenAI эксплуатирует их труд без должной компенсации. В открытом письме, подписанном 300 тестировщиками, отмечается: на совершенствование модели они потратили много сил и времени, а вознаграждение оказалось просто смешным. Согласно документу, истцы чувствуют себя инструментом для пиара, а не полноценными партнерами проекта.
Инцидент спровоцировал дискуссию среди профессионалов о том, как компании, разрабатывающие ИИ, могут наладить более честное и прозрачное сотрудничество с сообществами художников и дизайнеров. На критику OpenAI ничего конкретного не ответила, но пообещала, что продолжит поддерживать творческие сообщества через гранты, мероприятия и другие программы.
Sora представляет собой шаг к созданию мультиформатной платформы OpenAI, объединяющей текст, изображения и видео. Однако стремительное развитие технологий вызывает и новые риски, особенно в контексте политических выборов. По данным компании Clarity, количество дипфейков, созданных с помощью ИИ, увеличилось на 900% за последний год.
Ладно, не доказали. Но мы работаем над этим