От текста до фильма за секунду: магию Sora теперь могут опробовать все (почти)

leer en español

От текста до фильма за секунду: магию Sora теперь могут опробовать все (почти)

Следующая ступень эволюции генеративного ИИ после DALL-E.

image

Долгожданный релиз Sora от OpenAI , ИИ-инструмента для создания видео с помощью искусственного интеллекта, наконец состоялся. Система, которая работает по аналогии с генератором изображений DALL-E, позволяет создавать видеоролики высокого разрешения на основе текстовых запросов. Пользователи могут описать желаемую сцену, и Sora сгенерирует полноценное видео. Инструмент также позволяет создавать клипы на основе фотографий, продлевать уже существующие ролики или заполнять отсутствующие кадры.

Официальный запуск продукта запланирован на сегодня, однако доступ к нему получат не все страны. На YouTube-канале компании представители OpenAI сообщили, что первыми Sora смогут воспользоваться пользователи из США и большинства других стран, тогда как для Европы, Великобритании и ряда других регионов сроки запуска пока не определены.

Разработка потребовала много вычислительных ресурсов и гораздо более сложных нейронных сетей, чем те, что используются в DALL-E. Работа над моделью длилась более двух лет. Но оно того стоило. За это время инженеры постарались довести генерацию движений и обработку динамических сцен до идеала (хотя, конечно, в мире технологий предела совершенству нет).

Инструмент будет доступен в рамках существующих подписок ChatGPT - Plus и Pro. За дополнительные функции доплачивать не нужно. В прямом эфире генеральный директор OpenAI, Сэм Альтман, вместе с командой продемонстрировали основные возможности их детища, включая функцию «Blend», которая объединяет два видеофрагмента, а также возможность создания бесконечно повторяющихся видеороликов.

Sora также интегрируется с другими инструментами OpenAI - DALL-E и Codex. Пользователи могут комбинировать текст, изображения и видео в рамках одного проекта.

До сегодняшнего дня доступ был ограничен небольшим кругом тестировщиков, задача которых заключалась в проверке модели на устойчивость к дезинформации, предвзятости и другим потенциальным рискам. Особое внимание уделяется проблеме дипфейков, которые сейчас стали очень популярным инструментом для среди мошенников и провокаторов.

Интерес к Sora подогревает жесткая конкуренция: OpenAI борется за лидерство на рынке генеративного ИИ с такими гигантами, как Google, Meta*, Amazon и Anthropic. Ожидается, что рынок генеративного контента в ближайшие десять лет превысит триллион долларов. Например, Meta ранее представила свой видеогенератор Lumiere, а Amazon выпустила Create with Alexa — инструмент для создания анимационного контента по текстовым запросам.

При этом, как утверждают многие аналитики, Sora выгодно отличается от похожих решений благодаря гибкости настроек. Пользователи могут задавать стиль, атмосферу и тональность видео, варьируя их от гиперреализма до фантазийных концепций.

В дополнение к техническим достижениям, OpenAI усиливает маркетинговую активность. Недавно компания наняла первого в своей истории директора по маркетингу. В октябре они также добавили функцию поиска в ChatGPT, вероятно, чтобы конкурировать с поисковыми системами Google и Bing. Компания также начала сотрудничать с образовательными учреждениями, предлагая интеграцию своих инструментов в учебные программы.

Не обходится и без критики. Группа художников, участвовавших в программе раннего доступа, заявила, что OpenAI эксплуатирует их труд без должной компенсации. В открытом письме, подписанном 300 тестировщиками, отмечается: на совершенствование модели они потратили много сил и времени, а вознаграждение оказалось просто смешным. Согласно документу, истцы чувствуют себя инструментом для пиара, а не полноценными партнерами проекта.

Инцидент спровоцировал дискуссию среди профессионалов о том, как компании, разрабатывающие ИИ, могут наладить более честное и прозрачное сотрудничество с сообществами художников и дизайнеров. На критику OpenAI ничего конкретного не ответила, но пообещала, что продолжит поддерживать творческие сообщества через гранты, мероприятия и другие программы.

Sora представляет собой шаг к созданию мультиформатной платформы OpenAI, объединяющей текст, изображения и видео. Однако стремительное развитие технологий вызывает и новые риски, особенно в контексте политических выборов. По данным компании Clarity, количество дипфейков, созданных с помощью ИИ, увеличилось на 900% за последний год.

Ученые доказали: чтение нашего канала продлевает жизнь!

Ладно, не доказали. Но мы работаем над этим

Поучаствуйте в эксперименте — подпишитесь