Flex создан для тех, кому важен бюджет, а не молниеносные ответы.
OpenAI представила новый режим работы своего API под названием Flex processing — он позволяет вдвое сократить расходы на использование ИИ, но с одной оговоркой: придётся мириться с более медленными откликами и возможной недоступностью ресурсов. Эта опция ориентирована на второстепенные задачи, такие как тестирование моделей, обогащение данных и асинхронные вычисления — то есть на то, где скорость не критична.
Flex уже доступен в бета-режиме для новых моделей o3 и o4-mini и предлагает серьёзную экономию: цена использования o3 снижается с $10 до $5 за миллион входных токенов и с $40 до $20 за миллион выходных. Для o4-mini тариф падает с $1.10 до $0.55 за вход и с $4.40 до $2.20 за выход. Иными словами, вдвое дешевле, если вы готовы ждать и рисковать кратковременной недоступностью.
Это решение появилось на фоне роста цен на передовые ИИ-системы и усиливающейся конкуренции. В тот же день Google представила свою модель Gemini 2.5 Flash — по заявлению компании, она способна конкурировать с DeepSeek R1 и при этом дешевле обходится по стоимости токенов.
Параллельно с запуском Flex OpenAI усиливает контроль над пользователями: теперь разработчики, находящиеся в первых трёх уровнях тарифной иерархии (по объёму потраченных средств), должны пройти верификацию личности, чтобы получить доступ к модели o3. Кроме того, функции вроде потоковой генерации и кратких резюме выводов теперь тоже завязаны на прохождение проверки.
Ранее OpenAI объясняла, что ID-проверка нужна, чтобы ограничить доступ к ИИ-моделям для недобросовестных пользователей и пресечь нарушения политик компании.