DeepSeek ‒ только начало: Qwen 2.5 Max добивает монополию США на передовой ИИ

leer en español

15:49 / 30 января, 2025 11956

Компания Alibaba не отстает от конкурентов и союзников.

Китайская компания Alibaba представила новую языковую модель Qwen 2.5 Max, которая, по заявлениям разработчиков, превосходит ведущие американские ИИ-системы. На фоне недавнего успеха китайского стартапа DeepSeek это событие вызвало новую волну дискуссий о лидерстве США в области искусственного интеллекта.

По результатам тестирования в популярных системах оценки Arena-Hard, MMLU-Pro, GPQA-Diamond, LiveCodeBench и LiveBench, Qwen 2.5 Max показала более высокие результаты, чем GPT-4o от OpenAI, Claude 3.5 Sonnet от Anthropic и Llama 3.1 405B от Meta. Модель умеет работать с текстом, видео и изображениями, а также может осуществлять поиск в интернете.

Разработчики Alibaba подчеркивают, что сравнивали свою модель с DeepSeek V3, а не с нашумевшей R1. Это же объясняет выбор GPT-4o в качестве точки сравнения вместо флагманских моделей o1 от OpenAI. Тем не менее, достижения китайских компаний ставят под сомнение эффективность западных попыток сдержать развитие искусственного интеллекта в Китае.

Технические характеристики новой модели пока остаются в секрете. Известно лишь, что Qwen 2.5 Max построена на архитектуре MoE (mixture of experts) и обучена на массиве данных объемом 20 триллионов токенов. После базового обучения модель прошла через этапы supervised fine-tuning и RLHF (reinforcement learning from human feedback).

Архитектура MoE, которую также используют Mistral и DeepSeek, позволяет создавать специализированные "экспертные" модули для решения конкретных задач, например, программирования или математических вычислений. Главное преимущество такого подхода – возможность увеличивать общее количество параметров без снижения производительности, так как для каждого запроса активируются только релевантные части нейросети.

Точное количество параметров Qwen 2.5 Max не разглашается, хотя известно, что предыдущая версия Max содержала около 100 миллиардов параметров. Примечательно, что даже встроенный чат-бот модели не может ответить на вопрос о своих технических характеристиках.

В отличие от предыдущих версий Qwen, новая модель не будет распространяться в открытом доступе. На сайте Alibaba Cloud она отмечена как проприетарная, что объясняет скудность технической информации. Такой подход типичен для многих разработчиков – компания уже поступала аналогично с моделями Qwen Turbo и Qwen Plus.

Стоимость использования Qwen 2.5 Max через API составляет 10 долларов за миллион входных токенов и 30 долларов за миллион сгенерированных. Для сравнения, GPT-4o от OpenAI берет 2,50 доллара за миллион входных и 10 долларов за миллион выходных токенов. При этом флагманская модель o1 от OpenAI стоит дороже – 15 и 60 долларов соответственно.

Qwen 2.5 Max – лишь последнее пополнение в семействе моделей Alibaba, развитие которых началось в 2023 году. С сентября компания выпустила серию моделей Qwen 2.5 с открытым исходным кодом, имеющих от 0,5 до 72 миллиардов параметров. По заявлениям разработчиков, крупнейшие из них не уступают 405-миллиардной Llama от Meta.

Параллельно Alibaba развивает специализированные модели для математических вычислений и программирования, а в декабре представила "думающую" модель QwQ, похожую по функционалу на o1. На этой неделе компания также выпустила три открытые модели для работы с изображениями (VLM), которые, как утверждается, не уступают Gemini 2 от Google, GPT-4o и Claude 3.5 Sonnet. О Qwen2.5-VL, например, мы писали недавно.

Кроме того, Alibaba обновила свои модели Qwen 2.5 на 7 и 14 миллиардов параметров, увеличив их контекстное окно до миллиона токенов. Такое расширение особенно полезно для RAG-систем, позволяя обрабатывать большие объемы документации без потери контекста.

Однако успехи китайских разработчиков вызывают опасения относительно конфиденциальности данных и цензуры. Как и в случае с DeepSeek, пользовательские данные Qwen Chat хранятся на серверах в Китае или Сингапуре. Стив Хайдел, разработчик API OpenAI, иронично заметил в соцсети X: "Американцы так любят отдавать свои данные Компартии Китая в обмен на бесплатные сервисы".

Не менее серьезны опасения по поводу цензуры противоречивых тем, которые могут бросить тень на пекинский режим. Как и другие китайские модели, DeepSeek и Alibaba избегают обсуждения таких тем, как события на площади Тяньаньмэнь или политический статус Тайваня, либо прерывают генерацию ответов на подобные вопросы.

Антипов жжёт · из архива отвращения

Коровiй гной — въ кровь ребёнку

грав. · anno mdcccii

Так это видел мозгъ въ 1796-мъ: карикатуры рисовали привитых с коровьими мордами. Система отвращения не отличает коровью оспу от заражения крови — просто орёт «прочь». Рефлекс старше любого довода. С ним не спорят графиком.

В эфире — прогнозы Киберпогоды. Представим новую платформу прогнозирования атак 17 июня

DeepSeek ‒ только начало: Qwen 2.5 Max добивает монополию США на передовой ИИ

Подпишитесь на email рассылку