Уникальная архитектура и рекордная эффективность токенов.
Компания DeepSeek продолжает удивлять мировой рынок искусственного интеллекта. После громкого успеха модели R1, которая доказала, что Китай ничем не уступает Западу в разработке высококлассных ИИ-систем, появились первые слухи о следующем поколении — DeepSeek R2. Если информация подтвердится, мировые AI-гиганты могут снова оказаться застигнутыми врасплох.
Первую модель DeepSeek восприняли как настоящий прорыв: она настолько впечатлила рынки, что после её выхода американские технологические акции потеряли миллиарды долларов в стоимости. Более того, DeepSeek продемонстрировала, что создание мощных моделей искусственного интеллекта не обязательно требует тех гигантских затрат, о которых ранее говорили компании вроде OpenAI. Теперь китайские СМИ сообщают, что готовится новая версия — и обещают ещё более масштабные перемены.
По слухам, DeepSeek R2 будет использовать усовершенствованную архитектуру гибридной модели экспертов (MoE), в которой, вероятно, будут применены более продвинутые механизмы распределения задач или сочетание экспертов с плотными слоями для оптимизации работы с высокими нагрузками. Новая модель должна получить удвоенное количество параметров по сравнению с R1 — около 1,2 триллиона. Такие характеристики могут поставить её в один ряд с GPT-4 Turbo и Gemini 2.0 Pro от Google.
Но, возможно, самым важным станет даже не это. Источники утверждают, что стоимость обработки токенов у R2 будет ниже на 97,4% по сравнению с GPT-4: всего $0,07 за миллион входных токенов и $0,27 за миллион выходных. Это делает DeepSeek R2 потенциально самой выгодной моделью для бизнеса на рынке — особенно в условиях растущих расходов на ИИ-решения.
Кроме того, сообщается, что DeepSeek R2 достигла 82% загрузки кластера на базе чипов Ascend 910B от Huawei, обеспечивая вычислительную мощность на уровне 512 петафлопс при работе с точностью FP16. Это говорит о том, что компания сделала ставку на внутренние ресурсы и практически построила замкнутую цепочку разработки ИИ внутри страны.
Пока что вся эта информация основана на утечках и неподтверждённых данных, поэтому к ней стоит относиться с осторожностью. Однако если слухи оправдаются, DeepSeek R2 действительно может стать новой вехой — не только для китайского ИИ, но и для всей мировой индустрии.