Архитектура MoE и китайские чипы помогают сэкономить 20% без потери качества.
Ant Group, поддерживаемая Джеком Ма — основателем Alibaba и финтех-предпринимателем, разработала методику обучения больших языковых моделей (LLM), позволяющую сократить расходы на 20% за счёт использования китайских чипов вместо дорогостоящих GPU от Nvidia. В основе лежит архитектура Mixture of Experts (MoE), которая делит задачи на блоки и распределяет их между специализированными подмоделями, повышая эффективность.
Вместо популярных ускорителей Nvidia H800, Ant применяла решения от Huawei, AMD, Alibaba и других местных производителей. Это позволило добиться сопоставимого качества при меньших затратах — обучение 1 трлн токенов теперь обходится в 5,1 млн юаней (около $710 тыс.) против прежних 6,35 млн.
На фоне ужесточения экспортного контроля со стороны США, китайские компании всё активнее ищут способы обойти ограничения. Ant публиковала научную работу, в которой утверждает, что их модели Ling-Plus и Ling-Lite превзошли решения Meta* (LLaMA) в английских и китайских тестах, а также обошли китайскую DeepSeek по ключевым метрикам.
Ling-Lite включает 16,8 млрд параметров, а Ling-Plus — 290 млрд. Обе модели открыты для сообщества. Это значительно меньше GPT-4.5 (1,8 трлн параметров), но уже достаточно для использования в промышленных задачах. В частности, Ant применяет их в здравоохранении, финансах и цифровых помощниках.
В 2024 году Ant приобрела платформу Haodf.com и представила ИИ-ассистента для врачей. Решение автоматизирует ведение записей и другие рутинные задачи для более чем 290 тыс. специалистов. Кроме того, внутри Alipay уже доступен AI Healthcare Manager, а также медицинские агенты Angel и Yibaoer, охватывающие более 1000 клиник и страховых служб.
Несмотря на успехи, команда столкнулась с проблемами стабильности — малейшие изменения в структуре модели или аппаратуре вызывали рост ошибок. Тем не менее, Ant продолжает оптимизировать обучение, полагаясь на китайскую аппаратную базу и собственные алгоритмы.
Эксперты считают, что подход Ant может стать поворотной точкой в развитии ИИ в Китае. Более дешёвое обучение делает искусственный интеллект доступным для компаний среднего уровня и снижает зависимость от зарубежных чипов. Это укрепляет позиции Китая в глобальной гонке за лидерство в AI.