Сделано в Китае: Ant Group обучает мощные ИИ без западных GPU

Сделано в Китае: Ant Group обучает мощные ИИ без западных GPU

Архитектура MoE и китайские чипы помогают сэкономить 20% без потери качества.

image

Ant Group, поддерживаемая Джеком Ма — основателем Alibaba и финтех-предпринимателем, разработала методику обучения больших языковых моделей (LLM), позволяющую сократить расходы на 20% за счёт использования китайских чипов вместо дорогостоящих GPU от Nvidia. В основе лежит архитектура Mixture of Experts (MoE), которая делит задачи на блоки и распределяет их между специализированными подмоделями, повышая эффективность.

Вместо популярных ускорителей Nvidia H800, Ant применяла решения от Huawei, AMD, Alibaba и других местных производителей. Это позволило добиться сопоставимого качества при меньших затратах — обучение 1 трлн токенов теперь обходится в 5,1 млн юаней (около $710 тыс.) против прежних 6,35 млн.

На фоне ужесточения экспортного контроля со стороны США, китайские компании всё активнее ищут способы обойти ограничения. Ant публиковала научную работу, в которой утверждает, что их модели Ling-Plus и Ling-Lite превзошли решения Meta* (LLaMA) в английских и китайских тестах, а также обошли китайскую DeepSeek по ключевым метрикам.

Ling-Lite включает 16,8 млрд параметров, а Ling-Plus — 290 млрд. Обе модели открыты для сообщества. Это значительно меньше GPT-4.5 (1,8 трлн параметров), но уже достаточно для использования в промышленных задачах. В частности, Ant применяет их в здравоохранении, финансах и цифровых помощниках.

В 2024 году Ant приобрела платформу Haodf.com и представила ИИ-ассистента для врачей. Решение автоматизирует ведение записей и другие рутинные задачи для более чем 290 тыс. специалистов. Кроме того, внутри Alipay уже доступен AI Healthcare Manager, а также медицинские агенты Angel и Yibaoer, охватывающие более 1000 клиник и страховых служб.

Несмотря на успехи, команда столкнулась с проблемами стабильности — малейшие изменения в структуре модели или аппаратуре вызывали рост ошибок. Тем не менее, Ant продолжает оптимизировать обучение, полагаясь на китайскую аппаратную базу и собственные алгоритмы.

Эксперты считают, что подход Ant может стать поворотной точкой в развитии ИИ в Китае. Более дешёвое обучение делает искусственный интеллект доступным для компаний среднего уровня и снижает зависимость от зарубежных чипов. Это укрепляет позиции Китая в глобальной гонке за лидерство в AI.

Взломают завтра? как математика предсказывает кибератаки

31 марта в 14:00 — SuperHardio Brothers* раскрывают, как превратить математическое моделирование времени атак в конкурентное преимущество вашей компании.

Реклама. АО «Позитив Текнолоджиз», ИНН 7718668887 *герои-эксперты харденинга