Новый Mac Studio: мощь целого дата-центра в маленькой коробке

leer en español

Новый Mac Studio: мощь целого дата-центра в маленькой коробке

Nvidia, подвинься - Apple создала монстра для работы с нейросетями.

image

Apple представила новый Mac Studio с процессором M3 Ultra, способный самостоятельно запускать масштабные модели искусственного интеллекта с 600 миллиардами параметров, например Deep Seek R1 или Llama. Главное преимущество системы – беспрецедентный объем единой памяти в 512 гигабайт, к которой имеют одновременный доступ графический процессор, нейронный движок и центральное вычислительное ядро. Продажи начнутся 12 марта 2025 года.

При цене в 10 тысяч долларов новинка оказывается заметно доступнее существующих решений. Самый мощный современный графический ускоритель для работы с ИИ, Nvidia H100, обходится в 30 тысяч долларов, но располагает лишь 80 гигабайтами видеопамяти.

"Объем доступных ресурсов начинается с 96 гигабайт и может быть расширен до 512 гигабайт, то есть до половины терабайта", – заявляет Apple. "Такие показатели превосходят возможности передовых графических карт для рабочих станций, устраняя ограничения в профессиональных задачах – 3D-рендеринге, визуальных эффектах и проектах с искусственным интеллектом".

Хотя по вычислительной мощности компактный Mac Studio уступает многопроцессорным системам, для практического применения нейросетей (инференса) решающим фактором становится именно доступный объем памяти.

"Устройство изначально спроектирована как машина-монстр для работы с ИИ, позволяющая выгодно разместить всю модель в оперативке", – отмечает канадский технический обозреватель Линус Себастьян .

Энтузиасты давно используют компьютеры Apple для экспериментов с крупными нейросетями – это неплохая альтернатива дорогостоящим решениям Nvidia. Раньше приходилось объединять несколько устройств: запуск модели Llama с 405 миллиардами параметров требовал пяти Mac Studio предыдущего поколения, связанных медленными интерфейсами.

"Новая система M3 Ultra Max, которую вы можете заказать уже сегодня, впервые предоставляет такой внушительный объем ресурсов в одном корпусе", – подчеркивает автор YouTube-канала MaxTech .

Дев Наг, основатель платформы автоматизации поддержки клиентов QueryPal, уверен : "Возможность локально запускать модели с 600 миллиардами параметров создает конкурентную альтернативу на тех ценных рынках, где традиционно доминировала NVIDIA".

История противостояния компаний началась еще при Стиве Джобсе с конфликтов вокруг предполагаемого копирования технологий. В 2008 году разгорелся скандал "Bumpgate" из-за дефектных чипов NVIDIA в MacBook, за которым последовали споры о правах на мобильные графические технологии. В ответ Apple взяла курс на самостоятельность: сперва сотрудничала с AMD, затем задействовала мощности Google для обучения нейросетей и в итоге создала собственные процессоры.

"Эти рабочие процессы выигрывают от низкой задержки и высокой конфиденциальности, которые предлагает Apple. Цена в 10 тысяч долларов, хотя и высока для обычных потребителей, создает доступную точку входа для небольших студий и профессионалов уровня prosumer, которым иначе потребовались бы гораздо более дорогие кластеры GPU с сопоставимым объемом памяти", – поясняет Наг.

В задачах обучения нейросетей процессоры Nvidia сохраняют лидерство благодаря специализированным тензорным ядрам и высокой пропускной способности – 3 терабайта в секунду против 800 гигабайт у M3 Ultra. Однако архитектура Mac Studio с единым пулом ресурсов может оказаться эффективнее для реальных приложений, где критичен именно размер доступного хранилища.

Владимир Кубицкий из компании MacPaw считает происходящее поворотным моментом для автономной работы с нейросетями. Но при этом утверждает: "M3 Ultra пока не представляет прямой угрозы для Nvidia. Apple оптимизирует устройства для локального инференса ИИ, в то время как Nvidia доминирует в обучении ИИ масштаба дата-центров и облачном инференсе".

Работа с моделями на собственном оборудовании обеспечивает приватность и мгновенный отклик, позволяя интегрировать технологии в различные приложения без затрат на облачную инфраструктуру. По мнению Кубицкого, такие компьютеры справятся с задачами цифровых ассистентов, медицинских систем и профессиональных инструментов без обращения к внешним ресурсам.

Итак, постепенно ИИ перестает быть привилегией крупных дата-центров. На форуме Hacker News эксперты анализируют потенциал Mac Studio при работе с DeepSeek R1 в оптимизированном формате. "Версия Q4_K_M GGUF требует 404 ГБ. Эта архитектура с 671 миллиардом параметров задействует лишь 37 миллиардов активаций за проход, что позволяет рассчитывать на генерацию 20-30 токенов в секунду", – отмечает один из специалистов.

Более оптимистичные прогнозы, основанные на пропускной способности системы (819 ГБ/с при нагрузке в 37 ГБ на токен), предполагают производительность до 40-50 токенов в секунду. Точные показатели станут известны после старта продаж.

«Ваша цифровая безопасность — это пазл, и у нас есть недостающие детали
Подпишитесь, чтобы собрать полную картину