Открытые API-токены предоставили полный доступ к ИИ-моделям Meta, Google и Microsoft

11:16 / 5 декабря, 2023

Утечка данных на Hugging Face раскрыла исходный код крупнейших проектов.

Компания Lasso Security выявила недостатки на платформе Hugging Face, специализирующейся на данных для искусственного интеллекта и машинного обучения. Более 1500 API-токенов (API-токен), некоторые из которых принадлежат Meta*, Google и Microsoft, были обнаружены в открытом доступе. Токены предоставляют доступ к аккаунтам 723 организаций.

Наибольшую опасность представляли токены с правами на запись (655 токенов), которые могли позволить злоумышленникам модифицировать файлы в репозиториях. Из общего числа уязвимых организаций, особенно подвержены риску 77 компаний, включая Meta, EleutherAI и BigScience Workshop, которые реализуют модель LLaMA, математическую программу Pythia и модель Bloom соответственно.

Открытие API-токены наиболее «ценных» организаций

После оповещения, все затронутые компании оперативно устранили уязвимости, хотя Meta и BigScience Workshop не предоставили официальных комментариев. Hugging Face является ключевой платформой для сообщества ИИ, храня более 250 000 наборов данных и 500 000 моделей ИИ, и потенциальные последствия утечек могли оказаться разрушительными. Исследователи подчеркивают, что злоумышленники могли бы использовать токены для кражи данных, отравления обучающих данных или даже полного хищения моделей, что затронуло бы более миллиона пользователей.

Пример отображения токена в коде

Команда Lasso Security, проводившая исследование, смогла получить доступ для модификации 14 различных наборов данных, каждый из которых имеет десятки тысяч скачиваний в месяц. Подобные атаки с отравлением данных являются одной из самых серьёзных угроз для области ИИ и машинного обучения, и входят в десятку крупнейших рисков для LLM по версии OWASP.

Кроме того, исследователи также обнаружили уязвимости, позволяющие украсть более 10 000 частных моделей, что подчёркивает значимость проблемы в контексте общей безопасности ИИ. Специалисты получили полный доступ к Meta Llama 2, BigScience Workshop и EleutherAI, что открывает двери для потенциальной эксплуатации этих ресурсов злоумышленниками.

В ходе расследования выяснилось, что утечка API-токенов произошла из-за хранения токенов в переменных, которые не были скрыты при публикации кода в общедоступных репозиториях. Затронутые организации были уведомлены об уязвимостях. Meta, Google, Microsoft и VMware оперативно отреагировали, отозвав токены и удалив код из своих репозиториев.

* Компания Meta и её продукты признаны экстремистскими, их деятельность запрещена на территории РФ.

Наука безумнее, чем фантастика

Открытые API-токены предоставили полный доступ к ИИ-моделям Meta, Google и Microsoft

Эксплойт без патча? Узнай первым

Подпишитесь на email рассылку