Тень LibGen: как Meta оправдывает работу с пиратским контентом

leer en español

10:45 / 16 января, 2025

Новый поворот в деле о зазищенных данных.

Марк Цукерберг упомянул опыт YouTube в борьбе с пиратским контентом, чтобы обосновать использование компанией Meta* набора данных, включающего защищённые авторским правом электронные книги. Это стало известно из фрагментов показаний Цукерберга в рамках дела Kadrey v. Meta о нарушении авторских прав в области ИИ.

Данное дело является частью серии исков, где правообладатели оспаривают использование своих материалов для обучения ИИ. Meta, как и другие компании, утверждает, что действие корпорации подпадает под «добросовестное использование», однако многие авторы с этим не согласны.

По словам Цукерберга, база данных LibGen, использованная для обучения моделей Llama, была объектом обсуждения внутри компании. Ранее сотрудники Meta называли её «пиратской базой данных» и предупреждали о возможных проблемах с регуляторами. Однако из показаний Цукерберга следует, что он «не был знаком» с LibGen и не принимал решения об использовании базы.

В ходе слушаний Цукерберг подчеркнул, что политика полного запрета на использование пиратских данных не всегда целесообразна, сравнив ситуацию с YouTube, где контент проверяется на соответствие правам лишь после публикации. Цукерберг привёл пример YouTube, который может временно размещать пиратский контент, но активно работает над его удалением. По словам Цукерберга, большая часть контента на платформе соответствует лицензионным требованиям.

Цукерберг подчеркнул, что YouTube создаёт баланс между доступностью платформы и соблюдением авторских прав, что можно считать оправданным подходом. Цукерберг отметил, что полный запрет на использование платформ или данных, содержащих защищённые материалы, может быть неразумным, если эти ресурсы принимают меры по устранению нарушений. Такой подход был использован для защиты действий Meta в контексте использования данных из LibGen.

Сравнение с YouTube, согласно опубликованным фрагментам, служило для иллюстрации того, как компании могут работать с авторским контентом, минимизируя риски. Однако истцы считают, что Meta не просто использовала пиратские данные, а делала это осознанно и систематически, чем и отличается от YouTube. В частности, адвокаты заявляют, что сотрудники Meta знали о нелегальном происхождении материалов из LibGen, но продолжали их использовать для обучения моделей искусственного интеллекта.

В новой версии жалобы указано, что компания использовала LibGen для обучения моделей Llama 3 и, возможно, Llama 4. Кроме того, в жалобе говорится, что исследователи Meta якобы использовали дополнительные данные для маскировки использования защищённых материалов. Также утверждается, что Meta загружала материалы из другой пиратской библиотеки — Z-Library — ещё в апреле 2024 года.

Z-Library, как и LibGen, стала объектом множества судебных исков, а её создатели обвиняются в отмывании денег и нарушении авторских прав. LibGen в настоящее время находится под угрозой закрытия из-за иска о нарушении авторских прав от крупных издательств, которые требуют взыскания $30 миллионов.

Юристы Meta пока не прокомментировали новые обвинения.

* Компания Meta и её продукты признаны экстремистскими, их деятельность запрещена на территории РФ.

Хватит тратить время на ручные проверки и «накликивание»!

12 февраля на бесплатном вебинаре Security Vision покажем, как SGRC-подход создаёт «живую» безопасность. Меняем формальный контроль на стратегию вместе.

Регистрируйтесь!

Реклама. 18+ ООО «Интеллектуальная безопасность», ИНН 7719435412

Это только демо-версия будущего...

Тень LibGen: как Meta оправдывает работу с пиратским контентом

Хватит тратить время на ручные проверки и «накликивание»!

Подпишитесь на email рассылку