Модель Llama от Meta уже не удовлетворяет стандартам открытого ИИ.
Инициатива по открытому исходному коду (OSI) представила официальное определение «открытого» искусственного интеллекта, которое может стать причиной конфликта с такими технологическими гигантами, как Meta*, чьи модели не соответствуют новым требованиям.
OSI долгое время устанавливала стандарты в сфере программного обеспечения с открытым исходным кодом, однако системы искусственного интеллекта включают элементы, которые не покрываются обычными лицензиями, такие как данные для обучения модели. Согласно новому определению, искусственный интеллект можно считать открытым, если он предоставляет доступ к следующим компонентам:
Информация о данных, использованных для обучения модели, что позволяет другим понять и воспроизвести её;
Полный исходный код, необходимый для разработки и запуска системы;
Настройки и веса обучения, определяющие результаты работы модели.
Новое определение напрямую ставит под сомнение статус модели Llama от Meta*, которая рекламируется как крупнейшая модель с открытым исходным кодом. Llama доступна для скачивания и использования, однако её коммерческое использование ограничено (для приложений с аудиторией более 700 миллионов пользователей), а также отсутствует доступ к данным для обучения. Это не соответствует стандартам OSI по обеспечению полной свободы использования, модификации и распространения.
Представитель Meta* Фэйт Эйшен в комментарии изданию The Verge отметила , что компания во многом согласна с партнёрами из OSI, но не поддерживает предложенное определение. По её словам, единого определения открытого искусственного интеллекта не существует, и эта задача сложна, так как прежние определения не охватывают все аспекты современных моделей ИИ, быстро развивающихся и усложняющихся.
Эйшен добавила, что Meta* продолжит работать с OSI и другими участниками отрасли, чтобы сделать ИИ более доступным и безопасным, независимо от конкретных технических определений.
В течение 25 лет определение программного обеспечения с открытым исходным кодом, предложенное OSI, пользовалось широкой поддержкой среди разработчиков. Теперь, в условиях трансформации, вызванной искусственным интеллектом, перед технологическими гигантами встал выбор: поддерживать эти принципы или отвергнуть их. Фонд Linux также недавно сделал попытку сформулировать определение «открытого ИИ», что указывает на растущие споры о том, как традиционные ценности открытого кода будут адаптироваться к новой реальности.
Независимый исследователь и создатель Datasette Саймон Уиллиссон выразил надежду, что новое определение поможет более эффективно противостоять компаниям, заявляющим о своей «открытости», но на практике не соответствующим этому. По мнению генерального директора Hugging Face Клемана Деланга, инициатива OSI поможет сформировать разговор вокруг открытости в ИИ, особенно в контексте важной роли данных для обучения.
Исполнительный директор OSI Стефано Маффулли рассказал, что на разработку нового определения ушло два года, в процессе участвовали эксперты со всего мира. Среди них были специалисты в области машинного обучения и обработки естественного языка, философы, а также авторы из сообщества Creative Commons.
Несмотря на утверждения Meta* о безопасности при ограничении доступа к данным для обучения, критики видят в этом скорее стремление минимизировать юридическую ответственность и сохранить конкурентные преимущества. Большинство моделей ИИ почти наверняка обучены на защищённом авторскими правами материале, и в апреле The New York Times сообщила, что Meta* признаёт наличие таких данных в своих наборах для обучения, поскольку компания не может избежать их использования.
Маффулли отмечает, что история с открытым исходным кодом повторяется. По его словам, Meta* использует те же аргументы, что и Microsoft в 1990-х, когда та воспринимала открытый код как угрозу своему бизнесу. Тогда Meta* заявляла о высоких затратах на разработку Llama и спрашивала: «Кто, по-вашему, сможет сделать то же самое?» Маффулли считает, что это лишь попытка оправдать сохранение технологий за закрытыми дверями, используя высокую стоимость и сложность как аргумент.
* Компания Meta и её продукты признаны экстремистскими, их деятельность запрещена на территории РФ.
Разбираем кейсы, делимся опытом, учимся на чужих ошибках