Разбираемся в аргументах сторон и последствиях для технологического мира.
Призывы «запретить открытый исходный код» появились прошлой осенью в ответ на решение Meta и других компаний открыть большие языковые модели (LLM). Лоббисты активно использовали эту фразу на политических митингах и в политических кругах. Однако многие критики не могли объяснить, что такое открытый исходный код, и не были знакомы с определением открытого исходного кода. Невежество в технических деталях не мешало им высказывать негативное мнение.
Этот спор касался не программного обеспечения с открытым исходным кодом, а открытия ИИ, где открытый исходный код использовался как общий термин для любого рода открытости в ИИ.
Хотя может быть трудно принять, что эта тема обсуждается в серьёзных кругах, статья в San Francisco Examiner подтверждает, что война против открытого исходного кода реальна и продолжается.
Examiner объясняет, что открытый исходный код давно имеет поддержку Силиконовой долины , говоря не о ИИ, а о программном обеспечении с открытым исходным кодом, которое является основой инноваций в бизнесе.
Шокирующим может показаться заявление венчурного капиталиста Винода Косла, который назвал открытый код «угрозой национальной безопасности». Examiner приводит контраргумент Марка Андриссена, который считает, что ограничение доступа к ИИ с открытым исходным кодом приведет к доминированию крупных компаний и подорвет академические исследования .
Смешение понятий открытого исходного кода и открытого исходного кода в ИИ - ключевая проблема.
Программное обеспечение с открытым исходным кодом делится исходным кодом и лицензируется в соответствии с определением OSD , существующим уже более 25 лет и поддерживаемым Open Source Initiative (OSI) . Однако понятие «открытый исходный код» применительно к ИИ не имеет четкого определения и используется некоторыми СМИ, лоббистами и законодателями как общий термин для любого рода открытости в ИИ.
Эта неправильная трактовка термина «открытый исходный код» привела к статьям в таких изданиях, как New York Times, объясняющим риски «open washing» в ИИ. «Open washing» - это термин, когда программное обеспечение, не соответствующее требованиям открытого исходного кода, ошибочно называется таковым, чтобы получить преимущества, такие как быстрое принятие и возможность стать стандартом де-факто, при этом не предоставляя всех преимуществ открытого исходного кода.
Открытое программное обеспечение, согласно определениям 5 и 6 Open Source Definition, предоставляет пользователям широкие возможности применения и распространения. Любой может использовать такое ПО для любых целей при условии сохранения его свободного распространения.
Однако важно понимать, что лицензии открытого ПО, как и любые другие, не стоят выше закона. Несмотря на принципы свободного распространения, открытое программное обеспечение подчиняется действующему законодательству, включая нормы экспортного контроля.
Таким образом, свобода использования открытого ПО не абсолютна и ограничивается рамками правового поля. Пользователям и разработчикам следует учитывать как лицензионные условия, так и требования применимого законодательства при работе с открытым программным обеспечением.
Законодатели несут ответственность за принятие решений в области этики и других вопросов, но лицензирование программного обеспечения с открытым исходным кодом не делает этого.
«Open washing» означает, что лицензия, применяемая к программному обеспечению, не соответствует OSD, что обычно включает ограничение свободного распространения. Лицензия не может быть одобрена, так как не соответствует OSD. Классически такие лицензии были коммерчески ограниченными, как, например, программное обеспечение, которое можно использовать для любых целей, кроме коммерческих.
Монетизация программного обеспечения с открытым исходным кодом является сложной задачей из-за его свободного распространения, что исключает возможность ограничения конкуренции. Открытый исходный код фактически означает, что вы делитесь своими инновациями с конкурентами. При «open washing» распространитель может сохранять определенный уровень контроля, ошибочно утверждая, что его программное обеспечение имеет открытый исходный код.
Термин «открытый исходный код» не был зарегистрирован как торговая марка, поэтому трудно контролировать его использование. Этот факт часто упускается из виду, но он значителен и служит уроком для всех.
Examiner описывает, что системы ИИ состоят из множества компонентов, которые обычно включают архитектуру модели, основной алгоритм, определяющий, что система делает с вводными данными и чему учится; веса модели, переменные, определяющие, как вводные данные превращаются в выводы, такие как иллюстрации или эссе; программный код, используемый для обучения модели или её запуска после обучения; и обучающие данные.
Иными словами, ИИ, в данном контексте Генеративный ИИ и LLM, состоит не только из программного обеспечения, будь то с открытым исходным кодом или иным. Компоненты ИИ могут быть разобщены, и каждый из них может быть открыт, закрыт или находиться между этими состояниями. Когда компонент открыт, эта открытость может быть полной — со свободным распространением и хорошими практиками, ассоциирующимися с программным обеспечением с открытым исходным кодом, — или ограниченной, или полностью закрытой.
Meta * называет свою модель Llama 2 «открытой инновацией», однако Марк Цукерберг утверждает, что она имеет открытый исходный код, что может быть примером «open washing».
В декабре прошлого года отчёт Stanford HAI указал, что системы ИИ варьируются по степени своей открытости, а в феврале Комитет по коммуникациям Палаты лордов Великобритании в своем отчете о расследовании LLM отметил, что использование термина «модель с открытым исходным кодом» остается спорным. Были также определены градации между полностью открытыми и полностью закрытыми моделями.
В июне Центр языковых исследований Университета Радбоуд в Неймегене, Нидерланды, определил 14 «измерений» как критерии для оценки градаций открытости.
Важность такого анализа и оценки двояка:
Во-первых, необходимо понимать компоненты и уровни открытости, чтобы определить риски и преимущества каждого открытого компонента.
Во-вторых, это вызывает обоснованные опасения по поводу преждевременности принятия первого в мире законодательства об ИИ — Акта об ИИ Европейского Союза . В нём используется термин «открытый исходный код», чтобы предложить специальный статус с освобождением от ответственности для ИИ, соответствующего критериям открытого исходного кода.
Такой подход к разложению и оценке компонентов ИИ важен для управления оценкой рисков, преимуществ и обязательств в области ИИ.
Модель открытости Linux Foundation стремится устранить неоднозначности и создать прозрачность, уточняя доступность компонентов ИИ, лицензирование и их пригодность для коммерческого использования. Сегодня это поддерживается инструментом оценки IsItOpen . Инструменты с открытым исходным кодом, такие как платформа оценки Inspect Института безопасности ИИ Великобритании, к которой присоединились несколько стран и 16 ключевых поставщиков ИИ, позволяют проводить оценку соответствия без регулирования.
Концепция «ИИ с открытым исходным кодом» находится в процессе совместной разработки с Open Source Initiative (OSI). Предполагается, что это определение охватит все компоненты ИИ-системы, включая данные. Такой подход может стать эталоном полностью открытого ИИ, представляя собой противоположность полностью закрытым системам.
Между этими крайними точками существует целый спектр промежуточных вариантов, образующих своеобразную скользящую шкалу открытости ИИ-систем. Это отражает разнообразие подходов к разработке и распространению технологий искусственного интеллекта.
Однако следует учитывать, что любое определение в сфере ИИ может быстро устареть из-за стремительного развития технологий. Подобно Акту об ИИ, определение «ИИ с открытым исходным кодом» может иметь ограниченный срок актуальности.
Несмотря на это, крайне важно, чтобы данное определение соответствовало принципам OSD. Это обеспечит согласованность с фундаментальными идеями открытого программного обеспечения и поможет сохранить целостность концепции открытого ИИ в быстро меняющемся технологическом ландшафте.
В последние годы регулирующие органы активно ищут способы распределения ответственности и оценки рисков в сфере информационных технологий. Особое внимание уделяется безопасности открытого программного обеспечения. Это беспокойство отражено в инициативах Белого дома США и Акте о киберустойчивости Европейского Союза, принятых за последние несколько лет.
Однако процесс создания, распространения и коммерциализации программного обеспечения с открытым исходным кодом имеет множество нюансов, которые зачастую остаются непонятными для законодателей и регуляторов. Эта сложность приводит к трудностям при попытках перевести принципы открытого ПО в плоскость нормативного регулирования.
Отсутствие глубокого понимания специфики открытого программного обеспечения может привести к принятию неэффективных или даже вредных регуляторных мер. Это создает риск ограничения инноваций и замедления развития технологий, основанных на принципах открытого исходного кода.
Открытый исходный код уже подвергается вызовам, и разговоры о «запрете открытого исходного кода» в ИИ вызывают обоснованные опасения.
Дискуссии вокруг искусственного интеллекта несут в себе значительные риски для будущего программного обеспечения с открытым исходным кодом. Недавний беспрецедентно быстрый рост популярности ИИ привел к массовому принятию открытого ПО, что, с одной стороны, свидетельствует о его признании, но с другой - создает проблемы из-за недостаточной компетентности многих новых пользователей в управлении такими системами.
Открытое программное обеспечение, безусловно, одержало важную победу в сфере разработки ПО. Однако остается открытым вопрос: станет ли эта победа долгосрочным достижением в борьбе за демократизацию технологий или окажется лишь временным успехом?
В свете этих вызовов защитникам открытого исходного кода необходимо занять активную позицию. Их задача - отстаивать принципы открытого ПО в контексте развития искусственного интеллекта, предотвращая возможные негативные последствия этого влияния. Это включает в себя работу над сохранением открытости, прозрачности и доступности технологий в эпоху ИИ.
Критически важно найти баланс между инновациями в области ИИ и сохранением фундаментальных ценностей движения за открытое программное обеспечение. Это потребует тесного сотрудничества между разработчиками, пользователями, регуляторами и экспертами в области ИИ для выработки стратегий, которые обеспечат развитие технологий ИИ без ущерба для принципов открытого исходного кода.
* Компания Meta и её продукты признаны экстремистскими, их деятельность запрещена на территории РФ.
Разбираем кейсы, делимся опытом, учимся на чужих ошибках