Как древние письмена помогли разоблачить недобросовестных студентов.
Группа исследователей из Стэнфордского университета оказалась в центре громкого скандала после выпуска новой мощной модели искусственного интеллекта Llama 3-V. Модель привлекла внимание всего мира благодаря своей высокой производительности. Запуская Llama 3-V, ее создатели — студенты-компьютерщики Акш Гарг и Сиддхарт Шарма, а также исследователь Мустафа Альджадери, утверждали, что она может соперничать с такими передовыми продуктами, как GPT4-V, Gemini Ultra и Claude Opus. При этом стоимость ее обучения гораздо ниже — менее 500 долларов.
Вскоре после релиза у представителей ИИ-сообщества появились подозрения о том, что новая разработка была попросту скопирована с другого открытого проекта — MiniCPM-Llama3-V 2.5, созданного совместными усилиями лаборатории обработки естественного языка Университета Цинхуа и пекинского стартапа ModelBest. Данные расследования, опубликованные информаторами на GitHub, указывали на практически идентичную структуру и исходный код Llama 3-V и MiniCPM-Llama3-V 2.5.
Гарг и Шарма признали сходство архитектур и принесли извинения создателям исходной модели. «Наша архитектура очень похожа, и мы хотим искренне извиниться перед оригинальными авторами», — заявили они, сообщив также, что исходная версия Llama 3-V уже удалена.
Лю Чжиюань, сооснователь ModelBest, выразил почти стопроцентную уверенность в плагиате их работы при создании Llama 3-V. Он отметил, что MiniCPM-Llama3-V2.5 обладает уникальной способностью распознавать древние бамбуковые письмена периода Воюющих царств около 475-221 гг. до н.э. В 2008 году Университет Цинхуа приобрел 2500 таких реликтовых бамбуковых планок и вручную оцифровал содержащиеся на них иероглифы для создания обучающего набора данных. Эти данные не являются общедоступными, однако модель Llama 3-V неплохо справлялась с распознаванием текста, повторяя даже ошибки оригинальной разметки.
При этом Лю подчеркнул, что быстрое развитие ИИ невозможно без глобального открытого обмена алгоритмами, данными и опытом. Их собственная MiniCPM-Llama3-V 2.5 использовала в качестве базы последнюю открытую модель Llama 3 от Meta. Однако ключевыми принципами открытого кода являются соблюдение протоколов, взаимное доверие между участниками и уважение к работе первопроходцев с признанием их заслуг — именно это, по мнению Лю, не учла команда из Стэнфорда.
Гарг и Шарма полностью взяли на себя ответственность за халатность и невыполнение должной проверки оригинальности работы, поскольку весь код для Llama 3-V писал третий участник — Альджадери.
Инцидент вызвал широкий резонанс и бурные дискуссии. В Китае он стал одной из самых обсуждаемых тем в соцсетях. Ряд экспертов отметили, что столь продвинутая технология как MiniCPM-Llama3-V 2.5 осталась практически незамеченной лишь потому, что была создана в китайской лаборатории, а не в престижном американском вузе.
Тем не менее, специалисты признают, что Китай за последнее десятилетие совершил впечатляющий рывок и из «технологического профана» превратился в одного из лидеров инноваций в сфере ИИ. Правда, разрыв с лучшими западными разработками вроде Sora и GPT-4 пока все еще остается значительным.
Одно найти легче, чем другое. Спойлер: это не темная материя