Разработчики ИИ получат доступ к госданным уже в феврале

Разработчики ИИ получат доступ к госданным уже в феврале

Искусственный интеллект обучат на данных со спутников и дронов.

image

Государственные органы, бизнес и граждане получат доступ к размеченным наборам государственных данных, предназначенным для обучения и тестирования алгоритмов искусственного интеллекта (ИИ). Эту информацию подтвердил Ведомостям представитель аппарата вице-премьера Дмитрия Григоренко.

Как уточняется, уже в феврале 2025 года госорганы и разработчики ИИ смогут начать заключать соглашения на получение таких данных на безвозмездной основе. Данный процесс реализуется в рамках федерального проекта «Искусственный интеллект», который входит в состав нацпроекта «Экономика данных». Вице-премьер курирует данный проект.

Разметка данных представляет собой процесс присвоения определённых меток или категорий, что делает информацию более понятной для алгоритмов машинного обучения. Согласно заявлению представителя аппарата вице-премьера, подготовленные наборы данных сформированы на базе исходных информационных массивов, при этом в них отсутствуют персональные данные граждан, а также сведения, относящиеся к служебной или иной охраняемой законом тайне.

Формирование таких наборов осуществляется в рамках Единой информационной платформы Национальной системы управления данными (ФГИС «ЕИП НСУД»). Уже в 2023 году были созданы первые 10 наборов, а в ноябре 2024 года к ним добавились ещё 40, входящих в состав федерального проекта «Искусственный интеллект».

В основном в этих массивах содержатся фото- и видеоматериалы, которые могут использоваться для машинного обучения в различных отраслях, включая управление городской средой, транспорт, экологию и сельское хозяйство. В частности, в 2024 году была выполнена разметка данных, полученных с беспилотных летательных аппаратов и спутников, что позволило определить категории транспортных средств, древесный состав и состояние лесных массивов, а также классифицировать сельскохозяйственные угодья.

Функции оператора передачи данных возложены на Министерство цифрового развития. В соответствии с утверждённым планом, были подготовлены проекты типовых соглашений, отдельно для государственных структур и для юридических и физических лиц. В таких соглашениях оговариваются цели информационного обмена, сроки передачи данных, период использования полученной информации, а также гарантии её целевого применения и защиты от несанкционированного распространения.

Представитель Минцифры пояснил, что соглашения по предоставлению размеченных госданных для обучения, тестирования и разработки ИИ будут заключаться с региональными ведомствами и подведомственными организациями, которые отвечают за внедрение технологий искусственного интеллекта на местном уровне. Как уточнил он, речь идёт не о коммерческих контрактах, а о соглашениях, направленных на ускорение разработки ИИ и его практического применения.

Запросы на доступ к таким данным уже направлены от властей Тюменской и Липецкой областей. В Тюменской области планируется использовать эти массивы для совершенствования управления городской инфраструктурой и развития интеллектуальных транспортных систем. Ожидается, что это поможет повысить точность распознавания дефектов дорожного покрытия. В Липецкой области, в свою очередь, намерены применять данные для обучения алгоритмов распознавания изображений.

Как подчеркнул вице-премьер, обеспечение открытого доступа к данным играет ключевую роль в развитии технологий ИИ в экономике и социальной сфере. Помимо равного доступа к ресурсам, важное значение имеет и качество этих данных, которому при их формировании уделялось особое внимание.

Первые инициативы по созданию такой инфраструктуры появились ещё в 2020 году, когда правительство утвердило концепцию регулирования ИИ и робототехники. В последующие годы вопрос о разметке данных стал одним из центральных в развитии этой сферы. В 2024 году в Москве стартовал эксперимент по тестированию специальных правил обработки данных при разработке ИИ, что позволило отработать механизмы передачи обезличенной информации в государственные информационные системы.

Как отмечают эксперты, доступ к таким ресурсам позволит ускорить процесс импортозамещения в сфере ИИ, повысить качество моделей и снизить риски утечек или неконтролируемого распространения информации. Российские компании и государственные структуры смогут получить конкурентные преимущества перед западными IT-корпорациями, что также окажет положительное влияние на технологическое развитие в стране.

Ищем уязвимости в системе и новых подписчиков!

Первое — находим постоянно, второе — ждем вас

Эксплойтните кнопку подписки прямо сейчас