20 бесценных научных архивов на грани исчезновения — и никто не может их спасти

20 бесценных научных архивов на грани исчезновения — и никто не может их спасти

Уникальные архивы могут исчезнуть навсегда.

image

На фоне масштабных сокращений и реструктуризации в структурах Министерства здравоохранения США почти 20 национальных научных и медицинских репозиториев оказались под угрозой исчезновения. Особую обеспокоенность вызывает то, что многие из хранилищ содержат уникальные и незаменимые данные, полученные за годы дорогостоящих и трудоёмких исследований.

На сайтах баз данных появилась надпись: «Репозиторий находится на рассмотрении на предмет возможных изменений в соответствии с указаниями администрации». Сообщение появилось сразу на множестве ресурсов, включая архивы онкологических изображений, базы по болезни Альцгеймера, исследованию сна, ВИЧ, а также статистику по вакцинации и смертности от COVID-19.

По мнению архивистов, угрозой стал не столько сам факт удаления данных, сколько исчезновение тех, кто обслуживает и поддерживает инфраструктуру. Если базы останутся без системных администраторов и инженеров, их просто некому будет обновлять, сохранять и делать доступными. Сбой одного сервера, потеря доступа к устройствам хранения или истечение соглашения об использовании — и исследователь теряет многолетнюю работу.

Специалисты подчеркивают, что даже при наличии технической возможности сохранить данные, нужно юридическое обоснование. Хранилища, созданные за счёт государственных средств, не могут рисковать, размещая контент, легальность которого вызывает сомнения. Даже с использованием децентрализованных систем хранения, объём — до нескольких петабайт — делает задачу практически неподъёмной.

Нехватка времени усугубляет ситуацию. Исследователи уже сталкиваются с тем, что соглашения на доступ к данным не могут быть продлены — сотрудники, отвечающие за эти процессы, уволены. Это означает невозможность опубликовать работы, основанные на уже проведённом анализе. Были случаи, когда ученые теряли до 5 лет исследований по причине недоступности данных.

Один из наиболее тревожных примеров — исследования Министерства образования США. Архивы позволяли проводить масштабный анализ влияния дохода и географического положения на успеваемость школьников. Без доступа к таким данным будет невозможно отслеживать долгосрочные изменения, сравнивать уровень образования между регионами или анализировать позиции страны в мировом образовательном контексте.

Основная сложность заключается в том, что загрузить и сохранить такие массивы данных невозможно без заключения официальных соглашений об использовании данных (DUA) между исследователями и Национальными институтами здравоохранения (NIH). Соглашения требуют тщательной экспертизы, особенно из-за содержащейся в массивах персональной и медицинской информации, защищённой законами о конфиденциальности. Автоматическое или добровольческое копирование таких архивов попросту незаконно.

Пока волонтёры пытаются спасти хотя бы то, что не требует юридических соглашений, специалисты советуют исследователям как можно быстрее копировать те массивы, к которым у них ещё есть доступ. Однако времени остаётся всё меньше, а последствия для науки и здравоохранения могут оказаться необратимыми.

Реальные атаки. Эффективные решения. Практический опыт.

Standoff Defend* — это онлайн-полигон, где ты сможешь испытать себя. Попробуй себя в расследовании инцидентов и поборись за победу в конкурсе

*Защищать. Реклама. АО «Позитив Текнолоджиз», ИНН 7718668887