Топ научных статей века: ни одной сенсации, зато куча того, что работает

Топ научных статей века: ни одной сенсации, зато куча того, что работает

Самые популярные статьи — не про открытия, а про то, как делать науку.

image

В первой четверти XXI века наука сделала несколько прорывов, которые навсегда вошли в историю — от мРНК-вакцин и CRISPR до бозона Хиггса и гравитационных волн. Но если заглянуть в список самых цитируемых научных публикаций за последние 25 лет, этих открытий вы там не найдёте. Анализ, проведённый редакцией Nature, показывает: чаще всего ссылаются вовсе не на великие открытия, а на статьи, описывающие методы, алгоритмы, программное обеспечение или сводки данных, на которых держится повседневная научная работа.

На первом месте — статья 2016 года от исследователей Microsoft, посвящённая архитектуре нейросетей ResNet. Это глубокие остаточные сети, которые позволили тренировать нейросети из 150 слоёв — в несколько раз глубже, чем это было возможно ранее. Именно эта работа помогла устранить проблему исчезающего градиента и открыла путь к прорывам вроде AlphaGo, AlphaFold и, в конечном итоге, ChatGPT. Хотя разные базы данных по-разному считают цитирования (в Google Scholar у статьи более 250 тысяч ссылок, в Web of Science — чуть больше 100 тысяч), она оказалась на первом месте по медианному рейтингу среди пяти крупнейших источников.

На втором месте — работа 2001 года о методе 2–ΔΔCT, с помощью которого биологи вычисляют изменения экспрессии генов. Эту статью вообще написали специально, чтобы можно было официально сослаться на популярную формулу из технического мануала. С тех пор ею воспользовались более 160 тысяч раз. Третье место занимает методологическая статья по тематическому анализу в психологии, написанная в 2006 году и изначально предназначенная для студентов. Авторы, по их словам, и представить не могли, что она станет хитом цитирований.

В первой десятке — «библия психиатрии» DSM-5, справочник SHELX для анализа кристаллических структур, алгоритм случайных лесов, статьи о классификации изображений через глубокие нейросети и отчёты ВОЗ по онкологическим заболеваниям. Объединяет их одно: это инструменты и источники, без которых невозможна повседневная работа учёных самых разных дисциплин.

Отдельного внимания заслуживает список статей, связанных с искусственным интеллектом. Здесь и знаменитая работа 2012 года с описанием AlexNet, победившей в конкурсе на распознавание изображений, и статья 2017 года «Attention is all you need», в которой описываются трансформеры — архитектура, ставшая основой современных языковых моделей. Интересно, что многие из этих работ изначально публиковались в виде препринтов, и их реальные показатели цитирования ещё выше, чем в официальных базах.

Название публикации Год Цитируемость Область
1 Deep Residual Learning for Image Recognition (ResNet) 2016 103 756 – 254 074 ИИ, компьютерное зрение
2 Analysis of Relative Gene Expression Using qPCR and the 2–ΔΔCT Method 2001 149 953 – 185 480 Молекулярная биология
3 Using Thematic Analysis in Psychology 2006 100 327 – 230 391 Психология
4 DSM-5: Diagnostic and Statistical Manual of Mental Disorders 2013 98 312 – 367 800 Психиатрия
5 A Short History of SHELX 2007 76 523 – 99 470 Химия, кристаллография
6 Random Forests 2001 31 809 – 146 508 Машинное обучение
7 Attention is All You Need 2017 56 201 – 150 832 ИИ, языковые модели
8 ImageNet Classification with Deep CNNs (AlexNet) 2017 46 860 – 137 997 ИИ, компьютерное зрение
9 Global Cancer Statistics 2020 (GLOBOCAN) 2020 75 634 – 99 390 Онкология
10 Global Cancer Statistics 2018 (GLOBOCAN) 2016 66 844 – 93 433 Онкология

Цитируются и статьи о программном обеспечении: так, библиотека scikit-learn для Python и пакет lme4 для R заняли свои места в списке благодаря широкой доступности и удобству. А вот язык R сам по себе не попал в рейтинг — у него нет официальной статьи, и база OpenAlex ошибочно засчитывает ссылки на сайт проекта как ссылку на несуществующую публикацию. Это ещё раз доказывает: если вы создаёте важный инструмент, не забудьте написать о нём научную статью — иначе ваш вклад может затеряться в статистике.

Заметную долю списка занимают работы, направленные на повышение качества научных исследований. Статья с методологией PRISMA, стандартизирующая подход к систематическим обзорам и метаанализам, в числе лидеров — её цитируют, чтобы показать соответствие строгим стандартам. То же касается статьи об ошибках в поведенческих исследованиях и статьи о статистике I², оценивающей согласованность результатов метаанализов.

Этот обзор показывает, что самые цитируемые работы XXI века — это, как правило, не громкие научные открытия, а «рабочие лошадки» — методы, алгоритмы, стандарты и программные инструменты, которые помогают другим учёным делать открытия. В академическом мире цитируют тех, кто дал удобный инструмент, а не тех, кто доказал наличие бозона.

Присоединяйся к сообществу ИБ-специалистов

Обменивайся опытом, решай реальные задачи и прокачивай навыки вместе с экспертами на Standoff Defend*.

*Защищать. Реклама. АО «Позитив Текнолоджиз», ИНН 7718668887