Самые популярные статьи — не про открытия, а про то, как делать науку.
В первой четверти XXI века наука сделала несколько прорывов, которые навсегда вошли в историю — от мРНК-вакцин и CRISPR до бозона Хиггса и гравитационных волн. Но если заглянуть в список самых цитируемых научных публикаций за последние 25 лет, этих открытий вы там не найдёте. Анализ, проведённый редакцией Nature, показывает: чаще всего ссылаются вовсе не на великие открытия, а на статьи, описывающие методы, алгоритмы, программное обеспечение или сводки данных, на которых держится повседневная научная работа.
На первом месте — статья 2016 года от исследователей Microsoft, посвящённая архитектуре нейросетей ResNet. Это глубокие остаточные сети, которые позволили тренировать нейросети из 150 слоёв — в несколько раз глубже, чем это было возможно ранее. Именно эта работа помогла устранить проблему исчезающего градиента и открыла путь к прорывам вроде AlphaGo, AlphaFold и, в конечном итоге, ChatGPT. Хотя разные базы данных по-разному считают цитирования (в Google Scholar у статьи более 250 тысяч ссылок, в Web of Science — чуть больше 100 тысяч), она оказалась на первом месте по медианному рейтингу среди пяти крупнейших источников.
На втором месте — работа 2001 года о методе 2–ΔΔCT, с помощью которого биологи вычисляют изменения экспрессии генов. Эту статью вообще написали специально, чтобы можно было официально сослаться на популярную формулу из технического мануала. С тех пор ею воспользовались более 160 тысяч раз. Третье место занимает методологическая статья по тематическому анализу в психологии, написанная в 2006 году и изначально предназначенная для студентов. Авторы, по их словам, и представить не могли, что она станет хитом цитирований.
В первой десятке — «библия психиатрии» DSM-5, справочник SHELX для анализа кристаллических структур, алгоритм случайных лесов, статьи о классификации изображений через глубокие нейросети и отчёты ВОЗ по онкологическим заболеваниям. Объединяет их одно: это инструменты и источники, без которых невозможна повседневная работа учёных самых разных дисциплин.
Отдельного внимания заслуживает список статей, связанных с искусственным интеллектом. Здесь и знаменитая работа 2012 года с описанием AlexNet, победившей в конкурсе на распознавание изображений, и статья 2017 года «Attention is all you need», в которой описываются трансформеры — архитектура, ставшая основой современных языковых моделей. Интересно, что многие из этих работ изначально публиковались в виде препринтов, и их реальные показатели цитирования ещё выше, чем в официальных базах.
№ | Название публикации | Год | Цитируемость | Область |
---|---|---|---|---|
1 | Deep Residual Learning for Image Recognition (ResNet) | 2016 | 103 756 – 254 074 | ИИ, компьютерное зрение |
2 | Analysis of Relative Gene Expression Using qPCR and the 2–ΔΔCT Method | 2001 | 149 953 – 185 480 | Молекулярная биология |
3 | Using Thematic Analysis in Psychology | 2006 | 100 327 – 230 391 | Психология |
4 | DSM-5: Diagnostic and Statistical Manual of Mental Disorders | 2013 | 98 312 – 367 800 | Психиатрия |
5 | A Short History of SHELX | 2007 | 76 523 – 99 470 | Химия, кристаллография |
6 | Random Forests | 2001 | 31 809 – 146 508 | Машинное обучение |
7 | Attention is All You Need | 2017 | 56 201 – 150 832 | ИИ, языковые модели |
8 | ImageNet Classification with Deep CNNs (AlexNet) | 2017 | 46 860 – 137 997 | ИИ, компьютерное зрение |
9 | Global Cancer Statistics 2020 (GLOBOCAN) | 2020 | 75 634 – 99 390 | Онкология |
10 | Global Cancer Statistics 2018 (GLOBOCAN) | 2016 | 66 844 – 93 433 | Онкология |
Цитируются и статьи о программном обеспечении: так, библиотека scikit-learn для Python и пакет lme4 для R заняли свои места в списке благодаря широкой доступности и удобству. А вот язык R сам по себе не попал в рейтинг — у него нет официальной статьи, и база OpenAlex ошибочно засчитывает ссылки на сайт проекта как ссылку на несуществующую публикацию. Это ещё раз доказывает: если вы создаёте важный инструмент, не забудьте написать о нём научную статью — иначе ваш вклад может затеряться в статистике.
Заметную долю списка занимают работы, направленные на повышение качества научных исследований. Статья с методологией PRISMA, стандартизирующая подход к систематическим обзорам и метаанализам, в числе лидеров — её цитируют, чтобы показать соответствие строгим стандартам. То же касается статьи об ошибках в поведенческих исследованиях и статьи о статистике I², оценивающей согласованность результатов метаанализов.
Этот обзор показывает, что самые цитируемые работы XXI века — это, как правило, не громкие научные открытия, а «рабочие лошадки» — методы, алгоритмы, стандарты и программные инструменты, которые помогают другим учёным делать открытия. В академическом мире цитируют тех, кто дал удобный инструмент, а не тех, кто доказал наличие бозона.