Инструмент из Caltech возвращает невидимую часть мира в фокус науки.
Учёные из Калифорнийского технологического института (Caltech) разработали алгоритм, способный значительно упростить поиск вирусов в данных РНК-секвенирования. Новый инструмент позволяет не только обнаруживать вирусы в образцах, но и исследовать их влияние на биологические процессы. Разработка основана на существующем программном обеспечении kallisto и способна открыть невидимую ранее часть мира вирусов.
На планете существует колоссальное количество вирусов — примерно по 10 миллионов на каждую звезду во Вселенной. Они повсюду, даже если не вызывают болезней, и наука всё ещё знает о них далеко не всё. Некоторые исследователи, например, предполагают, что нейродегенеративные заболевания, такие как болезнь Альцгеймера и Паркинсона, могут быть связаны с ранее неучтёнными вирусными инфекциями.
Как объясняет первая авторка исследования Лора Любер (Ph.D. '24), когда учёные секвенируют РНК из, скажем, образца ткани лёгких, они получают РНК всех присутствующих в нём клеток — в основном человеческих, но также и вирусных. Обычно такие «вирусные» фрагменты отбрасываются в процессе анализа, но новый инструмент позволяет не только сохранить эти данные, но и количественно их оценить. Это особенно важно при поиске неизвестных или неожиданных вирусов.
Современные методы транскриптомики, такие как секвенирование РНК отдельных клеток, генерируют огромные объёмы данных. Эти технологии уже давно помогают изучать активность генов в разных типах клеток. Новый алгоритм идёт дальше — он делает возможным выявление вирусов прямо внутри этих данных, причём без необходимости дополнительных анализов.
В основе системы лежит способность kallisto определять РНК вирусов, которые используют РНК, а не ДНК, как генетический материал. Большинство инфекционных вирусов попадают в эту категорию. Их объединяет один ключевой элемент — белок под названием РНК-зависимая РНК-полимераза (RdRp). Поиск генетического кода этого белка позволяет алгоритму идентифицировать более 100 тысяч видов вирусов с минимальными затратами вычислительных ресурсов.
Команда проекта считает, что новая разработка найдёт широкое применение — от мониторинга новых заболеваний до изучения всего вирусного разнообразия, окружающего человека. Как подчёркивает профессор Лиор Пахтер, руководитель лаборатории, инструмент был задуман как максимально доступный для любого биолога. Он работает на базе PalmDB — базы данных, созданной ранее другими учёными, — и дополняется оригинальными алгоритмами. Любой исследователь, имеющий данные секвенирования, может воспользоваться kallisto, чтобы выяснить, какие вирусы содержатся в образце и в каких именно клетках они обнаружены.
Исследование опубликовано 22 апреля в журнале Nature Biotechnology.