Открытие 500 000 полных геномов может изменить понимание наследственных болезней.
Британский биобанк (UK Biobank) выпустил полные геномные последовательности всех 500 000 добровольцев из Великобритании, хранящихся в их базе данных. Эти данные, не содержащие идентифицируемых деталей, теперь доступны для исследователей со всего мира, желающих изучать генетическую основу здоровья и болезней.
Рори Коллинз, главный исполнительный директор UK Biobank, сравнил этот ресурс с Google Картами на пресс-брифинге: "Когда учёные хотят понять пути от образа жизни, окружающей среды, генетики к болезни, они обращаются к UK Biobank, а не к Google".
Сегодняшний релиз включает полную 3-миллиардную геномную последовательность каждого участника биобанка. Ранее в 2021 году были выпущены полные геномы 200 000 участников. Проект стоимостью £200 млн (около $250 млн) был профинансирован благотворительным фондом Wellcome, правительством Великобритании и несколькими фармацевтическими компаниями. Они, в свою очередь, получили доступ к данным на 9 месяцев раньше широкой публики.
Ранее база данных UK Biobank включала полные «экзомы» — 2% генома, кодирующего белки, а также 850 000 общих однобуквенных вариантов ДНК, распределённых по геному. Эти данные использовались в исследованиях генома, связанных со здоровьем.
Особое внимание учёные уделяют редким мутациям, которые, как считает Майкл Уидон, генетик из Университета Эксетера, могут дать более глубокое понимание биологии. Например, в исследовании предварительных данных первых 200 000 геномов, команда Уидона обнаружила 29 редких ДНК-вариантов, связанных с различиями в росте до 7 см, которые ранее не были выявлены.
В долгосрочной перспективе для всестороннего изучения связей между редкими генетическими вариантами и здоровьем потребуется более полумиллиона полных геномов. Также международные проекты, такие как "Все о нас" в США, планирующий выпустить геномные и медицинские данные более миллиона людей, будут полезны для подтверждения связей, выявленных с помощью данных UK Biobank.
Андреа Ганна, статистический генетик из Университета Хельсинки, выразил сомнение в эффективности использования полных геномов, отметив, что многие не кодирующие варианты, выявленные в исследованиях, близки к уже известным через GWAS. Тем не менее, полные геномные последовательности могут помочь точнее определить связи заболеваний со структурными вариациями ДНК.
UK Biobank уже привел к более чем 9 000 публикациям, и настоящий эффект от последнего релиза может стать ясен только спустя некоторое время, как отметил Коллинз: "Я думаю, мы будем удивлены тем, сколько всего нового мы узнаем, чего даже не представляли".
Одно найти легче, чем другое. Спойлер: это не темная материя