"Учим видеть лекарства": фармацевты втайне строят свой AlphaFold

"Учим видеть лекарства": фармацевты втайне строят свой AlphaFold

Открытая наука проигрывает закрытому бизнесу в гонке за новыми лекарствами.

image

AlphaFold , система ИИ, удостоенная Нобелевской премии за прорыв в предсказании структуры белков, неожиданно столкнулась с ограничением: ей не хватает данных. Новая версия — AlphaFold 3 — обещает революцию в создании лекарств, ведь она способна моделировать взаимодействие белков с другими молекулами, включая сами лекарства. Но именно этих примеров во входных данных почти нет.

База, на которой обучался AlphaFold, включает сотни тысяч белковых структур из открытого репозитория Protein Data Bank (PDB). Однако большинство из них описывает взаимодействие белков с природными молекулами вроде АТФ, а не с лекарственными соединениями. Это сдерживает развитие модели в том направлении, которое особенно важно для фармкомпаний.

В ответ на этот вызов крупнейшие фармпроизводители объединились в консорциум, чтобы создать собственную версию AlphaFold-подобной модели на основе конфиденциальных данных. В неё войдут десятки тысяч структур, накопленных внутри компаний, таких как AbbVie, Johnson & Johnson, Sanofi и Boehringer Ingelheim. Эти данные раньше нигде не публиковались и, по словам исследователей, могут быть даже объемнее, чем содержимое всего открытого PDB. Например, только AbbVie передаёт более 9 тысяч структур.

Новая модель будет основана на OpenFold 3 — открытом клоне AlphaFold 3, который разрабатывается учёными на основе общедоступных данных и должен выйти в апреле. При этом сам Google DeepMind, создатель оригинального AlphaFold, в инициативе участия не принимает, как и его дочерняя компания Isomorphic Labs, которая сотрудничает с Novartis и Eli Lilly отдельно.

Обмен конфиденциальными структурами внутри консорциума не планируется. Вместо этого используется платформа немецкого стартапа Apheris, позволяющая обучать модель прямо внутри инфраструктуры каждой компании, не раскрывая данные даже другим участникам. По словам разработчиков, восстановить оригинальные структуры по итогам обучения будет невозможно.

Пока неясно, насколько улучшится точность предсказаний за счёт доступа к закрытым данным. Но эксперты отмечают, что даже небольшой прогресс — например, повышение вероятности правильного предсказания связывания лекарства с белком с 20% до 50% — может изменить правила игры в фармацевтике.

Тем не менее доступ к новой модели будет ограничен участниками консорциума. Некоторые исследователи надеются, что компании всё же начнут делиться своими структурами с научным сообществом. Сейчас лишь 6% всех данных в PDB поступают от фармкомпаний. Однако скептики напоминают: разговоры об открытости ведутся десятилетиями — и за это время мало что изменилось.

Эксклюзивный стрим с хакерами мирового класса

15 апреля в 19:00 Hussein и Niksthehacker раскроют все карты.

Реклама. АО «Позитив Текнолоджиз», ИНН 7718668887