• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
7 апреля, 10:59
НИУ ВШЭ
1
4,1 тыс

Нейросеть научили с точностью до 95% предсказывать взаимодействия белков в клетке, важные для изучения болезней

❋ 4.9

Ученые Института искусственного интеллекта и цифровых наук (Института ИИиЦН) факультета компьютерных наук НИУ ВШЭ разработали модель, которая с точностью до 95% предсказывает, будут ли белки взаимодействовать друг с другом. GSMFormer-PPI использует три типа данных о белке, в том числе и о его поверхности, и анализирует связи между ними, в отличие от предыдущих моделей, где данные просто объединялись. Разработка может ускорить поиск молекулярных механизмов болезней, биомаркеров и потенциальных мишеней для лекарств.

Схема работы модели GSMFormer-PPI. На панели A показаны разные типы представлений белка, которые использует модель: последовательностно-структурные и поверхностные. На панели B показано, как они приводятся к общей размерности, анализируются трансформером и затем используются для итогового предсказания взаимодействия / © Arteaga, D., Chervov, N. & Poptsova, M. Multimodal graph, surface, and language-based model for protein protein interaction prediction. Sci Rep 16, 4772 (2026)

Почти все процессы в клетке зависят от взаимодействия белков внутри нее. С их помощью клетка передает сигналы, запускает и регулирует химические реакции, образует молекулярные комплексы, необходимые для ее работы. И если такие взаимодействия нарушаются и клетка работает неправильно, это может приводить к заболеваниям.

Поэтому для изучения механизма болезней и поиска мишеней для лечения ученым важно понимать, какие белки могут взаимодействовать друг с другом, а какие нет. Выяснять это экспериментально трудно: если в исследовании рассматриваются десятки или сотни белков, число возможных пар оказывается слишком большим для проверки. Из-за этого биологи используют методы машинного обучения, предсказывающие такие связи по структуре и свойствам молекул. 

Исследователи НИУ ВШЭ разработали систему GSMFormer-PPI, которая учитывает три типа данных о каждом из белков в предполагаемой паре: аминокислотную последовательность, трехмерную структуру и свойства молекулярной поверхности.  Для их обработки авторы использовали существующие модели, которые переводят эти данные в числовые представления. Аминокислотную последовательность — порядок цепочки аминокислот, из которой построен белок, — анализирует белковая языковая модель. Трехмерная структура белка представляется как граф, где аминокислоты становятся вершинами, а их пространственные контакты — связями.  Такое описание обрабатывает графовая нейронная сеть. Также с помощью отдельного алгоритма учитывались свойства поверхности белка — форма и физико-химические характеристики участков, через которые белки распознают друг друга. Работа опубликована в журнале Scientific Reports.

Затем эти числовые представления о белках поступали в разработанный авторами трансформерный модуль — нейросеть, которая совместно анализирует разные типы данных о белке. Если в работах других исследователей признаки часто просто объединялись в один вектор, то здесь модель не складывает их механически, а выявляет связи между ними. 

«При взаимодействии белков особенно важна их поверхность: именно через нее молекулы распознают друг друга и на ней сосредоточены физико-химические свойства, от которых зависит связывание. В нашей модели мы попытались учесть эту информацию вместе с последовательностью и трехмерной структурой белка, а затем не просто объединить признаки, а дать алгоритму возможность анализировать связи между ними. Именно это и позволило точнее предсказывать белок-белковые взаимодействия», — комментирует один из авторов статьи, директор Центра биомедицинских исследований и технологий Института ИИиЦН ФКН НИУ ВШЭ Мария Попцова.

Чтобы проверить, насколько хорошо работает новая модель, исследователи протестировали ее на наборе данных PINDER — крупной базе известных белковых взаимодействий.  В экспериментах GSMFormer-PPI показала точность 95,7% и превзошла популярные графовые модели, например GCN и GAT. Также исследователи провели тест с более простым вариантом GSMFormer-PPI — без модуля, который анализирует связи между разными типами данных. Эта версия работала хуже, что доказывает: дело не только в самих данных о белке, но и в том, как именно модель их сопоставляет.

Дополнительные тесты показали, что для точного прогноза важны все три типа данных: последовательность, пространственная структура и свойства поверхности белка. Когда исследователи поочередно убирали один из компонентов, качество предсказания снижалось. Иными словами, модель работает лучше именно потому, что рассматривает белок сразу на нескольких уровнях. В перспективе такие системы могут помочь быстрее отбирать пары белков при изучении механизмов болезней и поиске мишеней для лекарств.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Национальный исследовательский университет «Высшая школа экономики» — один из крупнейших и самых востребованных вузов России. В университете учится 54 тысячи студентов и работает почти 4,5 тысячи учёных и преподавателей. НИУ ВШЭ ведёт фундаментальные и прикладные исследования в области социально-экономических, гуманитарных, юридических, инженерных, компьютерных, физико-математических наук, а также креативных индустрий. В университете действуют 47 центров превосходства, или международных лабораторий. Вышка объединяет ведущих мировых исследователей в области изучения мозга, нейротехнологий, биоинформатики и искусственного интеллекта. Университет входит в первую группу программы «Приоритет-2030» в направлении «Исследовательское лидерство». Кампусы НИУ ВШЭ расположены в четырех городах — Москве, Санкт-Петербурге, Нижнем Новгороде и Перми, а также в цифровом пространстве — «Вышка Онлайн».
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
21 мая, 22:15
Александр Березин

Стартовое окно для крупнейшей ракеты в земной истории откроется 22 мая, в 01:30 ночи по московскому времени. Прямая трансляция начнется примерно за час до запуска. Вероятность переноса по причине погоды довольно велика, и все же крайне важный для современной космонавтики пуск может состояться этой ночью.

21 мая, 16:54
ЮФУ

Астрофизики Южного федерального университета предложили объяснение одной из самых интригующих загадок современной физики — годичных колебаний сигнала в детекторе DAMA/LIBRA, который вот уже почти тридцать лет регистрирует странные сигналы в подземной лаборатории Гран-Сассо в Италии, интерпретируемые как взаимодействие частиц темной материи с обычным веществом.

21 мая, 15:26
ФизТех

Физик-теоретик Сергей Вергелес, доцент МФТИ, старший научный сотрудник Института теоретической физики им. Л. Д. Ландау РАН предложил новый подход к объяснению барионной асимметрии — через дискретную симметрию Z4 в решеточной теории гравитации.

17 мая, 10:35
Игорь Байдов

В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.

17 мая, 10:00
Evgenia Vavilova

При совпадении нескольких условий наши глаза способны улавливать излучение в ближнем инфракрасном спектре. Тогда сетчатка начинает работать как нелинейный фотодетектор.

18 мая, 09:10
Лена

Во всем мире во всех человеческих культурах около 90% людей пользуются преимущественно правой рукой. Такое поразительное единство практически всего человечества не имеет аналогов среди приматов и до сих пор остается эволюционной загадкой. Ученые проанализировали данные о более чем двух тысячах человекообразных обезьянах и выяснили, когда и почему праворукость стала популяционной тенденцией.

23 апреля, 18:34
Александр Березин

В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.

17 мая, 10:35
Игорь Байдов

В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.

23 апреля, 12:08
Любовь С.

Астроциты — клетки, которые долго считались лишь «помощниками» нейронов — оказались частью скрытой системы связи в мозге. Они, как показали результаты нового исследования, формируют собственные протяженные сети, соединяющие разные части головного мозга. Это открытие меняет представление о том, как мозг координирует свою работу, адаптируется к новым условиям и восстанавливается после повреждений.

[miniorange_social_login]

Комментарии

1 Комментарий
Думаю, не далек тот день, когда лечить нас от всех болезней будет ИИ.
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Комментарий на проверке

Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Авторизуясь, вы даете согласие на обработку персональных данных и подтверждаете ознакомление с Политикой.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно