• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
24.02.2022, 09:33
Даниил Сухинов
1,4 тыс

Нейронная сеть научилась предсказывать структуру и функции любых белков

❋ 6.7

Специалисты из компании Google в сотрудничестве с Европейским институтом биоинформатики разработали нейронную сеть глубокого обучения, позволяющую предсказывать структуру, функции и свойства белков по их первичной структуре с высокой точностью. Новый инструмент позволит значительно облегчить и ускорить разработку новых лекарств и проектирование новых ферментов для промышленного производства продуктов питания, биотоплива и химикатов.

Офис Google в штате Массачусетс (США), где работает основная команда авторов исследования.
Офис Google в штате Массачусетс (США), где работает основная команда авторов исследования. / ©Kyle Paul / Автор: Telestis Scaevinius

Понимание взаимосвязи между аминокислотной последовательностью (первичной структурой) и функцией белка, а значит, и механизмом его работы, — давняя проблема молекулярной биологии и настолько же давняя мечта специалистов самых разных областей промышленности, от фармацевтической до пищевой и химической.

Для производства различных химических веществ, будь то лекарство, пищевая добавка или химикат, естественно использовать лучшие из имеющихся катализаторов — ферменты, то есть белки. Причем для каждого приложения нужен свой белок с конкретной функцией (переноса электрона или отдельных химических групп, образования или разрыва химических связей и так далее). Человек еще не научился создавать такие ферменты с нуля, поэтому подсматривает возможные решения у природы и зачастую находит их в микроорганизмах.

Несмотря на шесть десятилетий прогресса, современные методы и алгоритмы не могут определить функции трети последовательностей уже известных микробных белков, что ограничивает возможности их применения в интересах человечества. В то же время каждый день в глобальные базы данных добавляют более ста тысяч новых белковых последовательностей.

Однако для практического применения от этих данных не много пользы, если они не сопровождаются функциональными аннотациями (то есть описанием функций белка и его биологической роли в клетке).

Увеличение размера базы данных Trembl (одной из баз данных белковых последовательностей) с течением времени и соответствующее снижение доли белков, функция которых точно определена (вручную) / © Google Research/ProteInfer

Функцию белка можно выяснить экспериментально, используя ряд современных методов — анализ микрочипов, РНК-интерференцию, двугибридный анализ и другие. Но темпы экспериментального доказательства функций открытых белков сильно отстают от темпов открытия новых последовательностей, и навряд ли когда-либо их догонят.

Поэтому аннотирование новых белковых последовательностей будет проходить в основном путем предсказания на основе вычислительных методов, сравнивающих их с аминокислотными последовательностями белков с уже известными функциями, определенными экспериментально. При этом, когда возникнет необходимость в создании новой технологии производства (например того же лекарства), у ученых будут на руках предсказания нейросетей, по которым уже вручную надо будет определять наиболее подходящие белки-кандидаты и проверять их функции.

Новый вычислительный метод определения функций и свойств белков предлагает команда специалистов из Google Research (Кембридж, Массачусетс, США) и Европейской молекулярно-биологической лаборатории Европейского института биоинформатики (EMBL-EBI). Они разработали нейронную сеть глубокого обучения, предсказывающую не только функцию белка и его биологическую роль в клетке, но и его структуру, и функциональные эффекты мутаций (точечных изменений аминокислотной последовательности).

Производительность нейросети ProteInfer для прогнозов по всем 7 основным группам ферментов, представленная в виде кривых точности-отзыва, созданных путем изменения порога принятия решения, при котором делается прогноз. / ©Google research/ProteInfer

Используя свой алгоритм, обученный на всемирной базе данных семейств аннотированных белковых доменов Pfam, исследователи дополнили ее новыми аннотациями с указанием функций белков с давно расшифрованной аминокислотной последовательностью. В итоге количество записей в базе данных выросло почти на 10%, включая 360 новых записей о функциях белков человека. По словам авторов, это самое большое обновление Pfam за последние 10 лет.

Разработка американских биоинформатиков призвана значительно упростить и ускорить так называемый драг-дизайн — направленную разработку новых лекарств с учетом строения и трехмерной структуры молекул-мишеней (зачастую именно белков), на которые это лекарство будет действовать. Кроме того, знание структуры белков и понимание механизмов их работы позволят облегчить разработку новых биотехнологических ферментов для пищевой, химической и энергетической промышленностей.

Статья с результатами исследования представлена в журнале Nature Biotechnology.

Помимо этого, авторы опубликовали интерактивную научную статью с подробным описанием работы их нейронной сети, оценками ее производительности и сравнением с аналогичными методами других проектов.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
4 июля, 09:30
Любовь С.

Анализ более 150 тысяч древних звезд Млечного Пути показал, что возраст космоса, судя по всему, близок к 13,8 миллиарда лет. Авторы нового исследования заключили, что сценарии, в которых Вселенную приходится делать заметно «моложе» ради решения хаббловского кризиса, плохо согласуются с наблюдениями. Это важно, поскольку возраст старейших светил — один из немногих независимых способов проверить космологические модели не по данным ранней Вселенной, а по объектам нашей собственной Галактики.

4 июля, 17:28
Evgenia Vavilova

Мы много знаем о том, как цивилизации до нас строили дома и дороги, но с объектами материальной культуры дела обстоят сложнее. Ремесленные техники часто хранились в строгом секрете и могли быть случайно утрачены при неудачном стечении обстоятельств. Так случилось с ювелирной техникой цзинь чжэ сы.

3 июля, 12:20
Татьяна Зайцева

Японские исследователи выловили у берегов Окинавы пластиковую бутылку с узким горлышком, внутри которой сидел большой живой краб. В итоге ученые смогли найти ответы на несколько возникших в связи с этой находкой вопросов: как краб попал в бутылку, сколько там находился и как ему удалось выжить?

29 июня, 13:56
ЮФУ

Ученые Южного федерального университета исследовали новую светочувствительную молекулу и обнаружили, что она ведет себя совсем не так, как ожидалось. Благодаря необычным свойствам она может стать основой для создания умных материалов, сенсоров и лекарств, которые будут активироваться светом именно там, где нужно, например, для борьбы с опасными бактериями.

1 июля, 09:42
Игорь Байдов

Авторы нового исследования провели сравнительный анализ видов паукообразных и выяснили, какие эволюционные и биомеханические факторы делают одних пауков быстрыми, а других — медленными. Параллельно ученые выделили из этой группы рекордсмена по скорости перемещения.

30 июня, 10:59
НИУ ВШЭ

Сотрудники факультета экономических наук НИУ ВШЭ показали, что точность прогноза рождаемости в России можно улучшить почти в полтора раза, если добавить в модель динамику поисковых запросов по темам, связанным с беременностью и родами. В наиболее эффективных моделях ошибка прогноза снижается с 4,6 до 3,2%.

10 июня, 11:51
Александр Березин

Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.

25 июня, 16:20
Любовь С.

Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.

25 июня, 15:09
Марк Чернов

Ученые впервые на молекулярном уровне доказали, что обычная вода одновременно состоит из двух разных жидких состояний — более плотного и менее плотного, которые непрерывно сменяют друг друга. Раз молекулярная «двойственность» действительно существует, это подтверждает спорную 30-летнюю гипотезу. Новое открытие поможет, наконец, объяснить десятки «странных» физических аномалий воды, включая ее расширение при замерзании и парадоксальное изменение вязкости под давлением.

[miniorange_social_login]

Комментарии

Написать комментарий