• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
24.02.2022
Даниил Сухинов
1 343

Нейронная сеть научилась предсказывать структуру и функции любых белков

6.7

Специалисты из компании Google в сотрудничестве с Европейским институтом биоинформатики разработали нейронную сеть глубокого обучения, позволяющую предсказывать структуру, функции и свойства белков по их первичной структуре с высокой точностью. Новый инструмент позволит значительно облегчить и ускорить разработку новых лекарств и проектирование новых ферментов для промышленного производства продуктов питания, биотоплива и химикатов.

Офис Google в штате Массачусетс (США), где работает основная команда авторов исследования.
Офис Google в штате Массачусетс (США), где работает основная команда авторов исследования. / ©Kyle Paul / Автор: Telestis Scaevinius

Понимание взаимосвязи между аминокислотной последовательностью (первичной структурой) и функцией белка, а значит, и механизмом его работы, — давняя проблема молекулярной биологии и настолько же давняя мечта специалистов самых разных областей промышленности, от фармацевтической до пищевой и химической.

Для производства различных химических веществ, будь то лекарство, пищевая добавка или химикат, естественно использовать лучшие из имеющихся катализаторов — ферменты, то есть белки. Причем для каждого приложения нужен свой белок с конкретной функцией (переноса электрона или отдельных химических групп, образования или разрыва химических связей и так далее). Человек еще не научился создавать такие ферменты с нуля, поэтому подсматривает возможные решения у природы и зачастую находит их в микроорганизмах.

Несмотря на шесть десятилетий прогресса, современные методы и алгоритмы не могут определить функции трети последовательностей уже известных микробных белков, что ограничивает возможности их применения в интересах человечества. В то же время каждый день в глобальные базы данных добавляют более ста тысяч новых белковых последовательностей.

Однако для практического применения от этих данных не много пользы, если они не сопровождаются функциональными аннотациями (то есть описанием функций белка и его биологической роли в клетке).

Увеличение размера базы данных Trembl (одной из баз данных белковых последовательностей) с течением времени и соответствующее снижение доли белков, функция которых точно определена (вручную) / © Google Research/ProteInfer

Функцию белка можно выяснить экспериментально, используя ряд современных методов — анализ микрочипов, РНК-интерференцию, двугибридный анализ и другие. Но темпы экспериментального доказательства функций открытых белков сильно отстают от темпов открытия новых последовательностей, и навряд ли когда-либо их догонят.

Поэтому аннотирование новых белковых последовательностей будет проходить в основном путем предсказания на основе вычислительных методов, сравнивающих их с аминокислотными последовательностями белков с уже известными функциями, определенными экспериментально. При этом, когда возникнет необходимость в создании новой технологии производства (например того же лекарства), у ученых будут на руках предсказания нейросетей, по которым уже вручную надо будет определять наиболее подходящие белки-кандидаты и проверять их функции.

Новый вычислительный метод определения функций и свойств белков предлагает команда специалистов из Google Research (Кембридж, Массачусетс, США) и Европейской молекулярно-биологической лаборатории Европейского института биоинформатики (EMBL-EBI). Они разработали нейронную сеть глубокого обучения, предсказывающую не только функцию белка и его биологическую роль в клетке, но и его структуру, и функциональные эффекты мутаций (точечных изменений аминокислотной последовательности).

Производительность нейросети ProteInfer для прогнозов по всем 7 основным группам ферментов, представленная в виде кривых точности-отзыва, созданных путем изменения порога принятия решения, при котором делается прогноз. / ©Google research/ProteInfer

Используя свой алгоритм, обученный на всемирной базе данных семейств аннотированных белковых доменов Pfam, исследователи дополнили ее новыми аннотациями с указанием функций белков с давно расшифрованной аминокислотной последовательностью. В итоге количество записей в базе данных выросло почти на 10%, включая 360 новых записей о функциях белков человека. По словам авторов, это самое большое обновление Pfam за последние 10 лет.

Разработка американских биоинформатиков призвана значительно упростить и ускорить так называемый драг-дизайн — направленную разработку новых лекарств с учетом строения и трехмерной структуры молекул-мишеней (зачастую именно белков), на которые это лекарство будет действовать. Кроме того, знание структуры белков и понимание механизмов их работы позволят облегчить разработку новых биотехнологических ферментов для пищевой, химической и энергетической промышленностей.

Статья с результатами исследования представлена в журнале Nature Biotechnology.

Помимо этого, авторы опубликовали интерактивную научную статью с подробным описанием работы их нейронной сети, оценками ее производительности и сравнением с аналогичными методами других проектов.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
Позавчера, 07:19
Полина Меньшова

Человек и животные осваивают навыки, обучаясь на собственном опыте. Однако ученым из США удалось без явного обучения и физических манипуляций внести в мозг шаблон активности. Это позволило людям усвоить информацию и заставило по-другому воспринимать визуальные образы.

Сегодня, 14:02
Елизавета Александрова

Та самая черная дыра, силуэт которой впервые увидел мир, расположена в центре крупной галактики М87 и привлекала к себе пристальное внимание задолго до получения знаменитого изображения: она постоянно бьет в нашу сторону гигантским потоком плазмы, а иногда с ней происходят труднопредсказуемые и не совсем понятные события. Одно из них впервые за много лет удалось зафиксировать во время очередных наблюдений.

15 декабря
Любовь

Своеобразную «шпаргалку» внутри клеток, объясняющую как перевести набор нуклеотидов («букв») в ДНК или РНК в последовательность аминокислот («деталей»), из которых состоят белки, называют генетическим кодом. Его устройство одинаково почти у всех организмов на Земле, однако ученые до сих пор спорят о времени его происхождения и постепенных изменениях. Теперь, проанализировав фрагменты белковой цепи этой древней генетической «шпаргалки», исследователи пересмотрели устоявшиеся представления о ее происхождении.

13 декабря
Юлия Трепалина

С какого возраста зооврачи считают собак престарелыми? Это недавно выяснили исследователи из Великобритании и Венгрии, проанализировав карты пациентов ветеринарных клиник. Также ученые установили, от каких проблем со здоровьем чаще страдают пожилые питомцы.

Позавчера, 07:19
Полина Меньшова

Человек и животные осваивают навыки, обучаясь на собственном опыте. Однако ученым из США удалось без явного обучения и физических манипуляций внести в мозг шаблон активности. Это позволило людям усвоить информацию и заставило по-другому воспринимать визуальные образы.

13 декабря
Елизавета Александрова

Солнечной системе уже 4,6 миллиарда лет, и нынешнее расположение планет выдает ее явно динамичное прошлое: что-то заставляло миры смещаться. Недавнее открытие первых известных науке межзвездных объектов навело астрономов на мысль, что такой объект мог навестить наше космическое семейство в далеком прошлом и именно это создало ту картину, которую наблюдаем сейчас.

28 ноября
Елизавета Александрова

Обсерватории постоянно улавливают «мигающие» радиосигналы из глубин Вселенной. Чаще всего их источниками оказываются нейтронные звезды, которые за это и назвали пульсарами. Но к недавно обнаруженному источнику GLEAM-X J0704-37 они, по мнению астрономов, отношения не имеют.

25 ноября
Полина Меньшова

Многие одинокие люди считают, что окружающие не разделяют их взглядов. Психологи из США решили проверить, так ли это на самом деле, и обнаружили общую особенность у людей с недостаточным количеством социальных связей.

3 декабря
Елизавета Александрова

Американская лунная программа «Артемида» предусматривает экспедиции длительностью от нескольких дней до долгих недель и даже месяцев, но луномобиля для передвижения экипажа по поверхности спутника Земли на сегодня нет. Поэтому космическое агентство США продумывает план действий на случай, если астронавты окажутся далеко от базы и кто-то из них внезапно не сможет идти самостоятельно.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно