• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
20.04.2022, 09:30
Михаил Орлов
1,7 тыс

Глубокое машинное обучение использует «язык белков», чтобы предсказать их свойства

❋ 5.5

Модели глубокого обучения (deep learning) хорошо зарекомендовали себя при работе с текстами и речью. Однако они также эффективны для решения задач молекулярной биологии и биомедицины, в том числе предсказания функциональных свойств белков на основе их аминокислотной последовательности.

Глубокое обучение использует последовательность аминокислот, чтобы предсказать структуру и функции белков
Глубокое обучение использует последовательность аминокислот, чтобы предсказать структуру и функции белков / © Unsal et al. / Автор: Milonia Larcius

На протяжении многих лет биоинформатики, генетики, нейрофизиологи и другие специалисты в области наук о живом продолжают выяснять биологические функции генов и их продуктов — белков. Для этого им приходится использовать большие и порой имеющие сложную структуру данные, с которыми просто невозможно справиться без помощи машинного обучения и анализа данных.

Напомним, белки — это крупные биологические молекулы со сложной структурой. Они представляют собой длинные цепочки (полимеры), состоящие из множества связанных звеньев-аминокислот (мономеров). Белки могут выполнять самые различные и очень специфичные функции — от формирования «клеточного скелета» до катализа химических реакций, работы в качестве «молекулярных машин» и регуляции различных биологических процессов. Это возможно благодаря их особой трехмерной структуре, которая, в свою очередь, определяется именно аминокислотной последовательностью белка.

В то же время установить связь между аминокислотной последовательностью, структурой белка и его функциями — непростая и пока далеко не решенная задача. Поэтому исследователи из трех различных университетов Турции опубликовали в журнале Nature Machine Intelligence работу, в которой оценили возможность задействовать модели глубокого обучения (deep learning), исходно предназначенные для лингвистического анализа.

Глубокое обучение — разновидность машинного обучения на основе нейронных сетей. Оно называется глубоким, поскольку структура его сетей состоит из нескольких входных, выходных и расположенных между ними скрытых слоев нейронов. Авторы новой публикации рассмотрели как сильные стороны этого подхода, так и его недостатки.

«Полученные с помощью молекулярной биологии данные можно представить в виде языка (по сути, языка генов/белков) таким образом, что последовательность гена или белка окажется чем-то вроде имеющего определенный смысл предложения на естественном языке», — рассказал один из авторов, Тунча Доган (Tunca Dogan). Он считает, что значение такого «языка белков» сводится к особым биологическим, физическим и химическим свойствам этих биомолекул.

«В соответствии с этим работа ставила своей целью построение моделей машинного обучения, которые используют заимствованное у языковых моделей векторное представление в многомерном пространстве (high dimensional numerical embeddings. — Прим. ред.) для белков в качестве данных на входе и которые точно предсказывают их функциональные свойства».

Чтобы успешно оценить модели «белкового языка» и их показатели качества, исследователям пришлось для начала подготовить большие наборы надежных данных. Каждый из таких наборов имеет определенный «уровень сложности».

С помощью этого метода турецкие ученые смогли оценить пригодность разных архитектур «языкового моделирования» (включая BERT, T5, XLNet и ELMO) для выявления в последовательности белков скрытых паттернов. Исследователи считают, что эти незаметные на первый взгляд свойства последовательностей дают ценную информацию о функциональных признаках белков.

«Вероятно, самым примечательным результатом стало то, что эти модели глубокого обучения смогли успешно установить функциональные свойства белков, руководствуясь исключительно последовательностью аминокислот, хотя это довольно трудная задача. К тому же это хорошо согласуется с результатами других недавних исследований по предсказанию структуры (например, AlphaFold2 от Deepmind и RoseTTAFold от лаборатории Бейкера), в которых в качестве исходных данных использовали именно последовательность», — добавил Доган.

Новый подход и подобные ему методики могут иметь множество практических приложений, включая разработку персонализированных методов лечения.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
28 марта, 15:51
Максим Абдулаев

Морские биологи впервые детально задокументировали процесс родов у диких кашалотов. Анализ видеозаписей и акустических сигналов показал, что самки из разных родственных линий временно объединяются, чтобы по очереди выталкивать новорожденного на поверхность для дыхания. Это первое доказательство взаимопомощи при родах между неродственными особями у видов, не относящихся к приматам.

30 марта, 10:00
КБГУ

Ученые Кабардино-Балкарского государственного университета им. Х.М. Бербекова более десяти лет изучают уникальные свойства кефирных зерен — природных симбиотических сообществ микроорганизмов, собранных в высокогорных районах Кавказа. Исследования показывают, они могут стать основой для новых методов лечения кишечных заболеваний, восстановления иммунитета и даже создания космического питания.

30 марта, 08:00
Evgenia Vavilova

Квантовые эффекты помогают ученым во множестве сфер, но работать с ними не просто — степень определенности квантового мира концептуально отличается от того, что существует в классической физике. Чтобы подтвердить, что они работают с нужными квантовыми состояниями, физикам приходится постараться.

28 марта, 15:51
Максим Абдулаев

Морские биологи впервые детально задокументировали процесс родов у диких кашалотов. Анализ видеозаписей и акустических сигналов показал, что самки из разных родственных линий временно объединяются, чтобы по очереди выталкивать новорожденного на поверхность для дыхания. Это первое доказательство взаимопомощи при родах между неродственными особями у видов, не относящихся к приматам.

28 марта, 13:28
Игорь Байдов

Во время нейроанатомического исследования тканей полового члена ученые выявили высокую плотность нервных окончаний в области, которую анатомы и хирурги долгое время оставляли без должного внимания. Авторы научной работы предположили, что эта зона может играть важную роль в формировании сексуальных ощущений, и допустили, что именно там у мужчин находится аналог так называемой «точки G».

30 марта, 10:00
КБГУ

Ученые Кабардино-Балкарского государственного университета им. Х.М. Бербекова более десяти лет изучают уникальные свойства кефирных зерен — природных симбиотических сообществ микроорганизмов, собранных в высокогорных районах Кавказа. Исследования показывают, они могут стать основой для новых методов лечения кишечных заболеваний, восстановления иммунитета и даже создания космического питания.

19 марта, 10:58
Игорь Байдов

В парках некоторых стран все чаще можно заметить странную картину: синицы и воробьи вместо пуха и веточек приносят в клювах сигаретные окурки. Орнитологи из Польши решили выяснить, зачем птицы выстилают гнезда мусором, пропитанным никотином. Оказалось, пернатые нашли способ использовать вредную человеческую привычку для защиты своего потомства. Но, как это часто бывает в природе, у медали есть обратная сторона.

19 марта, 12:41
Игорь Байдов

Марсоход «Персеверанс» обнаружил в камнях на кромке кратера Езеро спектральные признаки минерала корунда, из которого на Земле образуются рубины и сапфиры. Такие спектры на Красной планете зарегистрировали впервые. Теперь ученые пытаются понять, при каких процессах он мог там сформироваться, ведь условия на Марсе заметно отличаются от тех, в которых корунд обычно образуется на Земле.

18 марта, 10:35
Илья Гриднев

За 10 лет лежания в почве сигаретные фильтры не растворились, а лишь замаскировались под грязь. Их пластиковые волокна распались на микрочастицы, намертво склеились с минералами и превратились во вторичный микропластик. Более того, на пятом году гниения мусор начал отравлять землю с новой силой.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно