20.04.2022, 09:30

Михаил Орлов

1,7 тыс

Глубокое машинное обучение использует «язык белков», чтобы предсказать их свойства

❋ 5.5

Модели глубокого обучения (deep learning) хорошо зарекомендовали себя при работе с текстами и речью. Однако они также эффективны для решения задач молекулярной биологии и биомедицины, в том числе предсказания функциональных свойств белков на основе их аминокислотной последовательности.

Биология

# белки

# биоинформатика

# биохимия

# глубокое обучение

# машинное обучение

Глубокое обучение использует последовательность аминокислот, чтобы предсказать структуру и функции белков / © Unsal et al. / Автор: Milonia Larcius

На протяжении многих лет биоинформатики, генетики, нейрофизиологи и другие специалисты в области наук о живом продолжают выяснять биологические функции генов и их продуктов — белков. Для этого им приходится использовать большие и порой имеющие сложную структуру данные, с которыми просто невозможно справиться без помощи машинного обучения и анализа данных.

Напомним, белки — это крупные биологические молекулы со сложной структурой. Они представляют собой длинные цепочки (полимеры), состоящие из множества связанных звеньев-аминокислот (мономеров). Белки могут выполнять самые различные и очень специфичные функции — от формирования «клеточного скелета» до катализа химических реакций, работы в качестве «молекулярных машин» и регуляции различных биологических процессов. Это возможно благодаря их особой трехмерной структуре, которая, в свою очередь, определяется именно аминокислотной последовательностью белка.

В то же время установить связь между аминокислотной последовательностью, структурой белка и его функциями — непростая и пока далеко не решенная задача. Поэтому исследователи из трех различных университетов Турции опубликовали в журнале Nature Machine Intelligence работу, в которой оценили возможность задействовать модели глубокого обучения (deep learning), исходно предназначенные для лингвистического анализа.

Глубокое обучение — разновидность машинного обучения на основе нейронных сетей. Оно называется глубоким, поскольку структура его сетей состоит из нескольких входных, выходных и расположенных между ними скрытых слоев нейронов. Авторы новой публикации рассмотрели как сильные стороны этого подхода, так и его недостатки.

«Полученные с помощью молекулярной биологии данные можно представить в виде языка (по сути, языка генов/белков) таким образом, что последовательность гена или белка окажется чем-то вроде имеющего определенный смысл предложения на естественном языке», — рассказал один из авторов, Тунча Доган (Tunca Dogan). Он считает, что значение такого «языка белков» сводится к особым биологическим, физическим и химическим свойствам этих биомолекул.

«В соответствии с этим работа ставила своей целью построение моделей машинного обучения, которые используют заимствованное у языковых моделей векторное представление в многомерном пространстве (high dimensional numerical embeddings. — Прим. ред.) для белков в качестве данных на входе и которые точно предсказывают их функциональные свойства».

Чтобы успешно оценить модели «белкового языка» и их показатели качества, исследователям пришлось для начала подготовить большие наборы надежных данных. Каждый из таких наборов имеет определенный «уровень сложности».

С помощью этого метода турецкие ученые смогли оценить пригодность разных архитектур «языкового моделирования» (включая BERT, T5, XLNet и ELMO) для выявления в последовательности белков скрытых паттернов. Исследователи считают, что эти незаметные на первый взгляд свойства последовательностей дают ценную информацию о функциональных признаках белков.

«Вероятно, самым примечательным результатом стало то, что эти модели глубокого обучения смогли успешно установить функциональные свойства белков, руководствуясь исключительно последовательностью аминокислот, хотя это довольно трудная задача. К тому же это хорошо согласуется с результатами других недавних исследований по предсказанию структуры (например, AlphaFold2 от Deepmind и RoseTTAFold от лаборатории Бейкера), в которых в качестве исходных данных использовали именно последовательность», — добавил Доган.

Новый подход и подобные ему методики могут иметь множество практических приложений, включая разработку персонализированных методов лечения.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Биология

# белки

# биоинформатика

# биохимия

# глубокое обучение

# машинное обучение

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

В пользу народного здравия. Как лечили за Невской заставой

Библиотека Планетарий 1

Санкт-Петербург

Лекция

25 Ноя

900 ₽

Парнокопытные: разнообразие травоядных и всеядных

Центр «Архэ»

Москва

Лекция

25 Ноя

1200 ₽

Чума, война и предательства: 10 уроков стоицизма от императора Марка Аврелия

ВСмысле

Санкт-Петербург

Лекция

25 Ноя

1200 ₽

Двоюродные братья и главные враги динозавров: эволюция крокодилов

Medio Modo

Москва

Лекция

25 Ноя

750 ₽

Опричный кризис (1560-е—1584 гг.)

Центр «Архэ»

Онлайн

Московский Планетарий

Москва

ВСмысле

Санкт-Петербург

Лекция

26 Ноя

1400 ₽

Оптическая астрономия

Центр «Архэ»

Москва

Лекция

27 Ноя

Бесплатно

От истерии до нейромодуляции: 200 лет пути в понимании двигательных расстройств

Нейрокампус

Москва

Популярное

За сутки

За неделю

За месяц

23 ноября, 11:08

Максим Абдулаев

Соцсети помогли биологам узнать, на каких насекомых кошки охотятся чаще всего

Бразильские зоологи выяснили, каких именно насекомых и пауков ловят домашние кошки в городах. Для этого использовали не полевые наблюдения, а анализ социальных сетей. Просмотрев более 17 000 видео и фото в TikTok и на фотостоке iStock, ученые нашли 550 записей кошачьей охоты. Самая частая добыча — кузнечики, сверчки, цикады и тараканы.

Биология

# кошки

# насекомые

# охота

# соцсети

24 ноября, 08:30

Любовь С.

Ученые объяснили, почему пауки рода Clubiona не замерзают зимой

Чтобы охотиться при температурах ниже нуля, пауки рода Clubiona выработали особые белки-антифризы. Изучив членистоногих, собранных в грушевых садах неподалеку от города Брно (Чехия), ученые раскрыли молекулярный механизм, позволяющий этим паукам не впадать в зимнюю спячку.

Биология

# белок

# замерзание

# зима

# лед

# пауки

# транскриптом

23 ноября, 15:12

Любовь С.

Астрономы нашли редкую быстро растущую сверхмассивную черную дыру

Наблюдая за галактикой CANUCS-LRD-z8.6 с помощью космической обсерватории «Джеймс Уэбб», астрономы обнаружили в ее центре сверхмассивную черную дыру. Хотя она существовала всего через 500 миллионов лет после Большого взрыва, ее масса оказалась рекордной для столь ранней эпохи.

Астрономия

# Джеймс Уэбб

# квазары

# металличность

# ранняя вселенная

# сверхмассивные черные дыры

# спектральный анализ

20 ноября, 13:12

Полина Меньшова

Анализ 2430 языков показал сходства и различия их правил грамматики

Человеческие языки разнообразны, но это разнообразие ограничивается повторяющимися закономерностями. Пытаясь описать правила, которым подчиняются различия в грамматике, лингвисты сформулировали ряд так называемых грамматических универсалий — утверждений, предположительно верных для всех или большинства языков мира. Международная команда ученых провела статистический анализ на материале 2430 языков и обнаружила, что соответствующими действительности можно считать около трети таких утверждений.

Психология

# грамматика

# лингвистика

# морфология

# синтаксис

# языки

21 ноября, 10:02

ПНИПУ

Зумеры против альфа: сравнение цифровых привычек, мышления и жизненных стратегий

Так называемые зумеры и альфа, несмотря на молодой возраст, уже формируют ключевые поведенческие и потребительские тренды. Ученые Пермского Политеха рассказали, почему обозначение поколений начали с конца алфавита, как альфа и зумеры отличаются в способности к терпеливости, совмещении цифрового и реального «Я», подходу к профессиональной деятельности и отношении к финансам, какое мышление пришло на смену клиповому и как использование искусственного интеллекта повлияет на авторитет родителей.

ПНИПУ

# демография

# зумеры

# интернет

# молодежь

# общество

# подростки

# поколения

# теория поколений

23 ноября, 11:08

Максим Абдулаев

Соцсети помогли биологам узнать, на каких насекомых кошки охотятся чаще всего

Биология

# кошки

# насекомые

# охота

# соцсети

25 октября, 10:40

Любовь С.

Недалеко от Солнечной системы нашли потенциально обитаемую суперземлю

Проанализировав данные наблюдений, полученных с помощью наземных обсерваторий за последние два десятилетия, астрономы обнаружили потенциально обитаемый мир — суперземлю Gliese 251 c (GJ 251 с). Планета обращается вокруг красного карлика на расстоянии около 18 световых лет от Земли и считается одним из самых перспективных кандидатов для поисков жизни.

Астрономия

# звезды

# зона обитаемости

# красный карлик

# спектрограф

# Суперземля

# телескопы

20 ноября, 13:12

Полина Меньшова

Анализ 2430 языков показал сходства и различия их правил грамматики

Психология

# грамматика

# лингвистика

# морфология

# синтаксис

# языки

8 ноября, 18:29

Адель Романова

Астрономы вычислили, откуда на Землю прилетают межзвездные объекты

По расчетам, большинство «гостей» из других звездных систем летят к Земле примерно со стороны созвездия Геркулес. Скорее всего, они время от времени падают на нашу планету, просто мы еще не научились это замечать. Как удалось вычислить, чаще всего они должны падать зимой и где-то в окрестностях экватора.

Астрономия

# космос

# межзвездные объекты

# Солнечная система

[miniorange_social_login]

Глубокое машинное обучение использует «язык белков», чтобы предсказать их свойства

По теме

Сенсорные нанопоры распознали единичные молекулы белков

Глубоководные рыбы приспособились к давлению на молекулярном уровне

Глубокое обучение поможет создавать белки с новыми функциями

Популярное

Комментарии

Последние новости:

Ученые обнаружили «акценты» у львов из разных стран

Искусственный интеллект обретает здравомыслие: новый метод заставил нейросети сомневаться в своих ответах

Неандертальцы убили и съели женщин и детей из чужого племени

Ученые выяснили, как избежать выгорания студентов

Атомный квиз — разгоните нейтроны знаний!

Зажечь Солнце на Земле: как Россия в одиночку строит свой ИТЭР – интервью с Андреем Аникеевым

Огонь спуска с орбиты: миф о трении и вопрос с плазмой

Физики доказали, что Вселенная не может быть компьютерной симуляцией? Что здесь не так

Последние комментарии

Самые обсуждаемые

Древнее поселение в Казахстане оказалось крупным протогородским центром с промышленной зоной

«Яндекс» начал крупномасштабный эксперимент по поиску возможного сознания у искусственного интеллекта

Зумеры против альфа: сравнение цифровых привычек, мышления и жизненных стратегий

Анализ 2430 языков показал сходства и различия их правил грамматики