20.04.2022, 09:30

Михаил Орлов

Глубокое машинное обучение использует «язык белков», чтобы предсказать их свойства

❋ 5.5

Модели глубокого обучения (deep learning) хорошо зарекомендовали себя при работе с текстами и речью. Однако они также эффективны для решения задач молекулярной биологии и биомедицины, в том числе предсказания функциональных свойств белков на основе их аминокислотной последовательности.

Биология

# белки

# биоинформатика

# биохимия

# глубокое обучение

# машинное обучение

Глубокое обучение использует последовательность аминокислот, чтобы предсказать структуру и функции белков / © Unsal et al. / Автор: Milonia Larcius

На протяжении многих лет биоинформатики, генетики, нейрофизиологи и другие специалисты в области наук о живом продолжают выяснять биологические функции генов и их продуктов — белков. Для этого им приходится использовать большие и порой имеющие сложную структуру данные, с которыми просто невозможно справиться без помощи машинного обучения и анализа данных.

Напомним, белки — это крупные биологические молекулы со сложной структурой. Они представляют собой длинные цепочки (полимеры), состоящие из множества связанных звеньев-аминокислот (мономеров). Белки могут выполнять самые различные и очень специфичные функции — от формирования «клеточного скелета» до катализа химических реакций, работы в качестве «молекулярных машин» и регуляции различных биологических процессов. Это возможно благодаря их особой трехмерной структуре, которая, в свою очередь, определяется именно аминокислотной последовательностью белка.

В то же время установить связь между аминокислотной последовательностью, структурой белка и его функциями — непростая и пока далеко не решенная задача. Поэтому исследователи из трех различных университетов Турции опубликовали в журнале Nature Machine Intelligence работу, в которой оценили возможность задействовать модели глубокого обучения (deep learning), исходно предназначенные для лингвистического анализа.

Глубокое обучение — разновидность машинного обучения на основе нейронных сетей. Оно называется глубоким, поскольку структура его сетей состоит из нескольких входных, выходных и расположенных между ними скрытых слоев нейронов. Авторы новой публикации рассмотрели как сильные стороны этого подхода, так и его недостатки.

«Полученные с помощью молекулярной биологии данные можно представить в виде языка (по сути, языка генов/белков) таким образом, что последовательность гена или белка окажется чем-то вроде имеющего определенный смысл предложения на естественном языке», — рассказал один из авторов, Тунча Доган (Tunca Dogan). Он считает, что значение такого «языка белков» сводится к особым биологическим, физическим и химическим свойствам этих биомолекул.

«В соответствии с этим работа ставила своей целью построение моделей машинного обучения, которые используют заимствованное у языковых моделей векторное представление в многомерном пространстве (high dimensional numerical embeddings. — Прим. ред.) для белков в качестве данных на входе и которые точно предсказывают их функциональные свойства».

Чтобы успешно оценить модели «белкового языка» и их показатели качества, исследователям пришлось для начала подготовить большие наборы надежных данных. Каждый из таких наборов имеет определенный «уровень сложности».

С помощью этого метода турецкие ученые смогли оценить пригодность разных архитектур «языкового моделирования» (включая BERT, T5, XLNet и ELMO) для выявления в последовательности белков скрытых паттернов. Исследователи считают, что эти незаметные на первый взгляд свойства последовательностей дают ценную информацию о функциональных признаках белков.

«Вероятно, самым примечательным результатом стало то, что эти модели глубокого обучения смогли успешно установить функциональные свойства белков, руководствуясь исключительно последовательностью аминокислот, хотя это довольно трудная задача. К тому же это хорошо согласуется с результатами других недавних исследований по предсказанию структуры (например, AlphaFold2 от Deepmind и RoseTTAFold от лаборатории Бейкера), в которых в качестве исходных данных использовали именно последовательность», — добавил Доган.

Новый подход и подобные ему методики могут иметь множество практических приложений, включая разработку персонализированных методов лечения.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Биофизик, магистр биологии. Пишет о границах живого и неживого, сложных молекулах и простых ответах природы. Ведёт канал AreaDNA в Telegram.

Биология

# белки

# биоинформатика

# биохимия

# глубокое обучение

# машинное обучение

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Проблематики: кто ты, древний незнакомец?

Центр «Архэ»

Онлайн

Лекция

15 Июл

Бесплатно

Мы зря выделяли суффиксы

Библиотека им. Н. А. Некрасова

Москва

Экскурсия

15 Июл

500 ₽

«Союз» — «Аполлон» — рукопожатие в космосе

Политехнический музей

Москва

Лекция

15 Июл

Бесплатно

Хрустальные ночи Арктики: судьбы ледоколов и свет звезд

Библиотека Планетарий 1

Санкт-Петербург

Лекция

16 Июл

750 ₽

Солнце крупным планом

Санкт-Петербургский Планетарий

Санкт-Петербург

Кинолекторий

16 Июл

Бесплатно

Дальневосточная одиссея Владимира Арсеньева

Российская государственная библиотека

Москва

Лекция

17 Июл

Бесплатно

Нейробиологические основы депрессии

Парк «Зарядье»

Москва

Лекция

17 Июл

Бесплатно

Изыскатели железнодорожных и морских путей Африки

Библиотека иностранной литературы

Москва

Лекция

17 Июл

Бесплатно

Архетипы в африканских мифах

Библиотека иностранной литературы

Москва

Популярное

За сутки

За неделю

За месяц

12 июля, 22:10

Редакция Naked Science

Научно-фантастические сериалы лета, на которые стоит обратить внимание

Лето 2025 обещает насыщенную линейку научно-фантастических сериалов на ведущих стриминговых платформах. От адаптаций культовых романов до масштабных космических одиссей — мы отобрали проекты, на которые стоит обратить внимание.

Sci-Fi

# «Звездный путь»

# научная фантастика

# сериалы

13 июля, 10:01

Evgenia Vavilova

Физики протестировали новый тип безопасного для глаз лазера

Американские ученые сообщили об успешной фотонакачке фотонно-кристаллического поверхностно-излучающего лазера c захороненным диэлектриком на безопасной для глаз длине волны при комнатной температуре. Это новый этап в развитии лазерных технологий.

Физика

# Face ID

# LiDAR

# диэлектрики

# лазер

# оптика

# фотонный кристалл

13 июля, 11:11

Людмила Соколова

Млечный Путь окружили «осиротевшие» галактики, скрытые от телескопов

Галактики — спутники Млечного Пути преимущественно представляют собой карликовые сфероидальные системы. Астрономам известно о существовании примерно 60 таких объектов, однако результаты нового исследования показали, что вокруг нашей Галактики могут вращаться до 100 «пропавших» спутников.

Астрономия

# галактики-спутники

# компьютерное моделирование

# Млечный путь

# стандартная космологическая модель

# темная материя

# эволюция галактик

12 июля, 22:10

Редакция Naked Science

Научно-фантастические сериалы лета, на которые стоит обратить внимание

Sci-Fi

# «Звездный путь»

# научная фантастика

# сериалы

11 июля, 17:47

Денис Яковлев

Ученые определили оптимальную длительность физической активности, которая продлевает жизнь на треть

Международная команда ученых оценила связь между длительностью физической активности, ее интенсивностью, риском смерти от всех причин и вероятностью развития сердечно-сосудистых и онкологических заболеваний.

Медицина

# ЗОЖ

# онкологические заболевания

# сердечно-сосудистые болезни

# смертность

# спорт

7 июля, 10:59

Губкинский университет

Российские ученые нашли способ добывать водород с помощью газа со свалок

Ученые разработали высокоэффективный платина-кобальтовый катализатор для производства водорода из метана. Сырьем может стать возобновляемый источник — биогаз, образующийся на свалках при разложении органики, что позволит получить «зеленый» водород. Открытие совершила команда исследователей из РГУ нефти и газа имени И.М. Губкина, Института нефтехимического синтеза имени А.В. Топчиева РАН и Института общей и неорганической химии имени Н.С. Курнакова РАН.

Губкинский университет

# биогаз

# водород

# катализатор

# метан

# свалка

# топливо

17 июня, 16:49

Адель Романова

Давно отключенный спутник внезапно прислал «громкий» радиосигнал

Радиотелескопы уловили очень короткий сигнал, и по его характеристикам стало ясно, что он не может быть естественного происхождения. Астрономы пришли к выводу, что источник находился в околоземном пространстве — там, где уже более полувека летает «мертвый» аппарат NASA.

Астрономия

# космический мусор

# космос

# радиосигналы

# спутники

25 июня, 15:19

ФизТех

Российские ученые впервые точно определили источники шума сверхзвукового самолета с помощью суперкомпьютера

Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.

ФизТех

# «Суперджет»

# самолет

# сверхзвуковой

# суперкомпьютеры

# Шум

2 июля, 11:17

Юлия Тарасова

Коров покормили отходами конопли и проверили их молоко на психоактивность

Результаты эксперимента в США в будущем могут позволить добиться разрешения на использование отработанной конопли в качестве кормовой добавки в животноводстве.

Биология

# животноводство

# конопля

# корм

# коровы

# молоко

# ТГК

# тетрагидроканнабинол

[miniorange_social_login]

Глубокое машинное обучение использует «язык белков», чтобы предсказать их свойства

По теме

Сенсорные нанопоры распознали единичные молекулы белков

Глубоководные рыбы приспособились к давлению на молекулярном уровне

Глубокое обучение поможет создавать белки с новыми функциями

Популярное

Комментарии

Последние новости:

Млечный Путь окружили «осиротевшие» галактики, скрытые от телескопов

Физики протестировали новый тип безопасного для глаз лазера

Научно-фантастические сериалы лета, на которые стоит обратить внимание

На Кеннеди-младшего подали в суд из-за изменения политики вакцинации

Полет фантазии: заменит ли орбитальное базирование боеголовок современные МБР?

«Отвратительная тайна эволюции»: что стало известно о самом древнем цветке

Иран и Израиль — дойдет ли дело до ядерного оружия?

Трамп и Маск разругались: сорвет ли это высадку на Луну и как отразится на России?

Последние комментарии

Самые обсуждаемые

За месяц «ВКонтакте» покинули больше миллиона авторов

Люди с высоким уровнем интеллекта оказались менее нравственными

Ученые определили оптимальную длительность физической активности, которая продлевает жизнь на треть

«Возродившая лютоволка» компания решила воскресить птицу моа