Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Глубокое машинное обучение использует «язык белков», чтобы предсказать их свойства
Модели глубокого обучения (deep learning) хорошо зарекомендовали себя при работе с текстами и речью. Однако они также эффективны для решения задач молекулярной биологии и биомедицины, в том числе предсказания функциональных свойств белков на основе их аминокислотной последовательности.
На протяжении многих лет биоинформатики, генетики, нейрофизиологи и другие специалисты в области наук о живом продолжают выяснять биологические функции генов и их продуктов — белков. Для этого им приходится использовать большие и порой имеющие сложную структуру данные, с которыми просто невозможно справиться без помощи машинного обучения и анализа данных.
Напомним, белки — это крупные биологические молекулы со сложной структурой. Они представляют собой длинные цепочки (полимеры), состоящие из множества связанных звеньев-аминокислот (мономеров). Белки могут выполнять самые различные и очень специфичные функции — от формирования «клеточного скелета» до катализа химических реакций, работы в качестве «молекулярных машин» и регуляции различных биологических процессов. Это возможно благодаря их особой трехмерной структуре, которая, в свою очередь, определяется именно аминокислотной последовательностью белка.
В то же время установить связь между аминокислотной последовательностью, структурой белка и его функциями — непростая и пока далеко не решенная задача. Поэтому исследователи из трех различных университетов Турции опубликовали в журнале Nature Machine Intelligence работу, в которой оценили возможность задействовать модели глубокого обучения (deep learning), исходно предназначенные для лингвистического анализа.
Глубокое обучение — разновидность машинного обучения на основе нейронных сетей. Оно называется глубоким, поскольку структура его сетей состоит из нескольких входных, выходных и расположенных между ними скрытых слоев нейронов. Авторы новой публикации рассмотрели как сильные стороны этого подхода, так и его недостатки.
«Полученные с помощью молекулярной биологии данные можно представить в виде языка (по сути, языка генов/белков) таким образом, что последовательность гена или белка окажется чем-то вроде имеющего определенный смысл предложения на естественном языке», — рассказал один из авторов, Тунча Доган (Tunca Dogan). Он считает, что значение такого «языка белков» сводится к особым биологическим, физическим и химическим свойствам этих биомолекул.
«В соответствии с этим работа ставила своей целью построение моделей машинного обучения, которые используют заимствованное у языковых моделей векторное представление в многомерном пространстве (high dimensional numerical embeddings. — Прим. ред.) для белков в качестве данных на входе и которые точно предсказывают их функциональные свойства».
Чтобы успешно оценить модели «белкового языка» и их показатели качества, исследователям пришлось для начала подготовить большие наборы надежных данных. Каждый из таких наборов имеет определенный «уровень сложности».
С помощью этого метода турецкие ученые смогли оценить пригодность разных архитектур «языкового моделирования» (включая BERT, T5, XLNet и ELMO) для выявления в последовательности белков скрытых паттернов. Исследователи считают, что эти незаметные на первый взгляд свойства последовательностей дают ценную информацию о функциональных признаках белков.
«Вероятно, самым примечательным результатом стало то, что эти модели глубокого обучения смогли успешно установить функциональные свойства белков, руководствуясь исключительно последовательностью аминокислот, хотя это довольно трудная задача. К тому же это хорошо согласуется с результатами других недавних исследований по предсказанию структуры (например, AlphaFold2 от Deepmind и RoseTTAFold от лаборатории Бейкера), в которых в качестве исходных данных использовали именно последовательность», — добавил Доган.
Новый подход и подобные ему методики могут иметь множество практических приложений, включая разработку персонализированных методов лечения.
Хотя лед кажется простым веществом, причина, по которой он настолько скользкий, до сих пор оставалась предметом споров. Недавно физики показали, что при движении по льду трение слегка нагревает его поверхность. Это приводит к образованию тончайшей пленки воды, которая действует как смазка. Некоторые детали этого механизма ученым еще предстоит уточнить.
Исследователи впервые испытали на человеке новую технологию медицинской визуализации — магнитно-частичную томографию (MPI). С ее помощью они смогли в реальном времени наблюдать движение крови по венам руки. Метод работает без рентгеновского излучения и может стать более безопасной альтернативой традиционной сосудистой ангиографии.
Бонобо ничуть не менее агрессивны, чем шимпанзе, пришли к выводу авторы нового исследования. Однако между видами все же есть существенные различия в проявлении агрессии между полами: у бонобо самки чаще нападают на самцов, в то время как у шимпанзе, наоборот, самцы более агрессивны по отношению к самкам.
Хотя лед кажется простым веществом, причина, по которой он настолько скользкий, до сих пор оставалась предметом споров. Недавно физики показали, что при движении по льду трение слегка нагревает его поверхность. Это приводит к образованию тончайшей пленки воды, которая действует как смазка. Некоторые детали этого механизма ученым еще предстоит уточнить.
Отдельные аспекты полового поведения живых организмов порой могут оказывать огромное влияние на пищевые цепочки и целые экосистемы. Ученые на примере североамериканских рыб доказали, что агрессивное половое поведение их самцов может помочь в выживании зоопланктона.
Археологи обнаружили на стенах гробниц египетской знати в Долине царей надписи на древних индийских языках. Эти граффити оставили путешественники из Южной Азии, посещавшие Египет в начале первого тысячелетия нашей эры, когда он был провинцией Римской империи. Находки подтвердили, что Долина царей уже в те времена была популярным туристическим аттракционом.
В ноябре 2025 года при взлете российской ракеты с Байконура к МКС с существенной высоты упала кабина обслуживания 8У216. Поскольку в 2010-х годах из экономии средств у нас отказались от дублирования стартовых площадок, это создало ситуацию временной невозможности пилотируемых полетов. Теперь, всего через три месяца после происшествия, «Роскосмос» смог решить проблему, поставив запасную кабину обслуживания, найденную на складах Минобороны. Весенние пуски к МКС, запланированные ранее, теперь имеют шансы пройти в срок.
Одна сторона сыплет более дорогими и сложными баллистическими ракетами, другая — относительно дешевыми крылатыми. Но при этом первая на порядок беднее второй. А что у них с технологическим уровнем для наземной войны, и почему, кстати, глава второй избегает даже самого этого слова? Попробуем разобраться в реальных возможностях военных машин сторон потенциально самого опасного конфликта 2026 года.
В той части Пиренеев, которые находятся на территории Испании, исследователи обнаружили первые доказательства добычи золота в эпоху Римской империи. На месте древних рудников нашли сложные гидравлические сооружения и остатки водохранилища, возраст которых определили с помощью метода оптического датирования. Открытие прольет свет на инженерные приемы римлян и поставит точку в многолетнем споре: действительно ли римляне добывали золото в этом регионе.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Последние комментарии