Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Глубокое машинное обучение использует «язык белков», чтобы предсказать их свойства
Модели глубокого обучения (deep learning) хорошо зарекомендовали себя при работе с текстами и речью. Однако они также эффективны для решения задач молекулярной биологии и биомедицины, в том числе предсказания функциональных свойств белков на основе их аминокислотной последовательности.
На протяжении многих лет биоинформатики, генетики, нейрофизиологи и другие специалисты в области наук о живом продолжают выяснять биологические функции генов и их продуктов — белков. Для этого им приходится использовать большие и порой имеющие сложную структуру данные, с которыми просто невозможно справиться без помощи машинного обучения и анализа данных.
Напомним, белки — это крупные биологические молекулы со сложной структурой. Они представляют собой длинные цепочки (полимеры), состоящие из множества связанных звеньев-аминокислот (мономеров). Белки могут выполнять самые различные и очень специфичные функции — от формирования «клеточного скелета» до катализа химических реакций, работы в качестве «молекулярных машин» и регуляции различных биологических процессов. Это возможно благодаря их особой трехмерной структуре, которая, в свою очередь, определяется именно аминокислотной последовательностью белка.
В то же время установить связь между аминокислотной последовательностью, структурой белка и его функциями — непростая и пока далеко не решенная задача. Поэтому исследователи из трех различных университетов Турции опубликовали в журнале Nature Machine Intelligence работу, в которой оценили возможность задействовать модели глубокого обучения (deep learning), исходно предназначенные для лингвистического анализа.
Глубокое обучение — разновидность машинного обучения на основе нейронных сетей. Оно называется глубоким, поскольку структура его сетей состоит из нескольких входных, выходных и расположенных между ними скрытых слоев нейронов. Авторы новой публикации рассмотрели как сильные стороны этого подхода, так и его недостатки.
«Полученные с помощью молекулярной биологии данные можно представить в виде языка (по сути, языка генов/белков) таким образом, что последовательность гена или белка окажется чем-то вроде имеющего определенный смысл предложения на естественном языке», — рассказал один из авторов, Тунча Доган (Tunca Dogan). Он считает, что значение такого «языка белков» сводится к особым биологическим, физическим и химическим свойствам этих биомолекул.
«В соответствии с этим работа ставила своей целью построение моделей машинного обучения, которые используют заимствованное у языковых моделей векторное представление в многомерном пространстве (high dimensional numerical embeddings. — Прим. ред.) для белков в качестве данных на входе и которые точно предсказывают их функциональные свойства».
Чтобы успешно оценить модели «белкового языка» и их показатели качества, исследователям пришлось для начала подготовить большие наборы надежных данных. Каждый из таких наборов имеет определенный «уровень сложности».
С помощью этого метода турецкие ученые смогли оценить пригодность разных архитектур «языкового моделирования» (включая BERT, T5, XLNet и ELMO) для выявления в последовательности белков скрытых паттернов. Исследователи считают, что эти незаметные на первый взгляд свойства последовательностей дают ценную информацию о функциональных признаках белков.
«Вероятно, самым примечательным результатом стало то, что эти модели глубокого обучения смогли успешно установить функциональные свойства белков, руководствуясь исключительно последовательностью аминокислот, хотя это довольно трудная задача. К тому же это хорошо согласуется с результатами других недавних исследований по предсказанию структуры (например, AlphaFold2 от Deepmind и RoseTTAFold от лаборатории Бейкера), в которых в качестве исходных данных использовали именно последовательность», — добавил Доган.
Новый подход и подобные ему методики могут иметь множество практических приложений, включая разработку персонализированных методов лечения.
Каждую весну оплодотворенные матки шмелей выходят из зимовки и основывают новые колонии. Но как они умудряются выжить, если во время «спячки» их подземное убежище часто подтапливают талые или дождевые воды? Первыми на этот вопрос в 2024 году ответила команда канадских биологов. Они выяснили, что шмели способны безопасно проводить под водой до недели. Теперь другая группа ученых решила выяснить, какой именно физиологический механизм стоит за этим феноменом.
Антиген стволовых клеток простаты (PSCA) — это белок, который участвует в патогенезе заболеваний предстательной железы. Его вторая роль касается развития болезни Альцгеймера и других неврологических патологий. Новая статья ученых из МФТИ и ИБХ РАН с соавторами описала структуру PSCA, его фармакологические свойства и участие в нейровоспалении, что поможет создать новые лекарства.
Существует мнение, что астронавты в космосе — «балласт». Но на практике в сложных условиях именно люди выполняют ключевую работу, а автоматы резко уступают им по возможностям. Поэтому научных работ по итогам лунных экспедиций людей было больше, чем по итогам работы на Луне всех автоматов за всю историю. Несмотря на это, существует серьезная вероятность того, что у нового американского средства доставки людей на Луну не будет возможности ручной посадки.
Коллектив климатологов из Института географии РАН, Института физики атмосферы имени А. М. Обухова РАН и МФТИ разобрал одну из самых загадочных страниц климатической летописи: почему Арктика так резко потеплела в первой половине XX века, причем особенно сильно зимой. Ученые оценили, какую долю в тех температурных скачках могли сыграть «внутренние ритмы» атмосферы и океана Северного полушария и почему ответ меняется в зависимости от того, как именно отделять естественные колебания климата от внешних факторов вроде роста парниковых газов и загрязнения воздуха аэрозолями.
Каждую весну оплодотворенные матки шмелей выходят из зимовки и основывают новые колонии. Но как они умудряются выжить, если во время «спячки» их подземное убежище часто подтапливают талые или дождевые воды? Первыми на этот вопрос в 2024 году ответила команда канадских биологов. Они выяснили, что шмели способны безопасно проводить под водой до недели. Теперь другая группа ученых решила выяснить, какой именно физиологический механизм стоит за этим феноменом.
Согласно гипотезе о так называемой Еврогондване, в эпоху динозавров Европа, как часть северного суперконтинента Лавразия, еще не полностью отделилась от южного суперконтинента Гондвана и животные могли свободно мигрировать между Европой и Африкой. Однако новый анализ найденных в Венгрии костей первобытного крокодила показал, что его сходство с гондванскими видами обусловлено не близким родством, а схожим образом жизни.
В ноябре 2025 года при взлете российской ракеты с Байконура к МКС с существенной высоты упала кабина обслуживания 8У216. Поскольку в 2010-х годах из экономии средств у нас отказались от дублирования стартовых площадок, это создало ситуацию временной невозможности пилотируемых полетов. Теперь, всего через три месяца после происшествия, «Роскосмос» смог решить проблему, поставив запасную кабину обслуживания, найденную на складах Минобороны. Весенние пуски к МКС, запланированные ранее, теперь имеют шансы пройти в срок.
Одна сторона сыплет более дорогими и сложными баллистическими ракетами, другая — относительно дешевыми крылатыми. Но при этом первая на порядок беднее второй. А что у них с технологическим уровнем для наземной войны, и почему, кстати, глава второй избегает даже самого этого слова? Попробуем разобраться в реальных возможностях военных машин сторон потенциально самого опасного конфликта 2026 года.
В той части Пиренеев, которые находятся на территории Испании, исследователи обнаружили первые доказательства добычи золота в эпоху Римской империи. На месте древних рудников нашли сложные гидравлические сооружения и остатки водохранилища, возраст которых определили с помощью метода оптического датирования. Открытие прольет свет на инженерные приемы римлян и поставит точку в многолетнем споре: действительно ли римляне добывали золото в этом регионе.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Последние комментарии