Школьники поставили нейросеть в тупик
Ученые из Сколтеха и их коллеги рассказали, как образовательный проект для школьников вылился в новую главу противостояния искусственного интеллекта и человека в биоинформатике. Согласно исследованию, ранее совершившая прорыв в предсказании структур белков программа, разработанная подразделением Google DeepMind, не способна решить другую задачу структурной биоинформатики. При этом было получено свидетельство, которое всерьез ставит под вопрос гипотезу о том, что ИИ смог «выучить физику» белков.
Результаты представлены в статье, недавно опубликованной в журнале PLOS One. Структурная биоинформатика — научная область, в которой предсказываются структуры белков, РНК, ДНК и их взаимодействия с другими молекулами. Полученные знания ложатся в основу разработки лекарств или, например, белков — катализаторов реакций, не встречающихся в живой природе.
Последние годы в структурной биоинформатике развернулось противостояние человека и машины: вызов ученым бросил игровой искусственный интеллект компании DeepMind. С тех пор как в 2014 году ее приобрел Google, программы DeepMind показали выдающиеся результаты среди прочего в шахматах, го и StarCraft II и в итоге добрались до вполне реальной задачи предсказания структуры белков по аминокислотной последовательности.
Искусственный интеллект AlphaFold оказался столь успешен в решении этой проблемы, что к 2021 году многие стали всерьез пророчить конец структурной биоинформатики. Казалось, машине удалось выучить саму фундаментальную физику белка, и теперь ей должны автоматически покориться остальные задачи в этой области.
«Мы решили проверить, так ли это, и применили AlphaFold к другой типичной для нашей науки задаче — предсказанию изменения стабильности белка вследствие одиночной мутации. То есть вы берете некоторый известный белок, вносите в него минимально возможное изменение и хотите знать, полученный мутант будет стабильнее или нестабильнее и насколько. Так вот, с этой задачей AlphaFold не справился: предсказания никак не согласуются с известными экспериментальными данными. Собственно, его создатели и не утверждали, что AlphaFold пригоден для чего-то, кроме предсказания структуры белков по аминокислотной последовательности, но ряд оптимистов ожидали прорыва и здесь — мы же показали обратное», — прокомментировал исследование его научный руководитель, старший преподаватель Центра молекулярной и клеточной биологии Сколтеха Дмитрий Иванков.
С практической точки зрения предсказывать изменение стабильности белка после мутации важно: например, чтобы перебором мутаций находить устойчивые к высоким температурам варианты белков с полезными свойствами. Это может быть, к примеру, белок для стирального порошка, который будет расщеплять разного рода загрязнения — другие белки, жиры, крахмал, микроворсинки, — или сладкий белок, который можно было бы положить в горячий чай вместо сахара.
Но здесь важно в том числе само по себе заключение авторов статьи, что в существующем сегодня виде ИИ не панацея. Хотя он отлично справился с важнейшей проблемой структурной биоинформатики, которая занимала ученых больше полувека, остается еще с десяток нерешенных проблем. Например, предсказание структур комплексов белков с малыми молекулами, ДНК или РНК, мутаций в белке и их влияния на энергию связывания с другими молекулами, белковый дизайн: какая нужна последовательность, чтобы сделать белок с некоторыми желаемыми свойствами, допустим, катализатор, который может стать элементом крошечной «молекулярной фабрики».
Помимо очевидного вывода, что структурную биологию рано «закрывать», исследование косвенно опровергает гипотезу, что AlphaFold не просто усвоил все накопленные человечеством структуры белков и ловко ими оперирует, но и смог каким-то образом выучить саму фундаментальную физику белков. Этим порой объясняли его успех, однако, будь это так, программе не составило бы труда сопоставить две очень похожие структуры с точки зрения стабильности, а именно это оказалось ИИ не под силу.
Этот довод дополняет два ранее озвученных сомнения касательно «знания физики». Во-первых, AlphaFold предсказывает некоторые структуры, у которых боковые группы ориентированы так, будто к ним привязан ион цинка. Но программа получает на вход только аминокислотную последовательность белка, то есть «незримый цинк» в результатах ощущается, поскольку в обучающих данных были аналогичные структуры белков, связанные с этим ионом.
Без него предсказанная ориентация боковых групп физически некорректна. Во-вторых AlphaFold предсказывает одиночную структуру витиеватой цепи, которая выглядит для ученого правдоподобно, но лишь если мысленно достроить еще две такие же цепи и переплести их вместе, иначе эта конструкция, опять же, несостоятельна с точки зрения физики. То есть программа запомнила и воспроизвела соответствующую структуру, которую вычленила из составной конструкции, — законами физики она себя при этом не ограничивает.
«Занятно, что наше исследование выросло из „игрушечного“ проекта с участниками Школы молекулярной и теоретической биологии. Проект так и назывался: „Игры с АльфаФолд“. Как только AlphaFold был выложен в открытый доступ, мы в нашей лаборатории установили его на сколтеховский суперкомпьютер „Жорес“. Одна из игр заключалась в сопоставлении эффекта мутации с предсказаниями AlphaFold для структуры исходного и мутантного белка. Так и получилось исследование, в котором школьники соприкоснулись с суперкомпьютером и передовым искусственным интеллектом», — рассказала первый автор статьи, аспирант Сколтеха Марина Пак.
Помимо биоинформатиков из Сколтеха, в исследовании участвовали ученые из Института науки и технологий Австрии и Окинавского института науки и технологий (Япония), а также школьники, которые сейчас учатся в Российском университете дружбы народов, Уральском федеральном университете и Западноамериканском колледже объединенного мира имени Арманда Хаммера (США).
В Университете МИСИС усовершенствовали технологию нанесения защитных электропроводящих покрытий на медные изделия, широко используемые в качестве элементов скользящих электроконтактов, например, в токосъемниках. Метод увеличивает прочность соединения покрытий с подложкой на 17%.
Ученые нашли признак, который позволяет точно оценить пластичность органических кристаллов, востребованных в устройствах гибкой электроники и робототехнике. Ранее считалось, что хорошо гнутся материалы со слоистой структурой, где молекулы внутри слоя связаны крепко, а между слоями — слабо. Оказалось, что этих требований недостаточно и важно учитывать также энергию, которую нужно затратить на то, чтобы сдвинуть слои друг относительно друга — чем она ниже, тем материал более гибкий. Открытие упростит проектирование и создание органических кристаллов с заданными свойствами.
Нейробиологи СПбГУ продемонстрировали, что активация рецептора следовых аминов TAAR1 эффективно подавляет агрессивное поведение, вызванное полным отсутствием серотонина в мозге. В дальнейшем этот результат поможет в разработке лекарственных препаратов, направленных на коррекцию патологических форм агрессии, возникающих при посттравматическом стрессовом расстройстве (ПТСР) и шизофрении.
Метеорный поток Эта-Аквариды достигнет своего максимума в ночь с 5 на 6 мая. Его частицы — осколки самой знаменитой кометы в истории, которая появляется над Землей раз в 76 лет. Ученый Пермского Политеха рассказал, как этот звездопад связан с кометой Галлея, почему у него есть «брат-близнец» и где лучше всего за ним наблюдать.
В корпорациях, спорте и учебе люди часто сталкиваются с задачами, с которыми не справиться в одиночку. В таких случаях важную роль играет правильный подбор команды. Доцент факультета экономических наук НИУ ВШЭ Татьяна Майская вместе с коллегами из зарубежных университетов исследовала свойства команд и показала, что однородные команды лучше подходят для задач, где важен высокий средний результат, а разнообразные по составу — там, где критично избежать провала.
Ученые Санкт-Петербургского государственного университета уточнили описание вторично морских тихоходок. Удалось доказать существование двух видов организмов в Белом, Баренцевом, Карском морях и море Лаптевых, а также поставить под сомнение, что еще три вида того же семейства представляют собой разные.
В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.
Когда международная экспедиционная группа, исследующая море Уэдделла в Антарктиде на борту ледокола «Поларштерн», попыталась укрыться от шторма, ученые и экипаж судна удивились внезапному появлению острова, не обозначенного ни на одной морской карте.
Химические связи в материале, из которого сделана электроника, разрываются не из-за накопительного износа от протекания тока через них, а из-за электронов с конкретной энергией.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
