Школьники поставили нейросеть в тупик
Ученые из Сколтеха и их коллеги рассказали, как образовательный проект для школьников вылился в новую главу противостояния искусственного интеллекта и человека в биоинформатике. Согласно исследованию, ранее совершившая прорыв в предсказании структур белков программа, разработанная подразделением Google DeepMind, не способна решить другую задачу структурной биоинформатики. При этом было получено свидетельство, которое всерьез ставит под вопрос гипотезу о том, что ИИ смог «выучить физику» белков.
Результаты представлены в статье, недавно опубликованной в журнале PLOS One. Структурная биоинформатика — научная область, в которой предсказываются структуры белков, РНК, ДНК и их взаимодействия с другими молекулами. Полученные знания ложатся в основу разработки лекарств или, например, белков — катализаторов реакций, не встречающихся в живой природе.
Последние годы в структурной биоинформатике развернулось противостояние человека и машины: вызов ученым бросил игровой искусственный интеллект компании DeepMind. С тех пор как в 2014 году ее приобрел Google, программы DeepMind показали выдающиеся результаты среди прочего в шахматах, го и StarCraft II и в итоге добрались до вполне реальной задачи предсказания структуры белков по аминокислотной последовательности.
Искусственный интеллект AlphaFold оказался столь успешен в решении этой проблемы, что к 2021 году многие стали всерьез пророчить конец структурной биоинформатики. Казалось, машине удалось выучить саму фундаментальную физику белка, и теперь ей должны автоматически покориться остальные задачи в этой области.
«Мы решили проверить, так ли это, и применили AlphaFold к другой типичной для нашей науки задаче — предсказанию изменения стабильности белка вследствие одиночной мутации. То есть вы берете некоторый известный белок, вносите в него минимально возможное изменение и хотите знать, полученный мутант будет стабильнее или нестабильнее и насколько. Так вот, с этой задачей AlphaFold не справился: предсказания никак не согласуются с известными экспериментальными данными. Собственно, его создатели и не утверждали, что AlphaFold пригоден для чего-то, кроме предсказания структуры белков по аминокислотной последовательности, но ряд оптимистов ожидали прорыва и здесь — мы же показали обратное», — прокомментировал исследование его научный руководитель, старший преподаватель Центра молекулярной и клеточной биологии Сколтеха Дмитрий Иванков.
С практической точки зрения предсказывать изменение стабильности белка после мутации важно: например, чтобы перебором мутаций находить устойчивые к высоким температурам варианты белков с полезными свойствами. Это может быть, к примеру, белок для стирального порошка, который будет расщеплять разного рода загрязнения — другие белки, жиры, крахмал, микроворсинки, — или сладкий белок, который можно было бы положить в горячий чай вместо сахара.
Но здесь важно в том числе само по себе заключение авторов статьи, что в существующем сегодня виде ИИ не панацея. Хотя он отлично справился с важнейшей проблемой структурной биоинформатики, которая занимала ученых больше полувека, остается еще с десяток нерешенных проблем. Например, предсказание структур комплексов белков с малыми молекулами, ДНК или РНК, мутаций в белке и их влияния на энергию связывания с другими молекулами, белковый дизайн: какая нужна последовательность, чтобы сделать белок с некоторыми желаемыми свойствами, допустим, катализатор, который может стать элементом крошечной «молекулярной фабрики».
Помимо очевидного вывода, что структурную биологию рано «закрывать», исследование косвенно опровергает гипотезу, что AlphaFold не просто усвоил все накопленные человечеством структуры белков и ловко ими оперирует, но и смог каким-то образом выучить саму фундаментальную физику белков. Этим порой объясняли его успех, однако, будь это так, программе не составило бы труда сопоставить две очень похожие структуры с точки зрения стабильности, а именно это оказалось ИИ не под силу.
Этот довод дополняет два ранее озвученных сомнения касательно «знания физики». Во-первых, AlphaFold предсказывает некоторые структуры, у которых боковые группы ориентированы так, будто к ним привязан ион цинка. Но программа получает на вход только аминокислотную последовательность белка, то есть «незримый цинк» в результатах ощущается, поскольку в обучающих данных были аналогичные структуры белков, связанные с этим ионом.
Без него предсказанная ориентация боковых групп физически некорректна. Во-вторых AlphaFold предсказывает одиночную структуру витиеватой цепи, которая выглядит для ученого правдоподобно, но лишь если мысленно достроить еще две такие же цепи и переплести их вместе, иначе эта конструкция, опять же, несостоятельна с точки зрения физики. То есть программа запомнила и воспроизвела соответствующую структуру, которую вычленила из составной конструкции, — законами физики она себя при этом не ограничивает.
«Занятно, что наше исследование выросло из „игрушечного“ проекта с участниками Школы молекулярной и теоретической биологии. Проект так и назывался: „Игры с АльфаФолд“. Как только AlphaFold был выложен в открытый доступ, мы в нашей лаборатории установили его на сколтеховский суперкомпьютер „Жорес“. Одна из игр заключалась в сопоставлении эффекта мутации с предсказаниями AlphaFold для структуры исходного и мутантного белка. Так и получилось исследование, в котором школьники соприкоснулись с суперкомпьютером и передовым искусственным интеллектом», — рассказала первый автор статьи, аспирант Сколтеха Марина Пак.
Помимо биоинформатиков из Сколтеха, в исследовании участвовали ученые из Института науки и технологий Австрии и Окинавского института науки и технологий (Япония), а также школьники, которые сейчас учатся в Российском университете дружбы народов, Уральском федеральном университете и Западноамериканском колледже объединенного мира имени Арманда Хаммера (США).
Ученые собрали одну из самых полных «карт» возможных следов внеземных цивилизаций — от загадочных объектов на земной орбите до гигантских мегаструктур вокруг звезд. Вместо ожидания радиосигнала авторы обзора предложили искать любые технологические отпечатки развитых цивилизаций, некоторые из которых могут сохраняться миллионы лет.
В мае Пентагон опубликовал архив документов, которые ведомство назвало «новыми, никогда ранее не публиковавшимися файлами» о неопознанных аномальных явлениях. Министерство назвало это историческим шагом в сторону открытости. Однако эксперты отметили, что выпуск породил больше вопросов, чем ответов.
Меркурий — ближайшая к Солнцу планета, поэтому она постоянно подвергается интенсивному солнечному излучению. Однако там располагаются огромные запасы водяного льда — по оценкам, речь идет о сотнях миллиардах тонн. Правда, хранится он исключительно на полюсах на дне глубоких, постоянно затененных кратеров. Обнаружение льда в полярных кратерах Меркурия — одно из самых необычных открытий планетологии последних десятилетий. Но механизм его появления на планете до сих пор остается предметом научных споров. К разгадке приблизилась международная группа планетологов.
Команда археологов в составе младшего научного сотрудника Отдела славяно-финской археологии ИИМК РАН Натальи Григорьевой и археозоологов Института экологии растений и животных УрО РАН Ольги Бачуры и Татьяны Лобановой завершила комплексное исследование коллекции костей животных из раскопок поселения на Земляном городище Старой Ладоги (Ленинградская область). В ходе работы удалось проследить изменения системы хозяйства жителей на протяжении почти 10 веков.
Астрофизики Южного федерального университета предложили объяснение одной из самых интригующих загадок современной физики — годичных колебаний сигнала в детекторе DAMA/LIBRA, который вот уже почти тридцать лет регистрирует странные сигналы в подземной лаборатории Гран-Сассо в Италии, интерпретируемые как взаимодействие частиц темной материи с обычным веществом.
Палеонтологи выяснили, почему у тираннозавра и других крупных хищных динозавров были непропорционально маленькие передние лапы. Математическое моделирование показало, что редукция конечностей не была генетической ошибкой или побочным эффектом роста тела. В ходе эволюции челюсти и череп хищников стали настолько массивными и мощными, что полностью взяли на себя задачу по поимке и умерщвлению крупной добычи, из-за чего передние конечности атрофировались за ненадобностью.
В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.
Релиз довольно неожиданно перенес время образования протонов и нейтронов в более раннее прошлое Вселенной. К сожалению, из его текста осталось неясным научное обоснование таких фундаментальных изменений в космологии. Также он резко передвинул в прошлое и момент возникновения реликтового излучения.
При совпадении нескольких условий наши глаза способны улавливать излучение в ближнем инфракрасном спектре. Тогда сетчатка начинает работать как нелинейный фотодетектор.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
