• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
14.02.2017
ФизТех
427

Нейронную сеть научили моделировать потенциальные противораковые лекарства

«Группой разработчиков сделана работа, предвещающая прорыв в открытии новых лекарств. Я думаю этому подходу принадлежит будущее фармацевтики», - Артем Оганов, профессор Сколтеха, МФТИ и Университета Штата Нью-Йорк.

Нейронную сеть научили моделировать потенциальные противораковые лекарства
Нейронную сеть научили моделировать потенциальные противораковые лекарства / Автор: Visellia Orfius

Разработчики из Mail.Ru GroupInsilico Medicine и МФТИ впервые применили нейронную сеть к созданию новых лекарственных препаратов. Использование технологий генеративных нейронных состязательных сетей, обученных «придумывать» молекулярные структуры, может в разы сокращать время и стоимость поиска веществ, обладающих потенциально лечебными свойствами. Исследователи предполагают возможное применение этих технологий для поиска новых препаратов в самых разных областях от онкологии до сердечно-сосудистых заболеваний. Результаты опубликованы в рецензируемом журнале Оncotarget.

На данный момент в базе неорганических молекул несколько сотен миллионов веществ, и только доля процента из них применяется в медицине. Фармакологические методы создания лекарств носят, в основном, наследственный характер. Например, фармакологи продолжают исследовать аспирин, который применяется уже много лет, что-то добавляют к молекуле, чтобы снизить побочные эффекты или повысить эффективность, но это всё то же вещество. Как выбрать из сотен миллионов принципиально новую молекулу, обладающую лечебными свойствами? Эту задачу  исследователи из МФТИ и Insilico Medicine решили с помощью нейронной сети еще в начале 2016 года, опубликовав статью в журнале Molecular Pharmaceuticals. В этот раз исследователи решили пойти дальше и поставили себе иную цель — создать новые молекулы с заранее заданными свойствами и заставить глубокие нейронные сети “вообразить” новые структуры молекул, которые могли бы убивать раковые клетки при определенной концентрации.

За основу была взята архитектура состязательных  автокодировщиков, являющаяся расширением принципиально нового подхода в глубоком обучении, генеративных состязательных сетей. Для обучения использовались молекулы с известными лечебными свойствами и эффективной концентрацией. Информацию о такой молекуле подавали на вход сети. Сеть настраивали так, чтобы на выходе получить точно такие же данные.

Она была составлена из трёх структурных элементов — кодировщика, декодера и дискриминатора, — каждый из которых выполнял свою специфическую роль, «сотрудничая» с двумя другими. Кодировщик совместно с декодером обучался сжимать и затем восстанавливать информацию об исходной молекуле, а дискриминатор помогал сделать сжатое представление более подходящим для последующего восстановления. После того как сеть обучалась на множестве известных молекул, кодировщик вместе с дискриминатором «выключались», и сеть, используя декодер, генерировала описание молекул уже сама.

Обучение нейронных сетей зависит от количества входных данных и от размеров самой сети. В среднем нейронная сетка обучается в течение недели [зависит как от сети, так и от данных и железа]. То, насколько хорошо идёт воспроизведение, влияет конфигурация слоев. Поиск наиболее оптимального решения архитектуры сети может занять от нескольких дней до нескольких месяцев. Настройка нейронной сети — это целое искусство.

Все молекулы имеют представление в виде “смайлзов” — буквенных аннотаций химического вещества, которые позволяют восстановить его структуру. Стандартная запись, которой обучали в школе, не подходит для обработки сетью, но и смайлз не очень подходит — он имеет произвольную длину от одной буквы до 200. Для обучения нейронной сети требуется одинаковая длина описания (вектора). Решает эту задачу фингерпринт, в переводе «отпечаток пальца» молекулы. Фингерпринт содержит в себе всю информацию о молекуле. Существует множество способов построения «отпечатка», исследователи использовали самый простой бинарный из 166 цифр. Они конвертировали смайлзы в фингерпринты и на них уже обучали сеть.

На вход нейронной сети подавались «отпечатки» известных лекарственных молекул. Сеть должна была распределить веса параметров внутренних нейронов так, чтобы при заданном входе получился заданный же выход. Эта операция повторялась много раз — так происходит обучение на большом количестве данных. В результате получается «чёрный ящик», который умеет при заданном входе давать заданный выход. Затем разработчики убрали первые слои, и сеть генерировала фингерпринты при обратном прогоне уже сама. Учёные построили «отпечатки» для всех 72 млн молекул и далее сравнивали сгенерированные сетью фингерпринты с базой. Отобранные молекулы должны потенциально обладать заданными качествами.

Нейронную сеть научили моделировать потенциальные противораковые лекарства
Архитектура нейронной сети Аспирант МФТИ Андрей Казеннов: «Мы разработали нейронную сеть генеративного типа, то есть умеющую создавать новые объекты по заданным параметрам, используя “накопленные знания” о миллионах объектах на которых она обучалась. Мы разработали и обучили модель сети, которая способна создавать новые молекулярные структуры с заданными свойствами»

Для проверки сети использовали базу известных противораковых лекарств. Исследовали сверили сгенерированные сетью соединения с общей базой. Из полученных 69 молекул многие являются активно используемыми противораковыми препаратами. А вот остальные потенциально могут стать основой новых лекарственных препаратов.

Рассказывает один из авторов исследования Александр Жаворонков, глава Insilico Medicine и международный адъюнкт-профессор МФТИ: «Генеративные состязательные сети с применением обучения с подкреплением — это будущее фармакологии. В этой статье мы показали первое применение генеративных состязательных автокодировщиков, GAN’ов, для создания новых молекулярных структур противоопухолевых препаратов по определённым параметрам. Эта работа была сделана ещё летом, и с тех пор мы значительно продвинулись в этом направлении. Я очень надеюсь, что в скором времени мы сможем разрабатывать индивидуальные лекарства для лечения редких заболеваний и даже для лечения отдельных пациентов. Уже в этом году искусственный интеллект начнёт трансформировать фармацевтическую индустрию».

«GAN’ы находятся сейчас на переднем крае нейронауки. Совершенно очевидно, что они могут быть использованы на более широком спектре задач, чем генерация картинок и музыки. Мы попробовали применить этот подход в биоинформатике и получили прекрасный результат», — подводит итог Артур Кадурин, ведущий программист группы оптимизации поиска Mail.Ru Group, независимый научный консультант Insilico Medicine. 

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Московский физико-технический институт (национальный исследовательский университет), известен также как Физтех — ведущий российский вуз по подготовке специалистов в области теоретической, экспериментальной и прикладной физики, математики, информатики, химии, биологии и смежных дисциплин. Расположен в городе Долгопрудном Московской области, отдельные корпуса и факультеты находятся в Жуковском и в Москве.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
Позавчера, 11:15
РНФ

Ученые описали новый для науки вид пескарей из бассейна реки Урал и потому назвали его Gobio uralensis. Оказалось, что этот вид по внешним признакам (морфологии) наиболее близок к волжскому пескарю, обитающему на территории Европейской части России, а генетически — к маркакольскому, населяющему реки Казахстана и Китая. Это может говорить о том, что уральский пескарь появился в далеком прошлом в результате гибридизации европейских и азиатских линий пескарей.

Вчера, 12:57
Юлия Трепалина

После тяжелого эмоционального потрясения, например развода или потери близкого человека, у некоторых людей может возникать кардиомиопатия такоцубо, также известная как стрессовая кардиомиопатия, или «синдромом разбитого сердца». Хотя это состояние, напоминающее симптомами сердечный приступ, чаще встречается у женщин, новое исследование показало, что для мужчин оно вдвое смертоноснее.

Вчера, 20:59
Татьяна

В Бразилии проживает более 200 миллионов человек, немалую долю которых занимают потомки иммигрантов. Колонизация с XV по XX века считается самым масштабным переселением народов в истории. Порядка пяти миллионов человек переселились туда из Европы. Столько же насильно переместили с Африканского континента. Сегодня бразильцы — это наиболее генетически разнородная нация, и одна из самых малоизученных. Поэтому неудивительно, что новая работа по результатам полногеномного анализа населения принесла целый ряд открытий.

11 мая
Редакция Naked Science

Мохаммад Х. Аттаран (Mohammad H. Attaran) — концепт-дизайнер и цифровой художник, работающий в Великобритании. В своих проектах он сочетает эстетику научной фантастики с элементами, вдохновлёнными природой, особенно анатомией насекомых. Его машины, мехи и транспортные средства выглядят одновременно инопланетно и инженерно достоверно. Ну или почти.

9 мая
Татьяна

Исследуя генетическое происхождение мужского населения Нидерландов, ученые заметили географические особенности распределения гаплогрупп. Теперь, чтобы их объяснить, проанализировали Y-хромосомы сотен человек, начиная с раннего Средневековья, в сравнении с геномами современного населения страны. Авторы рассчитывали обнаружить непрерывность популяций, однако столкнулись с неожиданными сложностями.

Позавчера, 11:02
ФизТех

Ученые из МФТИ и МГУ провели важное исследование фундаментальных законов природы, значительно расширив возможности одного из самых перспективных инструментов для исследования М-теории — гипотетической «теории всего». Они обобщили математический метод, известный как три-векторные деформации, на полные, без каких-либо упрощений, уравнения 11-мерной супергравитации в рамках исключительной теории поля. Результатом стали явные «рецепты» того, как можно систематически изменять (или «деформировать») геометрию и поля любого известного 11-мерного пространства-времени, чтобы получить новые, ранее неизвестные решения, подчиняющиеся тем же элегантным алгебраическим условиям, что и в более простых случаях.

6 мая
Редакция Naked Science

Да, с волосами и люком все так. У космонавта Суниты Уильямс волосы на МКС плавали свободно, а у Кэти Пэрри и прочих в полете 14 апреля 2025 года — нет. Но это не значит, что суборбитального космического полета первого чисто женского экипажа не было или что он был инсценировкой. Причем, в общем-то, чтобы понять это, даже не нужно обладать специальными знаниями.

6 мая
Березин Александр

Мощнейшее отключение электроэнергии за последние 20 лет истории Европы случилось уже неделю назад, а испанские власти пока так и не объявили о его причинах. Это логично: как мы покажем ниже, ответ на вопрос, кто виноват, получится очень неполиткорректным. И, более того, противоречащим линии правящей в Испании партии. Но мы живем за тысячи километров от нее, поэтому можем себе позволить аполитичный анализ случившегося. Так что же произошло на самом деле и каковы наши шансы увидеть подобное у себя дома?

2 мая
Unitsky String Technologies Inc.

Инженеры компании UST Inc. разработали передовой рельсовый беспилотник, способный передвигаться на скорости до 500 километров в час. Юнибус U5-75304 предназначен для перевозки пассажиров и может в перспективе заменить среднемагистральную авиацию. Давайте узнаем, как конструктивные особенности обеспечивают продолжительное движение на больших скоростях, комфорт и безопасность пассажирам.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно