Нейронную сеть научили моделировать потенциальные противораковые лекарства — Naked Science
12 минут
ФизТех

Нейронную сеть научили моделировать потенциальные противораковые лекарства

«Группой разработчиков сделана работа, предвещающая прорыв в открытии новых лекарств. Я думаю этому подходу принадлежит будущее фармацевтики», - Артем Оганов, профессор Сколтеха, МФТИ и Университета Штата Нью-Йорк.

Нейронную сеть научили моделировать потенциальные противораковые лекарства
Нейронную сеть научили моделировать потенциальные противораковые лекарства

Разработчики из Mail.Ru GroupInsilico Medicine и МФТИ впервые применили нейронную сеть к созданию новых лекарственных препаратов. Использование технологий генеративных нейронных состязательных сетей, обученных «придумывать» молекулярные структуры, может в разы сокращать время и стоимость поиска веществ, обладающих потенциально лечебными свойствами. Исследователи предполагают возможное применение этих технологий для поиска новых препаратов в самых разных областях от онкологии до сердечно-сосудистых заболеваний. Результаты опубликованы в рецензируемом журнале Оncotarget.

На данный момент в базе неорганических молекул несколько сотен миллионов веществ, и только доля процента из них применяется в медицине. Фармакологические методы создания лекарств носят, в основном, наследственный характер. Например, фармакологи продолжают исследовать аспирин, который применяется уже много лет, что-то добавляют к молекуле, чтобы снизить побочные эффекты или повысить эффективность, но это всё то же вещество. Как выбрать из сотен миллионов принципиально новую молекулу, обладающую лечебными свойствами? Эту задачу  исследователи из МФТИ и Insilico Medicine решили с помощью нейронной сети еще в начале 2016 года, опубликовав статью в журнале Molecular Pharmaceuticals. В этот раз исследователи решили пойти дальше и поставили себе иную цель — создать новые молекулы с заранее заданными свойствами и заставить глубокие нейронные сети “вообразить” новые структуры молекул, которые могли бы убивать раковые клетки при определенной концентрации.

За основу была взята архитектура состязательных  автокодировщиков, являющаяся расширением принципиально нового подхода в глубоком обучении, генеративных состязательных сетей. Для обучения использовались молекулы с известными лечебными свойствами и эффективной концентрацией. Информацию о такой молекуле подавали на вход сети. Сеть настраивали так, чтобы на выходе получить точно такие же данные.

Она была составлена из трёх структурных элементов — кодировщика, декодера и дискриминатора, — каждый из которых выполнял свою специфическую роль, «сотрудничая» с двумя другими. Кодировщик совместно с декодером обучался сжимать и затем восстанавливать информацию об исходной молекуле, а дискриминатор помогал сделать сжатое представление более подходящим для последующего восстановления. После того как сеть обучалась на множестве известных молекул, кодировщик вместе с дискриминатором «выключались», и сеть, используя декодер, генерировала описание молекул уже сама.

Обучение нейронных сетей зависит от количества входных данных и от размеров самой сети. В среднем нейронная сетка обучается в течение недели [зависит как от сети, так и от данных и железа]. То, насколько хорошо идёт воспроизведение, влияет конфигурация слоев. Поиск наиболее оптимального решения архитектуры сети может занять от нескольких дней до нескольких месяцев. Настройка нейронной сети — это целое искусство.

Все молекулы имеют представление в виде “смайлзов” — буквенных аннотаций химического вещества, которые позволяют восстановить его структуру. Стандартная запись, которой обучали в школе, не подходит для обработки сетью, но и смайлз не очень подходит — он имеет произвольную длину от одной буквы до 200. Для обучения нейронной сети требуется одинаковая длина описания (вектора). Решает эту задачу фингерпринт, в переводе «отпечаток пальца» молекулы. Фингерпринт содержит в себе всю информацию о молекуле. Существует множество способов построения «отпечатка», исследователи использовали самый простой бинарный из 166 цифр. Они конвертировали смайлзы в фингерпринты и на них уже обучали сеть.

На вход нейронной сети подавались «отпечатки» известных лекарственных молекул. Сеть должна была распределить веса параметров внутренних нейронов так, чтобы при заданном входе получился заданный же выход. Эта операция повторялась много раз — так происходит обучение на большом количестве данных. В результате получается «чёрный ящик», который умеет при заданном входе давать заданный выход. Затем разработчики убрали первые слои, и сеть генерировала фингерпринты при обратном прогоне уже сама. Учёные построили «отпечатки» для всех 72 млн молекул и далее сравнивали сгенерированные сетью фингерпринты с базой. Отобранные молекулы должны потенциально обладать заданными качествами.

Нейронную сеть научили моделировать потенциальные противораковые лекарства
Архитектура нейронной сети Аспирант МФТИ Андрей Казеннов: «Мы разработали нейронную сеть генеративного типа, то есть умеющую создавать новые объекты по заданным параметрам, используя “накопленные знания” о миллионах объектах на которых она обучалась. Мы разработали и обучили модель сети, которая способна создавать новые молекулярные структуры с заданными свойствами»

Для проверки сети использовали базу известных противораковых лекарств. Исследовали сверили сгенерированные сетью соединения с общей базой. Из полученных 69 молекул многие являются активно используемыми противораковыми препаратами. А вот остальные потенциально могут стать основой новых лекарственных препаратов.

Рассказывает один из авторов исследования Александр Жаворонков, глава Insilico Medicine и международный адъюнкт-профессор МФТИ: «Генеративные состязательные сети с применением обучения с подкреплением — это будущее фармакологии. В этой статье мы показали первое применение генеративных состязательных автокодировщиков, GAN’ов, для создания новых молекулярных структур противоопухолевых препаратов по определённым параметрам. Эта работа была сделана ещё летом, и с тех пор мы значительно продвинулись в этом направлении. Я очень надеюсь, что в скором времени мы сможем разрабатывать индивидуальные лекарства для лечения редких заболеваний и даже для лечения отдельных пациентов. Уже в этом году искусственный интеллект начнёт трансформировать фармацевтическую индустрию».

«GAN’ы находятся сейчас на переднем крае нейронауки. Совершенно очевидно, что они могут быть использованы на более широком спектре задач, чем генерация картинок и музыки. Мы попробовали применить этот подход в биоинформатике и получили прекрасный результат», — подводит итог Артур Кадурин, ведущий программист группы оптимизации поиска Mail.Ru Group, независимый научный консультант Insilico Medicine. 

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
ФизТех
212 статей
Московский физико-технический институт (национальный исследовательский университет), известен также как Физтех — ведущий российский вуз по подготовке специалистов в области теоретической, экспериментальной и прикладной физики, математики, информатики, химии, биологии и смежных дисциплин. Расположен в городе Долгопрудном Московской области, отдельные корпуса и факультеты находятся в Жуковском и в Москве.
Вчера, 08:57
7 минут
СФУ

Ученые Сибирского федерального университета в составе международной группы изучили двумерные полимеры на основе тетраоксо[8]циркулена и атомов s-металлов таблицы Менделеева с помощью квантово-химического моделирования. Выяснилось, что модификация поверхности полимера тетраоксо[8]циркулена атомами кальция приводит к появлению сверхпроводимости при температуре ниже 14,5 К и возможной реализации двухуровневой системы на атомах кальция, перспективной для построения квантовых битов и последующей реализации в квантовых компьютерах.

Позавчера, 22:13
6 минут
Мария Азарова

Опрос среди совершеннолетних жителей разных российских регионов показал, что 64 процента из них не верят в естественное происхождение коронавируса — главным образом эта категория представлена людьми старше 40 лет.

Вчера, 21:17
5 минут
Мария Кривоченко

Ученые провели комплексный анализ причин, по которым люди решают бросить высшее учебное заведение. Самым частым поводом оказалось разочарование в выбранной специальности или процессе образования в целом. При этом исследователи отмечают, что факторов, влияющих на отказ от окончания вуза, обычно несколько.

26 февраля
10 минут
Василий Парфенов

Даже при разработке точнейших научных инструментов случаются разные технические сюрпризы — и хорошо, если приятные. К счастью, именно так вышло на этот раз. Ученые получили очередную порцию данных с космического аппарата Parker Solar Probe и здорово удивились. На сделанном в оптическом диапазоне снимке ночной стороны Венеры видны детали поверхности, обычно скрытые плотными облаками. Теперь предстоит решить загадку: либо камера оказалась чувствительна к инфракрасному диапазону излучения, либо случайно обнаружилось «окно» для наблюдений через атмосферу этой планеты.

26 февраля
8 минут
Мария Азарова

Математическое моделирование позволило подсчитать, что большинство случаев тяжелого течения коронавирусного заболевания и госпитализаций по этой причине в США оказались связаны с одним из четырех кардиометаболических нарушений, а главным образом — с ожирением.

Позавчера, 10:00
42 минуты
Редакция

Все знают, что нефть — это углеводороды. Но из чего она образовалась? Правда ли, что из динозавров? И сколько миллионов лет нефти, из которой сегодня делают бензин и сотни других важных окружающих нас вещей? Разбираемся, какие запасы нефти залегают в России и сколько их осталось, почему их до сих пор не добыли, а также, как это связано с существами, которые жили миллионы лет назад.

26 февраля
10 минут
Василий Парфенов

Даже при разработке точнейших научных инструментов случаются разные технические сюрпризы — и хорошо, если приятные. К счастью, именно так вышло на этот раз. Ученые получили очередную порцию данных с космического аппарата Parker Solar Probe и здорово удивились. На сделанном в оптическом диапазоне снимке ночной стороны Венеры видны детали поверхности, обычно скрытые плотными облаками. Теперь предстоит решить загадку: либо камера оказалась чувствительна к инфракрасному диапазону излучения, либо случайно обнаружилось «окно» для наблюдений через атмосферу этой планеты.

21 февраля
20 минут
Василий Парфенов

Кого и что только ни успели уже обвинить в технологической катастрофе, которая произошла на этой неделе в США. Но эмоции плавно оседают, и начинают появляться первые результаты разбирательства. А они порой вызывают искреннее недоумение, честно говоря.

15 февраля
9 минут
Василий Парфенов

Новость, которую странно публиковать на серьезном научно-популярном портале, но от реальности не убежишь. Уфологи всего мира могут радоваться: американские военные официально признали, что изучали места крушения НЛО и в их распоряжении есть некие аномальные объекты, свойства которых выходят за рамки известных науке материалов.

[miniorange_social_login]

Комментарии

Написать комментарий

Подтвердить?
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: