Нейронную сеть научили моделировать потенциальные противораковые лекарства — Naked Science
12 минут
ФизТех

Нейронную сеть научили моделировать потенциальные противораковые лекарства

«Группой разработчиков сделана работа, предвещающая прорыв в открытии новых лекарств. Я думаю этому подходу принадлежит будущее фармацевтики», - Артем Оганов, профессор Сколтеха, МФТИ и Университета Штата Нью-Йорк.

Нейронную сеть научили моделировать потенциальные противораковые лекарства
Нейронную сеть научили моделировать потенциальные противораковые лекарства

Разработчики из Mail.Ru GroupInsilico Medicine и МФТИ впервые применили нейронную сеть к созданию новых лекарственных препаратов. Использование технологий генеративных нейронных состязательных сетей, обученных «придумывать» молекулярные структуры, может в разы сокращать время и стоимость поиска веществ, обладающих потенциально лечебными свойствами. Исследователи предполагают возможное применение этих технологий для поиска новых препаратов в самых разных областях от онкологии до сердечно-сосудистых заболеваний. Результаты опубликованы в рецензируемом журнале Оncotarget.

На данный момент в базе неорганических молекул несколько сотен миллионов веществ, и только доля процента из них применяется в медицине. Фармакологические методы создания лекарств носят, в основном, наследственный характер. Например, фармакологи продолжают исследовать аспирин, который применяется уже много лет, что-то добавляют к молекуле, чтобы снизить побочные эффекты или повысить эффективность, но это всё то же вещество. Как выбрать из сотен миллионов принципиально новую молекулу, обладающую лечебными свойствами? Эту задачу  исследователи из МФТИ и Insilico Medicine решили с помощью нейронной сети еще в начале 2016 года, опубликовав статью в журнале Molecular Pharmaceuticals. В этот раз исследователи решили пойти дальше и поставили себе иную цель — создать новые молекулы с заранее заданными свойствами и заставить глубокие нейронные сети “вообразить” новые структуры молекул, которые могли бы убивать раковые клетки при определенной концентрации.

За основу была взята архитектура состязательных  автокодировщиков, являющаяся расширением принципиально нового подхода в глубоком обучении, генеративных состязательных сетей. Для обучения использовались молекулы с известными лечебными свойствами и эффективной концентрацией. Информацию о такой молекуле подавали на вход сети. Сеть настраивали так, чтобы на выходе получить точно такие же данные.

Она была составлена из трёх структурных элементов — кодировщика, декодера и дискриминатора, — каждый из которых выполнял свою специфическую роль, «сотрудничая» с двумя другими. Кодировщик совместно с декодером обучался сжимать и затем восстанавливать информацию об исходной молекуле, а дискриминатор помогал сделать сжатое представление более подходящим для последующего восстановления. После того как сеть обучалась на множестве известных молекул, кодировщик вместе с дискриминатором «выключались», и сеть, используя декодер, генерировала описание молекул уже сама.

Обучение нейронных сетей зависит от количества входных данных и от размеров самой сети. В среднем нейронная сетка обучается в течение недели [зависит как от сети, так и от данных и железа]. То, насколько хорошо идёт воспроизведение, влияет конфигурация слоев. Поиск наиболее оптимального решения архитектуры сети может занять от нескольких дней до нескольких месяцев. Настройка нейронной сети — это целое искусство.

Все молекулы имеют представление в виде “смайлзов” — буквенных аннотаций химического вещества, которые позволяют восстановить его структуру. Стандартная запись, которой обучали в школе, не подходит для обработки сетью, но и смайлз не очень подходит — он имеет произвольную длину от одной буквы до 200. Для обучения нейронной сети требуется одинаковая длина описания (вектора). Решает эту задачу фингерпринт, в переводе «отпечаток пальца» молекулы. Фингерпринт содержит в себе всю информацию о молекуле. Существует множество способов построения «отпечатка», исследователи использовали самый простой бинарный из 166 цифр. Они конвертировали смайлзы в фингерпринты и на них уже обучали сеть.

На вход нейронной сети подавались «отпечатки» известных лекарственных молекул. Сеть должна была распределить веса параметров внутренних нейронов так, чтобы при заданном входе получился заданный же выход. Эта операция повторялась много раз — так происходит обучение на большом количестве данных. В результате получается «чёрный ящик», который умеет при заданном входе давать заданный выход. Затем разработчики убрали первые слои, и сеть генерировала фингерпринты при обратном прогоне уже сама. Учёные построили «отпечатки» для всех 72 млн молекул и далее сравнивали сгенерированные сетью фингерпринты с базой. Отобранные молекулы должны потенциально обладать заданными качествами.

Нейронную сеть научили моделировать потенциальные противораковые лекарства
Архитектура нейронной сети Аспирант МФТИ Андрей Казеннов: «Мы разработали нейронную сеть генеративного типа, то есть умеющую создавать новые объекты по заданным параметрам, используя “накопленные знания” о миллионах объектах на которых она обучалась. Мы разработали и обучили модель сети, которая способна создавать новые молекулярные структуры с заданными свойствами»

Для проверки сети использовали базу известных противораковых лекарств. Исследовали сверили сгенерированные сетью соединения с общей базой. Из полученных 69 молекул многие являются активно используемыми противораковыми препаратами. А вот остальные потенциально могут стать основой новых лекарственных препаратов.

Рассказывает один из авторов исследования Александр Жаворонков, глава Insilico Medicine и международный адъюнкт-профессор МФТИ: «Генеративные состязательные сети с применением обучения с подкреплением — это будущее фармакологии. В этой статье мы показали первое применение генеративных состязательных автокодировщиков, GAN’ов, для создания новых молекулярных структур противоопухолевых препаратов по определённым параметрам. Эта работа была сделана ещё летом, и с тех пор мы значительно продвинулись в этом направлении. Я очень надеюсь, что в скором времени мы сможем разрабатывать индивидуальные лекарства для лечения редких заболеваний и даже для лечения отдельных пациентов. Уже в этом году искусственный интеллект начнёт трансформировать фармацевтическую индустрию».

«GAN’ы находятся сейчас на переднем крае нейронауки. Совершенно очевидно, что они могут быть использованы на более широком спектре задач, чем генерация картинок и музыки. Мы попробовали применить этот подход в биоинформатике и получили прекрасный результат», — подводит итог Артур Кадурин, ведущий программист группы оптимизации поиска Mail.Ru Group, независимый научный консультант Insilico Medicine. 

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
ФизТех
202 статей
Московский физико-технический институт (национальный исследовательский университет), известен также как Физтех — ведущий российский вуз по подготовке специалистов в области теоретической, экспериментальной и прикладной физики, математики, информатики, химии, биологии и смежных дисциплин. Расположен в городе Долгопрудном Московской области, отдельные корпуса и факультеты находятся в Жуковском и в Москве.
Вчера, 20:06
10 минут
Мария Азарова

Согласно выводам нового исследования, именно бессимптомные носители коронавируса — невидимая часть айсберга пандемии Covid-19.

2 часа назад
5 минут
Мария Азарова

Этот окунеобразный маколор появился на свет в последние годы Великой депрессии, пережил Вторую мировую войну и, таким образом, получил титул долгожителя среди обнаруженных на сегодня рифовых рыб.

Вчера, 19:36
7 минут
Василий Парфенов

История одного из главных научных инструментов человечества завершилась сегодня, 1 декабря. Сбылись самые мрачные опасения пытавшихся сохранить радиотелескоп «Аресибо» инженеров — огромный облучатель рухнул на главное зеркало.

30 ноября
7 минут
Василий Парфенов

История с загадочным артефактом в американском штате Юта становится все запутаннее. Мало того, что, вопреки всем предосторожностям властей, «монолит» нашли любопытные граждане, так его еще украли. А недавно стало известно об аналогичной находке в Европе — на территории археологического памятника в Пятра-Нямце, Румыния.

26 ноября
33 минуты
Илья Ведмеденко

Недавние события в Нагорном Карабахе показали, что победить в современной войне, не имея ударных беспилотников, сложно. Россия пока отстает от стран Запада, Китая, Израиля и даже Турции, но делает все возможное, чтобы сократить этот разрыв.

30 ноября
5 минут
Василий Парфенов

Пилотируемый глубоководный аппарат «Фэньдоучжэ» опустился на глубину 10 909 метров в Марианскую впадину. Во время этого погружения впервые осуществлялась прямая трансляция фото и видео на поверхность.

14 ноября
35 минут
Василий Парфенов

На вопрос, кто проживает на дне океана, люди отвечают по-разному. Дети и некоторые взрослые скажут: Губка Боб Квадратные Штаны. Фанаты Лавкрафта благоговейно, но с огоньком в глазах пробормочут нечто вроде «Ктулху фхтагн». А подводники и океанологи задумчиво посмотрят на вопрошающего и, если повезет, расскажут много интересного. Про квакеров, «биоуток», «блуп» и еще Посейдон его знает какие аномальные явления подводного мира.

22 ноября
26 минут
Александр Березин

Планеты вокруг нашего Солнца расположены совсем не так, как в других системах. И это имеет крайне необычные практические последствия: расчеты показывают, что вокруг нашей звезды должны вращаться две потенциально обитаемые планеты, а не одна, как сейчас. Одна из них куда-то бесследно исчезла – и это еще в лучшем случае. Рассказываем, почему так получилось и кто конкретно в этом виноват.

24 ноября
8 минут
Мария Азарова

Попадание патогена в эпителий слизистой дыхательных путей и захват вирусом бокаловидных клеток приводит к нарушению слизистого барьера. Из-за уменьшения количества муцина снижается не только обонятельная чувствительность, но и возникают неприятные ощущения в носу и рту, в том числе сухость.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Лучшие материалы
Предстоящие мероприятия
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: