• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
14.02.2017
ФизТех
168

Нейронную сеть научили моделировать потенциальные противораковые лекарства

«Группой разработчиков сделана работа, предвещающая прорыв в открытии новых лекарств. Я думаю этому подходу принадлежит будущее фармацевтики», - Артем Оганов, профессор Сколтеха, МФТИ и Университета Штата Нью-Йорк.

Нейронную сеть научили моделировать потенциальные противораковые лекарства
Нейронную сеть научили моделировать потенциальные противораковые лекарства

Разработчики из Mail.Ru GroupInsilico Medicine и МФТИ впервые применили нейронную сеть к созданию новых лекарственных препаратов. Использование технологий генеративных нейронных состязательных сетей, обученных «придумывать» молекулярные структуры, может в разы сокращать время и стоимость поиска веществ, обладающих потенциально лечебными свойствами. Исследователи предполагают возможное применение этих технологий для поиска новых препаратов в самых разных областях от онкологии до сердечно-сосудистых заболеваний. Результаты опубликованы в рецензируемом журнале Оncotarget.

На данный момент в базе неорганических молекул несколько сотен миллионов веществ, и только доля процента из них применяется в медицине. Фармакологические методы создания лекарств носят, в основном, наследственный характер. Например, фармакологи продолжают исследовать аспирин, который применяется уже много лет, что-то добавляют к молекуле, чтобы снизить побочные эффекты или повысить эффективность, но это всё то же вещество. Как выбрать из сотен миллионов принципиально новую молекулу, обладающую лечебными свойствами? Эту задачу  исследователи из МФТИ и Insilico Medicine решили с помощью нейронной сети еще в начале 2016 года, опубликовав статью в журнале Molecular Pharmaceuticals. В этот раз исследователи решили пойти дальше и поставили себе иную цель — создать новые молекулы с заранее заданными свойствами и заставить глубокие нейронные сети “вообразить” новые структуры молекул, которые могли бы убивать раковые клетки при определенной концентрации.

За основу была взята архитектура состязательных  автокодировщиков, являющаяся расширением принципиально нового подхода в глубоком обучении, генеративных состязательных сетей. Для обучения использовались молекулы с известными лечебными свойствами и эффективной концентрацией. Информацию о такой молекуле подавали на вход сети. Сеть настраивали так, чтобы на выходе получить точно такие же данные.

Она была составлена из трёх структурных элементов — кодировщика, декодера и дискриминатора, — каждый из которых выполнял свою специфическую роль, «сотрудничая» с двумя другими. Кодировщик совместно с декодером обучался сжимать и затем восстанавливать информацию об исходной молекуле, а дискриминатор помогал сделать сжатое представление более подходящим для последующего восстановления. После того как сеть обучалась на множестве известных молекул, кодировщик вместе с дискриминатором «выключались», и сеть, используя декодер, генерировала описание молекул уже сама.

Обучение нейронных сетей зависит от количества входных данных и от размеров самой сети. В среднем нейронная сетка обучается в течение недели [зависит как от сети, так и от данных и железа]. То, насколько хорошо идёт воспроизведение, влияет конфигурация слоев. Поиск наиболее оптимального решения архитектуры сети может занять от нескольких дней до нескольких месяцев. Настройка нейронной сети — это целое искусство.

Все молекулы имеют представление в виде “смайлзов” — буквенных аннотаций химического вещества, которые позволяют восстановить его структуру. Стандартная запись, которой обучали в школе, не подходит для обработки сетью, но и смайлз не очень подходит — он имеет произвольную длину от одной буквы до 200. Для обучения нейронной сети требуется одинаковая длина описания (вектора). Решает эту задачу фингерпринт, в переводе «отпечаток пальца» молекулы. Фингерпринт содержит в себе всю информацию о молекуле. Существует множество способов построения «отпечатка», исследователи использовали самый простой бинарный из 166 цифр. Они конвертировали смайлзы в фингерпринты и на них уже обучали сеть.

На вход нейронной сети подавались «отпечатки» известных лекарственных молекул. Сеть должна была распределить веса параметров внутренних нейронов так, чтобы при заданном входе получился заданный же выход. Эта операция повторялась много раз — так происходит обучение на большом количестве данных. В результате получается «чёрный ящик», который умеет при заданном входе давать заданный выход. Затем разработчики убрали первые слои, и сеть генерировала фингерпринты при обратном прогоне уже сама. Учёные построили «отпечатки» для всех 72 млн молекул и далее сравнивали сгенерированные сетью фингерпринты с базой. Отобранные молекулы должны потенциально обладать заданными качествами.

Нейронную сеть научили моделировать потенциальные противораковые лекарства
Архитектура нейронной сети Аспирант МФТИ Андрей Казеннов: «Мы разработали нейронную сеть генеративного типа, то есть умеющую создавать новые объекты по заданным параметрам, используя “накопленные знания” о миллионах объектах на которых она обучалась. Мы разработали и обучили модель сети, которая способна создавать новые молекулярные структуры с заданными свойствами»

Для проверки сети использовали базу известных противораковых лекарств. Исследовали сверили сгенерированные сетью соединения с общей базой. Из полученных 69 молекул многие являются активно используемыми противораковыми препаратами. А вот остальные потенциально могут стать основой новых лекарственных препаратов.

Рассказывает один из авторов исследования Александр Жаворонков, глава Insilico Medicine и международный адъюнкт-профессор МФТИ: «Генеративные состязательные сети с применением обучения с подкреплением — это будущее фармакологии. В этой статье мы показали первое применение генеративных состязательных автокодировщиков, GAN’ов, для создания новых молекулярных структур противоопухолевых препаратов по определённым параметрам. Эта работа была сделана ещё летом, и с тех пор мы значительно продвинулись в этом направлении. Я очень надеюсь, что в скором времени мы сможем разрабатывать индивидуальные лекарства для лечения редких заболеваний и даже для лечения отдельных пациентов. Уже в этом году искусственный интеллект начнёт трансформировать фармацевтическую индустрию».

«GAN’ы находятся сейчас на переднем крае нейронауки. Совершенно очевидно, что они могут быть использованы на более широком спектре задач, чем генерация картинок и музыки. Мы попробовали применить этот подход в биоинформатике и получили прекрасный результат», — подводит итог Артур Кадурин, ведущий программист группы оптимизации поиска Mail.Ru Group, независимый научный консультант Insilico Medicine. 

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Московский физико-технический институт (национальный исследовательский университет), известен также как Физтех — ведущий российский вуз по подготовке специалистов в области теоретической, экспериментальной и прикладной физики, математики, информатики, химии, биологии и смежных дисциплин. Расположен в городе Долгопрудном Московской области, отдельные корпуса и факультеты находятся в Жуковском и в Москве.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
Позавчера, 18:28
Анна Новиковская

Историки долго мучились вопросом, почему древние римляне — те же, что сумели выстроить множество великолепных произведений архитектурного искусства, — с завидной регулярностью изготавливали странно асимметричные игральные кости, похожие на плохо слепленные детские поделки. Теперь у них есть возможный ответ на эту загадку.

Вчера, 15:22
Ольга Иванова

Антропологи из США и Великобритании опровергли результаты исследований других ученых, опубликованные в прошлом году, и пришли к выводу, что мозг человека не уменьшался с момента трех тысяч лет назад. Более того, этого, похоже, не происходило с момента появления нашего вида — Homo sapiens.

Вчера, 18:31
Александра Медведева

Ученые обнаружили новый источник кислорода, который мог повлиять на эволюцию жизни еще до появления фотосинтеза. Оказалось, в сейсмически активных регионах вода при высоких температурах может вступать в реакцию с дефектами на поверхности горных пород, образуя перекись водорода, которая, в свою очередь, может служить источником кислорода для гипертермофильных бактерий.

6 августа
Сергей Васильев

Наблюдения показали, что планеты — мини-нептуны могут терять атмосферу под действием излучения своих звезд, переходя в группу каменистых планет-сверхземель.

Позавчера, 18:28
Анна Новиковская

Историки долго мучились вопросом, почему древние римляне — те же, что сумели выстроить множество великолепных произведений архитектурного искусства, — с завидной регулярностью изготавливали странно асимметричные игральные кости, похожие на плохо слепленные детские поделки. Теперь у них есть возможный ответ на эту загадку.

Вчера, 12:00
НИУ ВШЭ

Федеральная программа материнского капитала (и ее региональные аналоги) действительно приводит к тому, что семьи чаще и быстрее решаются завести второго ребенка. К такому выводу пришли сотрудники Исследовательской рабочей группы по экономико-математическому моделированию демографических процессов факультета экономических наук НИУ ВШЭ.

11 июля
Василий Парфенов

Доступность высококачественных и актуальных данных от спутников дистанционного зондирования Земли растет с каждым годом. Такие компании, как Capella Space и Maxar Technologies, несколько лет подряд предлагают всем желающим беспрецедентно дешевые радарные и оптические снимки земной поверхности высокого разрешения. Это позволяет гражданским аналитикам наблюдать за военными объектами по всему миру и находить интересные артефакты.

2 августа
Александр Березин

Если западным странам удастся «лишить Кремль нефтяных доходов», то мир ждет геополитическое землетрясение. Только не обязательно в ту сторону, о которой вы сейчас подумали. На фоне того, что последует за «лишением», шок 1973 года может показаться детской игрой. Naked Science попробует оценить размах «потолочного катаклизма» заранее.

31 июля
Александр Березин

Саудовский принц одобрил строительство гигантского «лежачего небоскреба», который должен стать крупнейшим зданием в истории. Причем еще и самым экологичным в мире. Пресса и соцсети полны возмущенных оценок: «это антиутопия!», «проект сырой!» и тому подобным. Однако чисто технически это не так: «Зеркальную линию» на пять миллионов жителей вполне можно построить. И такое здание в самом деле будет энергоэффективным (и формально безуглеродным). Но у проекта есть другие слабые места, лежащие скорее в сфере науки, нежели техники. Naked Science попробовал разобраться в деталях.

[miniorange_social_login]

Комментарии

Написать комментарий

Подтвердить?
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: