Искусственный интеллект поможет построить карту химического пространства
19.03.2019
6 минут
Сколтех
158

Искусственный интеллект поможет построить карту химического пространства

Исследователи из Сколтеха и Мюнхенского центра имени Гельмгольца создали нейронную сеть для визуализации химического пространства соединений, представляющих интерес для фармацевтики.

Ученые из Сколтеха (Центр научных и инженерных вычислительных технологий для задач с большими массивами данных) и Мюнхенского центра имени Гельмгольца по исследованию окружающей среды и здоровья (HMGU, Германия) создали нейронную сеть для визуализации химического пространства соединений, которые представляют интерес для фармацевтики.

Разработанный метод поможет создавать новые химические соединения и ориентироваться в пространстве уже имеющихся. Результаты исследования опубликованы в журнале RSC Advances.

Перед химиками часто возникает задача проанализировать огромные базы данных, содержащие десятки и сотни тысяч химических структур, и отобрать среди них наиболее перспективные.

Для этого химик должен понимать, какие классы соединений есть в базе данных. Однако пролистать многотысячный список молекул — занятие тяжелое и в общем неблагодарное.

Хорошая идея — разместить молекулы в виде точек на плоскости или в пространстве так, чтобы похожие молекулы оказались рядом.

Тогда появляется возможность изучать химическое пространство при помощи простой программы — наподобие того, как географ может изучать ландшафт при помощи электронных карт на разных масштабах: для общего понимания ситуации и детального анализа отдельных участков.

Однако как добиться того, чтобы алгоритм сам распределил молекулы в нужных местах на плоскости, не закладывая в программу знания о химии?

Совместная группа исследователей из центра Сколтеха CDISE (Дмитрий Карлов, Сергей Соснин и Максим Федоров) и Мюнхенского центра имени Гельмгольца (Игорь Тетко. HMGU) использовали методы искусственного интеллекта, которые позволяют извлекать информацию непосредственно из данных.

Ученые «скрестили» популярный метод снижения размерности t-SNE с глубокой нейронной сетью.

Это позволило создать нейронную сеть, которая, получив (многомерную) структуру интересующего соединения на вход, генерирует координаты этого соединения в наглядном двумерном виде на некой плоскости.

При этом молекулы со схожими свойствами оказываются расположены рядом, что позволяет группировать соединения по классам, соответствующим тому или иному свойству.

Авторы исследования обучили нейросеть на миллионах соединений с известной биологической активностью.

«Мы адаптировали метод t-SNE для визуализации химического пространства фармацевтически интересных соединений, натренировав глубокую нейросеть и выбрав удобные дескрипторы, а также метрику для расчета расстояний в многомерном пространстве.

Мы также показали, что этот подход позволяет сохранить больше информации по сравнению с некоторыми другими методами снижения размерности, а скорость работы сравнима со скоростью работы метода главных компонент», — рассказывает научный сотрудник Сколтеха и первый автор исследования Дмитрий Карлов.

Ученые планируют в дальнейшем создать ряд программ для химиков и фармацевтов, которые позволят исследователям посмотреть, как распределены новые, неизученные соединения относительно уже изученных и описанных в литературе. Это поможет быстрее выполнять R&D-фазу исследований при поиске новых лекарств.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Сколтех
80 статей
Сколковский институт науки и технологий — негосударственный технологический университет, расположенный в инновационном центре Сколково. Институт был создан в 2011 году при поддержке Массачусетского технологического института. Модель института предусматривает тесную интеграцию технологического образования, исследовательской работы и предпринимательских навыков. Институт ведёт обучение по программам магистратуры и PhD, рабочий язык — английский.
Вчера, 18:27
7 минут
Полина Гершберг

Мужчина, выглядящий легко поддающимся манипуляциям и давлению, не повышает вероятность того, что женщина выберет его в качестве сексуального партнера.

Вчера, 18:54
5 минут
Мария Азарова

По мнению исследователей, мидии погибли вследствие «теплового стресса», вызванного повышением температуры океана.

Вчера, 20:14
5 минут
Полина Гершберг

Отпечатки лап некоего четырехлапого динозавра, которые озадачили палеонтологов более 60 лет назад, оказались не тем, чем предполагалось изначально.

12 февраля
36 минут
Александр Березин

Сегодняшние удары турецкой армии в Сирии производят несколько шокирующее впечатление, но только до тех пор, пока мы не обратимся к истории. Напомним: главу Турции не так давно пытались ликвидировать в заговоре, поддерживаемом ЦРУ. И только информация из России позволила ему в последний момент спастись. У Анкары нет ни одного настоящего союзника на Западе. Фактически у нее вообще один заметный союзник: Москва. В этой ситуации Эрдоган внезапно бьет по сирийцам — другому партнеру России. Что это? Новый «удар в спину», как по Су-24 в 2015 году? Или как по Севастополю в 1914 году? Лавры Османской империи не дают покоя и тянут турок к внешнеполитическому самоубийству? Попробуем с точки зрения истории разобраться, зачем Турция сегодня, как и сто лет назад, принимает столь странные решения — и почему, на самом деле, они логичны.

13 февраля
5 минут
Полина Гершберг

Олигосахарид под названием 2’-фукозиллактоза оказался критически важным для когнитивных способностей детей.

14 февраля
4 минуты
Полина Гершберг

Болезнь подтверждена у 472 и подозревается более чем у полутора тысяч человек. Как минимум 70 уже скончались.

11 февраля
4 минуты
Сергей Васильев

Экспериментальные данные указали на виды физических нагрузок, которые стимулируют нейропластичность мозга.

28 января
25 минут
Александр Березин

Недавняя научная работа предрекла серьезную эпидемию коронавируса 2019-nCoV. Согласно ей, 95% зараженных еще не зарегистрированы властями, а значит, через пару недель в одной Ухани будут сотни тысяч заболевших. При наблюдаемой смертности от вируса в 2,36% — это многие тысячи погибших. На самом деле, новая работа скорее «ловит хайп» или, если угодно, пытается держать мир настороже, чем описывает реальную эпидемию. Последние данные по заразности коронавируса показывают: он действительно неблестяще передается от человека к человеку. Для эпидемии в Китае этого достаточно, но большое число жертв за пределами этой страны маловероятно. Выясняем почему.

28 января
3 минуты
Полина Гершберг

Ученые создали информационную панель, показывающую распространение китайского коронавируса по миру в режиме реального времени. Данные вносятся из подтвержденных источников — это поможет бороться с дезинформацией.

[miniorange_social_login]

Комментарии

Написать комментарий

Подтвердить?
Лучшие материалы
Предстоящие мероприятия
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: