Искусственный интеллект поможет построить карту химического пространства

Исследователи из Сколтеха и Мюнхенского центра имени Гельмгольца создали нейронную сеть для визуализации химического пространства соединений, представляющих интерес для фармацевтики.

2 855

Выбор редакции

Ученые из Сколтеха (Центр научных и инженерных вычислительных технологий для задач с большими массивами данных) и Мюнхенского центра имени Гельмгольца по исследованию окружающей среды и здоровья (HMGU, Германия) создали нейронную сеть для визуализации химического пространства соединений, которые представляют интерес для фармацевтики.

 

Разработанный метод поможет создавать новые химические соединения и ориентироваться в пространстве уже имеющихся. Результаты исследования опубликованы в журнале RSC Advances.

 

Перед химиками часто возникает задача проанализировать огромные базы данных, содержащие десятки и сотни тысяч химических структур, и отобрать среди них наиболее перспективные.

 

Для этого химик должен понимать, какие классы соединений есть в базе данных. Однако пролистать многотысячный список молекул занятие тяжелое и в общем неблагодарное.

 

Хорошая идея разместить молекулы в виде точек на плоскости или в пространстве так, чтобы похожие молекулы оказались рядом.

 

Тогда появляется возможность изучать химическое пространство при помощи простой программы — наподобие того, как географ может изучать ландшафт при помощи электронных карт на разных масштабах: для общего понимания ситуации и детального анализа отдельных участков.

 

Однако как добиться того, чтобы алгоритм сам распределил молекулы в нужных местах на плоскости, не закладывая в программу знания о химии?

 

Совместная группа исследователей из центра Сколтеха CDISE (Дмитрий Карлов, Сергей Соснин и Максим Федоров) и Мюнхенского центра имени Гельмгольца (Игорь Тетко. HMGU) использовали методы искусственного интеллекта, которые позволяют извлекать информацию непосредственно из данных.

 

Ученые «скрестили» популярный метод снижения размерности t-SNE с глубокой нейронной сетью.

 

Это позволило создать нейронную сеть, которая, получив (многомерную) структуру интересующего соединения на вход, генерирует координаты этого соединения в наглядном двумерном виде на некой плоскости.

 

При этом молекулы со схожими свойствами оказываются расположены рядом, что позволяет группировать соединения по классам, соответствующим тому или иному свойству.

 

Авторы исследования обучили нейросеть на миллионах соединений с известной биологической активностью.

 

«Мы адаптировали метод t-SNE для визуализации химического пространства фармацевтически интересных соединений, натренировав глубокую нейросеть и выбрав удобные дескрипторы, а также метрику для расчета расстояний в многомерном пространстве.

 

Мы также показали, что этот подход позволяет сохранить больше информации по сравнению с некоторыми другими методами снижения размерности, а скорость работы сравнима со скоростью работы метода главных компонент», — рассказывает научный сотрудник Сколтеха и первый автор исследования Дмитрий Карлов.

 

Ученые планируют в дальнейшем создать ряд программ для химиков и фармацевтов, которые позволят исследователям посмотреть, как распределены новые, неизученные соединения относительно уже изученных и описанных в литературе. Это поможет быстрее выполнять R&D-фазу исследований при поиске новых лекарств.

Naked Science Facebook VK Twitter
Сколтех
50Статей
Негосударственный технологический университет, расположенный в инновационном центре Сколково. Институт был создан в 2011 году при поддержке Массачусетского технологического института.
2 855
Комментарии
Аватар пользователя Андрей Бочаровский
Вчера
Пока мы не видели вселенную, ее не было...Или кто-то...
Аватар пользователя Дмитрий Дроздов
Вчера
Твою мать, куда нужно нажать, чтобы начать его...
17 апр
Я фигею, это что за статья? Для ТП? Никаких...

Колумнисты

Физтех
126Статей
Сколтех
50Статей
Discovery Channel
36Статей
ТюмГУ
13Статей
СФУ
11Статей
Комментарии

Быстрый вход

Или авторизуйтесь с помощью:

на сайте, чтобы оставить комментарий.
Вы сообщаете об ошибке в следующем тексте:
Нажмите Отправить ошибку