В рамках совместной работы физики из Китая и России обучили графовую нейронную сеть поиску кристаллов с высоким показателем двулучепреломления. Разработанный подход позволит ускорить поиск новых материалов с заданными оптическим свойствами.
Результаты опубликованы в журнале Science China Materials. Материалы с высоким показателем двулучепреломления (Δn), особенно в области глубокого ультрафиолета, активно применяются для разработки поляризационных и многих других устройств. Традиционные экспериментальные методы поиска таких материалов занимают много времени и, как правило, сложны в исполнении. Поэтому ученые разработали простой и понятный способ отбора материалов с высоким показателем Δn, используя квантово-механические модели и современные технологии машинного обучения.
При обучении нейросети очень важно правильно подобрать признаки, описывающие тренировочный набор данных. Оптические свойства материала зависят как от его кристаллической структуры, так и от химического состава. Поэтому архитектура модели должна находить взаимосвязи химическим составом, кристаллической структурой и целевым свойством материала.
Одной из таких архитектур, которая сочетает в себе описанные выше свойства, является графовая нейронная сеть. В этом исследовании в качестве основного инструмента использовалась модель графовой нейронной сети ALIGNN. Исследователи обучили ее предсказывать величину двулучепреломления материала, основываясь на кристаллических структурах. Для определения точности предсказании физики добавили критерий D-оптимальности. Этот критерий показывает, насколько надежны предсказания модели на новых данных. Он также оценивает, насколько хорошо характеристики новых материалов «вписываются» в набор данных, использованный для обучения модели.
«Предложенный подход, состоящий из сбора обучающей выборки, разработки моделей машинного обучения и скрининга баз данных, позволил нам найти новые материалы с заданными оптическими свойствами. В будущем данный подход может быть расширен и на другие классы материалов», — рассказывает Иван Круглов, заведующий лабораторией компьютерного дизайна материалов МФТИ.
«Ранее мы не видели работ, где бы использовался критерий D-оптимальности не только для оценки надежности прогнозов модели машинного обучения, но и для оценки “новизны” данных. Также разработанный подход сочетает в себе методы машинного обучения с традиционными квантово-механическими расчетами, что обеспечивает точность и хорошую интерпретируемость результатов. Мы продолжаем разрабатывать модели, используя новые подходы, и, возможно, в ближайшем будущем их качество станет еще лучше!», — пояснила Людмила Березникова, сотрудник лаборатории компьютерного дизайна материалов МФТИ.
Используя обученную графовую нейронную сеть, после скрининга базы данных Materials Project ученые обнаружили два новых материала с высокими значениями двупреломления в области глубокого ультрафиолета: NaYCO3F2 и SClO2F. Найденный материалы имеют Δn = 0,202 и Δn = 0,101 при длине волны равной 1064 нм. Анализ показал, что высокий показатель преломления в NaYCO3F2 обусловлен расположением планарных структурных элементов [CO3]. В случае SClO2F основной вклад в величину Δn дают анизотропные связи S–Cl.
В данной работе впервые продемонстрирована возможность одновременного использования графовой нейронной сети в сочетании с критерием D-оптимальности для точного прогнозирования Δn и поиска новых оптических материалов. Предположительно разработанную модель можно адаптировать для поиска материалов с по другими физическим свойствами, например, твердостью или теплопроводностью.
В работе принимали участие ученые из МФТИ, Синьцзянского технического института физики и химии Китайской академии наук и Центра исследований новых технологий XPANCEO (ОАЭ).