Физика

Глубокое обучение с подкреплением вводит квантовую систему в «состояние кота Шредингера»

Физики из Японии и Австралии при помощи моделирования показали, что одна из разновидностей машинного обучения — обучение с подкреплением — подходит для точного управления квантовым состоянием системы.

Чтобы эффективно использовать квантовые системы для записи, хранения и обработки информации, нужны методы, которые позволяют точно измерять состояние квантовой системы и управлять ею. Проблема в том, что в квантовом мире любое взаимодействие системы с окружающей средой, включая произведенные измерения, немного изменяет ее состояние. Это приводит к ошибкам, которые затрудняют управление квантовыми системами, особенно в реальном времени.

Для поддержания системы в желаемом состоянии используют системы управления с обратной связью, которые реагируют на небольшие изменения системы и возвращают ее в требуемое состояния. Для простых систем силу, которую нужно при этом приложить, можно рассчитать аналитически. Однако в более сложных — и приближенных к реальной жизни — случаях готового решения нет.

В своей работе с использованием моделирования физики показали, что глубокое обучение с подкреплением эффективно справляется с этой задачей для системы с нелинейным гамильтонианом — функцией, которая описывает ее полную энергию. Обучением с подкреплением называют один из методов машинного обучения, при котором алгоритм обучается, взаимодействуя со средой и получая обратную связь. Значит, в каждом цикле обучения алгоритм как-то воздействует на состояние квантовой системы, а затем узнает, что из этого вышло.

До обучения взаимодействия были случайными, и поначалу алгоритму не удавалось поддерживать систему в нужном состоянии:

Шарик на холме визуализирует систему в нужном квантовом состоянии, задача алгоритма — удержать шарик в синей области / © Okinawa Institute of Science and Technology

Но уже через 300 циклов обучения эта задача давалась алгоритму довольно легко:

Шарик остается в синей зоне, но колебания его положения (красная линия) еще довольно большие / © Okinawa Institute of Science and Technology

А спустя 5000 циклов амплитуда необходимых воздействий стала минимальной:

Шарик на месте, колебания амплитуды приложенной силы (синяя линия), как и колебания положения шарика (красная линия), минимальны / © Okinawa Institute of Science and Technology

Таким образом, ученым удалось показать, что глубокое обучение с подкреплением эффективно возвращает систему в почти чистое «состояние кота Шредингера», при котором система находится одновременно в двух состояниях, как и кот в знаменитом мысленном эксперименте Эрвина Шредингера. При этом обучение происходит полностью автономно. Авторы статьи считают, что в дальнейшем и другие методы искусственного интеллекта можно использовать для управления квантовыми системами.

Статья с результатами исследования опубликована в журнале Physical Review Letters.