Глубокое обучение с подкреплением вводит квантовую систему в «состояние кота Шредингера»
Кот Шредингера, находящийся одновременно в двух квантовых состояниях, в представлении художника. / © Okinawa Institute of Science and Technology / Автор: Владимир Богданов
Чтобы эффективно использовать квантовые системы для записи, хранения и обработки информации, нужны методы, которые позволяют точно измерять состояние квантовой системы и управлять ею. Проблема в том, что в квантовом мире любое взаимодействие системы с окружающей средой, включая произведенные измерения, немного изменяет ее состояние. Это приводит к ошибкам, которые затрудняют управление квантовыми системами, особенно в реальном времени.
Для поддержания системы в желаемом состоянии используют системы управления с обратной связью, которые реагируют на небольшие изменения системы и возвращают ее в требуемое состояния. Для простых систем силу, которую нужно при этом приложить, можно рассчитать аналитически. Однако в более сложных — и приближенных к реальной жизни — случаях готового решения нет.
В своей работе с использованием моделирования физики показали, что глубокое обучение с подкреплением эффективно справляется с этой задачей для системы с нелинейным гамильтонианом — функцией, которая описывает ее полную энергию. Обучением с подкреплением называют один из методов машинного обучения, при котором алгоритм обучается, взаимодействуя со средой и получая обратную связь. Значит, в каждом цикле обучения алгоритм как-то воздействует на состояние квантовой системы, а затем узнает, что из этого вышло.
До обучения взаимодействия были случайными, и поначалу алгоритму не удавалось поддерживать систему в нужном состоянии:
Но уже через 300 циклов обучения эта задача давалась алгоритму довольно легко:
А спустя 5000 циклов амплитуда необходимых воздействий стала минимальной:
Таким образом, ученым удалось показать, что глубокое обучение с подкреплением эффективно возвращает систему в почти чистое «состояние кота Шредингера», при котором система находится одновременно в двух состояниях, как и кот в знаменитом мысленном эксперименте Эрвина Шредингера. При этом обучение происходит полностью автономно. Авторы статьи считают, что в дальнейшем и другие методы искусственного интеллекта можно использовать для управления квантовыми системами.
Статья с результатами исследования опубликована в журнале Physical Review Letters.