Физика

Физики создали квантовую нейросеть, способную к обучению

Исследователи из США и Великобритании определили, что сверточные нейронные сети не страдают от проблемы «бесплодного плато» и гарантированно обучаемы. Такую архитектуру можно будет использовать для анализа данных при помощи квантовых компьютеров.

Квантовые нейронные сети вызывают ажиотаж вокруг возможности эффективного анализа квантовых данных. Но это волнение сдерживает проблема так называемого бесплодного плато, характерная для многих архитектур нейронных сетей. В процессе обучения нейронная сеть движется по ландшафту функции потерь, стараясь найти самую нижнюю точку. Попадая в «бесплодное плато», она не чувствует достаточного перепада высот и, соответственно, не может определить, в каком направлении двигаться дальше. В результате натренировать нейронную сеть не удается.

В своей работе ученые решили проверить, будут ли от проблемы «бесплодного плато» страдать сверточные нейронные сети. При их создании вдохновлялись строением зрительной коры головного мозга. Сверточные нейронные сети состоят из череды слоев с постепенно снижающейся размерностью, которые сохраняют ключевые особенности набора данных. Такую структуру нейросетей используют для самых разных задач — от анализа изображений до распознавания речи.

Авторам исследования удалось показать, что квантовые сверточные нейронные сети невосприимчивы к «бесплодному плато», в отличие от многих других архитектур нейронных сетей. Это особенно актуально при увеличении размерности данных. Ученые предполагают, что масштабируемые и обучаемые квантовые нейронные сети подойдут для анализа и моделирования материалов с высокотемпературной сврехпроводимостью, на которые одновременно влияют множество параметров: температура, давление, наличие примесей и разница фаз. Классическим компьютерам такие вычисления не под силу.

Кроме того, авторы работы представляют новую методику, основанную на графах, с помощью которой они анализировали чувствительность нейронной сети к «бесплодному плато». Исследователи предполагают, что она может быть полезна и в других приложениях.

Статья с подробным описанием структуры нейросети и доказательствами ее обучаемости опубликована в журнале Physical Review X.

Комментарии

  • Да да... Материалы со сверхпроводимостью, как же. Знаем мы для чего эти сети будут использоваться. Для слежки и сбора данных.

  • Автор похоже не понял про что пишет. Классические "Сверточные нейронные сети" и квантовые это совсем разные в плане обучения вещи. И классические сверточные сети в той же мере имеют проблемы с упомянутым плато, как и остальные сети - методы обучения одни и те же. А вот квантовые сети не нуждаются в градиенте для обучения и соответственно гораздо более перспективны.

    • По крайней мере в данном случае имхо это не так - в оригинальной статье вводится и анализируется минимум функции потерь градиентным спуском, при определенных предположениях. Вот цитата:
      "Here we provide a rigorous analysis of the scaling of the QCNN cost function gradient, under the following assumptions: (1) All the two-qubit unitaries in the QCNN form independent (and uncorrelated) 2-designs and (2) the cost function is linear with respect to the input density matrix."

  • На мой (пока непрофессиональный, к сожалению) взгляд, содержание статьи передано не совсем верно.
    Дело в том, что _любая_ квантовая нейросеть (QNN) _в принципе_ выходит из "бесплодного плато" и _в принципе_ рано или поздно достигает глобального минимума - за счет туннельного эффекта. Вопрос в том, насколько эффективно (быстро и с минимумом ресурсов) она это делает. Авторы предлагают для сверточных нейросетей (CQNN) новый метод (GRIM), который позволяет, используя рекурсию, построить граф для оптимальной (экономия ресурсов - кубитов, как понимаю) оценки функции ошибок и показывают (оценивая минимальные значения градиентов), что минимума можно достичь за разумное число итераций (т.е. реальное отсутствие "бесплодного плато").