Влияние смены базиса на эффективность квантовых нейронных сетей

Автор: Денис Аветисян


Новое исследование показывает, как изменение представления квантового состояния может существенно ухудшить процесс оптимизации, даже если энергетический ландшафт остается неизменным.

🧐

Купил акции по совету друга? А друг уже продал. Здесь мы учимся думать своей головой и читать отчётность, а не слушать советы.

Бесплатный телеграм-канал
Для системы из пяти кубитов ($N=5$) при $h=0.5$ и $J=-1$ (верхний график) или $J=+1$ (нижний график), расстояние Фубини ($γ$) и функция потерь ($\mathcal{L}$) демонстрируют сопоставимое поведение при обучении NQS с минимизацией неверности, переходя от начального состояния $|ψ⟩ = 1/\sqrt{2^{N}}\sum\_{s\in\{\pm 1\}^{N}}\lvert s\rangle$ к целевому, повернутому основному состоянию $|φ(ϕ)\rangle$ в зависимости от угла поворота $ϕ$.
Для системы из пяти кубитов ($N=5$) при $h=0.5$ и $J=-1$ (верхний график) или $J=+1$ (нижний график), расстояние Фубини ($γ$) и функция потерь ($\mathcal{L}$) демонстрируют сопоставимое поведение при обучении NQS с минимизацией неверности, переходя от начального состояния $|ψ⟩ = 1/\sqrt{2^{N}}\sum\_{s\in\{\pm 1\}^{N}}\lvert s\rangle$ к целевому, повернутому основному состоянию $|φ(ϕ)\rangle$ в зависимости от угла поворота $ϕ$.

Работа посвящена изучению зависимости производительности Neural Quantum States от выбора базиса и анализу влияния поворотов базиса на сложность оптимизации.

Несмотря на успехи нейронных квантовых состояний (NQS) в моделировании квантовых систем, зависимость их производительности от выбора базиса остается недостаточно изученной. В работе ‘Exploring the Effect of Basis Rotation on NQS Performance’ исследуется влияние вращений базиса на оптимизацию NQS, демонстрируя, что даже при неизменности энергетического ландшафта, перенос волновой функции в пространстве параметров может значительно ухудшить сходимость. Показано, что вращения базиса приводят к увеличению кривизны ландшафта и затрудняют представление целевого состояния, особенно для неглубоких архитектур, обученных с использованием квантового естественного градиента. Какие новые стратегии проектирования моделей и алгоритмов оптимизации необходимы для преодоления этих информационно-геометрических барьеров и повышения эффективности вариационного обучения NQS?


Квантовые состояния в нейронной сети: преодолевая экспоненциальную сложность

Традиционные методы описания квантовых систем, состоящих из множества взаимодействующих частиц, сталкиваются с проблемой экспоненциального роста вычислительной сложности. По мере увеличения числа частиц, необходимых для точного моделирования, объём вычислений и требуемая память растут настолько быстро, что даже умеренно сложные системы оказываются недоступны для симуляции на современных компьютерах. Это связано с тем, что для полного описания квантового состояния $N$ частиц требуется хранить и обрабатывать информацию, растущую экспоненциально с $N$. В результате, исследование свойств материалов, моделирование химических реакций и разработка новых квантовых технологий оказываются серьёзно ограничены вычислительными ресурсами, что стимулирует поиск альтернативных подходов к решению этой фундаментальной проблемы.

Нейронные квантовые состояния (НКС) представляют собой вариационный подход к моделированию сложных квантовых систем, использующий выразительную силу нейронных сетей. Вместо традиционных методов, которые сталкиваются с экспоненциальным ростом вычислительной сложности при увеличении числа частиц, НКС кодируют квантовые волновые функции в обучаемых параметрах нейронной сети. Этот подход позволяет аппроксимировать $|Ψ⟩$, квантовое состояние системы, с использованием архитектуры нейронной сети, где каждый нейрон и связь между ними описывают определенные характеристики волновой функции. Вариационный принцип гарантирует, что энергия, вычисленная с использованием параметров нейронной сети, всегда будет выше или равна истинной энергии основного состояния, что позволяет оптимизировать параметры сети для получения наиболее точного приближения. Таким образом, НКС открывают перспективные возможности для исследования квантовых систем, которые ранее были недоступны для численного моделирования.

Нейронные квантовые состояния (НКС) представляют собой инновационный подход к моделированию квантовых систем, где волновые функции, описывающие поведение частиц, кодируются в обучаемых параметрах нейронных сетей. В отличие от традиционных методов, требующих экспоненциального увеличения вычислительных ресурсов с ростом числа частиц, НКС используют способность нейронных сетей аппроксимировать сложные функции, позволяя эффективно представлять и исследовать квантовые состояния. Этот метод открывает перспективу проведения численных симуляций систем, которые ранее считались недоступными из-за ограничений вычислительной мощности, предоставляя возможность изучения новых материалов и явлений в квантовой механике. Благодаря способности НКС адаптироваться и обучаться, они способны описывать коррелированные квантовые состояния, которые являются ключевыми для понимания сложных квантовых систем, и потенциально могут революционизировать области от материаловедения до квантовой химии и физики высоких энергий.

Изменение энтропии коэффициентов векторного состояния в процессе обучения (τ=5000 итераций, h=0.5, N=5, 7, 9) для модели logRBM (α=1) при J=-1 (верхний график) и J=+1 (нижний график) показывает зависимость от угла поворота ϕ.
Изменение энтропии коэффициентов векторного состояния в процессе обучения (τ=5000 итераций, h=0.5, N=5, 7, 9) для модели logRBM (α=1) при J=-1 (верхний график) и J=+1 (нижний график) показывает зависимость от угла поворота ϕ.

Оптимизация нейронных квантовых состояний: градиентный подход

В основе обучения нейронных квантовых состояний (NQS) лежит минимизация энергии, направленная на поиск параметров сети, соответствующих основному состоянию (состоянию с наименьшей энергией) рассматриваемой квантовой системы. Этот процесс предполагает определение значений весов и смещений в нейронной сети таким образом, чтобы выход сети соответствовал волновой функции основного состояния $ \Psi_0 $ для заданного гамильтониана $ \hat{H} $. Минимизация энергии достигается путем вычисления ожидаемого значения энергии $ \langle \Psi(\theta) | \hat{H} | \Psi(\theta) \rangle $, где $ \Psi(\theta) $ — выход нейронной сети, зависящий от параметров $ \theta $, и последующей оптимизации этих параметров с использованием алгоритмов градиентного спуска или их модификаций.

Рельеф функции потерь оказывает существенное влияние на процесс оптимизации нейронных квантовых состояний. Наличие седловых точек и плоских областей в ландшафте функции потерь может значительно замедлить или даже остановить сходимость алгоритма. Седловые точки, где градиент равен нулю, но не является минимумом, требуют специальных методов оптимизации для преодоления. Плоские области, характеризующиеся малым градиентом, приводят к медленным шагам оптимизации и затрудняют достижение минимума энергии. Характеристики рельефа функции потерь напрямую влияют на эффективность и скорость обучения нейронных квантовых сетей, определяя необходимость использования продвинутых алгоритмов оптимизации и техник регуляризации для преодоления возникающих трудностей.

Квантовый метод естественного градиента (Quantum Natural Gradient) представляет собой усовершенствованный алгоритм оптимизации, используемый в обучении нейронных квантовых состояний. В отличие от стандартного градиентного спуска, данный метод адаптирует шаг оптимизации, учитывая информацию Фишера — меру чувствительности вероятностного распределения к изменениям параметров модели. Вычисление $F_{ij} = \langle \frac{\partial \log P(\theta)}{\partial \theta_i} \frac{\partial \log P(\theta)}{\partial \theta_j} \rangle$ позволяет сформировать матрицу информации Фишера, которая используется для предварительного умножения градиента, тем самым корректируя направление и величину шага оптимизации. Использование информации Фишера способствует более быстрой сходимости и повышению устойчивости процесса обучения, особенно в случаях сложных ландшафтов функций потерь, характеризующихся наличием седловых точек и плоских областей.

Сравнение алгоритмов Ланцоша, DMRG и RBM на примере ферромагнитной модели Изинга (N=5, h=-0.5, φ=π/3) показывает, что все три алгоритма сходятся к одной и той же седловой точке, что подтверждается анализом энергии и траекторий состояний, спроецированных с помощью UMAP.
Сравнение алгоритмов Ланцоша, DMRG и RBM на примере ферромагнитной модели Изинга (N=5, h=-0.5, φ=π/3) показывает, что все три алгоритма сходятся к одной и той же седловой точке, что подтверждается анализом энергии и траекторий состояний, спроецированных с помощью UMAP.

Уточнение оптимизации: стохастическая реконфигурация и выбор базиса

Стохастическая реконфигурация является расширением метода квантового естественного градиента и предполагает итеративное обновление параметров сети на основе информации о локальной кривизне. В отличие от традиционных методов оптимизации, которые могут игнорировать геометрию пространства параметров, стохастическая реконфигурация использует вычисленную кривизну для более эффективного поиска минимумов функции потерь. Этот подход позволяет адаптировать шаги оптимизации к локальному ландшафту, что может привести к ускорению сходимости и улучшению качества найденных решений, особенно в задачах, где пространство параметров сильно изогнуто или содержит узкие долины.

Выбор базиса оказывает существенное влияние на процесс оптимизации квантовых нейронных сетей. Метод ротации базиса (Basis Rotation) представляет собой технику, позволяющую исследовать различные представления параметров сети, что потенциально может улучшить сходимость алгоритма. Изменение базиса фактически преобразует пространство параметров, влияя на кривизну ландшафта функции потерь и, следовательно, на траекторию оптимизации. Использование ротации базиса позволяет избежать локальных минимумов и найти более оптимальные решения, хотя и может потребовать дополнительных вычислительных затрат на пересчет градиентов в новой системе координат.

Исследование продемонстрировало, что вращения базиса, сохраняя спектр Гамильтониана, оказывают влияние на сходимость процесса оптимизации, что указывает на чувствительность к кривизне ландшафта. Наблюдаемая относительная погрешность энергии, не превышающая 0.5 в некоторых вращенных конфигурациях, свидетельствует о возможном ухудшении точности решения, несмотря на кажущуюся незначительность ошибки. Это указывает на то, что даже небольшие отклонения в базисе могут приводить к существенным изменениям в скорости и качестве сходимости алгоритма, подчеркивая важность выбора базиса для эффективной оптимизации.

Анализ относительной ошибки энергии показал, что при использовании архитектуры logRBM (α=4) и оптимизации случайной реконфигурации (τ=10⁵, η=1e-2, δ=1e-6) достигается точное определение седловых точек, соответствующее разнице между энергией основного и первого возбужденного состояний.
Анализ относительной ошибки энергии показал, что при использовании архитектуры logRBM (α=4) и оптимизации случайной реконфигурации (τ=10⁵, η=1e-2, δ=1e-6) достигается точное определение седловых точек, соответствующее разнице между энергией основного и первого возбужденного состояний.

Оценка точности квантового состояния и запутанности

Неточность, или infidelity, выступает ключевым показателем для оценки достоверности представления истинного квантового состояния нейронной сетью. Данная метрика количественно определяет степень различия между воссозданным сетью состоянием и исходным, реальным состоянием системы. Низкое значение неточности указывает на высокую степень соответствия и, следовательно, на успешное моделирование квантовой системы нейронной сетью. По сути, неточность позволяет выявить, насколько хорошо сеть способна уловить все нюансы и корреляции, присущие исследуемому квантовому состоянию. Особенно важно, что неточность является чувствительным индикатором ошибок, возникающих при приближении сложных квантовых состояний, и позволяет определить границы применимости нейросетевых методов для моделирования квантовых систем. Ее значение используется для калибровки и оптимизации архитектуры нейронной сети, а также для оценки качества полученных результатов.

Энтропия запутанности предоставляет ценную информацию об уровне квантовых корреляций, зафиксированных представлением NQS. Данный показатель служит своеобразным индикатором сложности системы, поскольку высокая энтропия запутанности указывает на сильные взаимосвязи между кубитами, которые трудно смоделировать классическими методами. Исследование демонстрирует, что способность NQS адекватно воспроизводить запутанные состояния напрямую связана с качеством полученного представления, а потеря корреляций приводит к снижению точности и, как следствие, к неверным результатам. Таким образом, анализ энтропии запутанности позволяет оценить, насколько полно NQS улавливает фундаментальные свойства квантовых систем и отражает их внутреннюю сложность.

Исследование продемонстрировало, что величина энтропии Шеннона, характеризующая квантовую когерентность, закономерно возрастает с увеличением угла поворота квантового состояния. Это указывает на то, что повернутые состояния обладают большей сложностью и, как следствие, представляют значительные трудности для представления с помощью неглубоких нейронных квантовых сетей (NQS). В частности, для антиферромагнитных систем с количеством кубитов более пяти (N>5), NQS не демонстрирует сходимости, что напрямую связано с увеличением когерентности и сложностью представления этих повернутых состояний. Таким образом, способность NQS эффективно моделировать квантовые системы ограничена сложностью состояния и, в частности, чувствительна к величинам, характеризующим квантовую когерентность, таким как энтропия Шеннона $S = — \sum_{i} p_{i} \log_{2} p_{i}$.

Проекция UMAP траекторий NQS демонстрирует различные энергетические ландшафты, отраженные в цвете, который указывает на отклонение от основного состояния ферромагнитной модели Изинга с N=5 и h=0.5.
Проекция UMAP траекторий NQS демонстрирует различные энергетические ландшафты, отраженные в цвете, который указывает на отклонение от основного состояния ферромагнитной модели Изинга с N=5 и h=0.5.

Перспективы: повышение выразительности и масштабируемости

Выбор архитектуры нейронной сети в рамках нейро-квантовых схем (NQS) оказывает существенное влияние на её выразительность и масштабируемость. Различные типы сетей, такие как машины Больцмана с ограничениями или сети прямого распространения, обладают уникальными свойствами, определяющими их способность эффективно представлять и обрабатывать квантовую информацию. Например, машины Больцмана, благодаря своей вероятностной природе, могут лучше захватывать сложные корреляции в квантовых состояниях, однако их обучение часто требует значительных вычислительных ресурсов. Сети прямого распространения, напротив, демонстрируют большую скорость обучения, но могут быть ограничены в способности представлять нелинейные зависимости, характерные для квантовых систем. Исследование компромисса между выразительностью и вычислительной сложностью различных архитектур нейронных сетей является ключевым направлением для дальнейшего развития NQS и расширения их возможностей для моделирования все более сложных квантовых явлений.

Количественная оценка и улучшение представления квантовой когерентности остается одной из ключевых задач в развитии нейросетевых квантовых схем. Когерентность, фундаментальное свойство квантовых систем, определяющее их способность к выполнению вычислений, трудно поддается непосредственному измерению и эффективному представлению в классических нейронных сетях. Исследователи активно используют такие меры, как энтропия Шеннона $H = — \sum_{i} p_i \log_2 p_i$, для характеристики степени когерентности, однако поиск оптимальных способов интеграции этих показателей в архитектуру нейронных сетей и повышение их чувствительности к слабым сигналам когерентности представляет собой сложную задачу. Успешное решение этой проблемы позволит значительно расширить возможности моделирования квантовых систем и повысить точность предсказаний, полученных с помощью нейросетевых квантовых схем.

Перспективные исследования направлены на разработку более эффективных алгоритмов оптимизации, способных значительно ускорить обучение нейросетевых квантовых схем (NQS). Ученые стремятся преодолеть вычислительные ограничения, возникающие при моделировании сложных квантовых систем, используя NQS. Особое внимание уделяется поиску пределов применимости NQS, то есть определению максимальной сложности квантовой системы, которую можно достоверно эмулировать с использованием текущих и будущих вычислительных ресурсов. Повышение эффективности алгоритмов и расширение масштабируемости NQS позволит решать задачи, непосильные для классических компьютеров, в областях, таких как материаловедение, химия и разработка новых лекарственных препаратов. Исследования в этом направлении также включают поиск новых архитектур нейронных сетей, оптимизированных для работы с квантовыми данными и способных эффективно представлять $когерентные$ квантовые состояния.

Исследование влияния поворота базиса на производительность Neural Quantum States демонстрирует, что даже при сохранении энергетического ландшафта неизменным, изменение представления квантового состояния может существенно ухудшить оптимизацию. Это связано с увеличением кривизны и сложностью представления состояния. Как заметил Макс Планк: «Тот, кто не верит в возможность квантовых скачков, тот ничего не понимает в природе». Эта фраза перекликается с идеей о том, что незначительные изменения в базисе, подобно квантовому скачку, могут привести к значительным изменениям в процессе оптимизации, подчеркивая нелинейность и сложность квантовых систем. Статья указывает на то, что контроль над оптимизацией является иллюзией, а влияние локальных правил представления состояния — реальностью, что соответствует философскому подходу, где порядок возникает из локальных правил, а не из централизованного контроля.

Куда же дальше?

Представленные результаты, хотя и демонстрируют чувствительность вариационных методов к выбору базиса, лишь приоткрывают завесу над более глубоким вопросом. Кажется, оптимизация, подобно воде, всегда находит путь, но этот путь может быть бесконечно удлинен или усложнен искусственными ограничениями, в данном случае — произвольным базисом. Не стоит искать архитектора порядка; он возникает из локальных взаимодействий, а не из глобального контроля. Задача не в том, чтобы «найти лучший» базис, а в том, чтобы понять, как снизить зависимость от него, как позволить системе самой адаптироваться к изменениям представления.

Очевидным направлением дальнейших исследований представляется изучение инвариантных характеристик, тех свойств, которые остаются неизменными при смене базиса. Упор, вероятно, следует сделать на метрики, нечувствительные к координатным преобразованиям, и на методы оптимизации, ориентированные не на поиск минимума функции, а на следование градиенту информации. Иногда, как ни парадоксально, пассивность — отказ от активного управления — оказывается более эффективным инструментом, позволяя системе самоорганизоваться.

В конечном счете, данная работа подчеркивает фундаментальную истину: сложность не всегда требует сложных решений. Попытки контролировать каждый аспект оптимизации могут привести к непредвиденным последствиям. Гораздо перспективнее позволить системе эволюционировать, используя естественные принципы самоорганизации и избегая искусственных ограничений.


Оригинал статьи: https://arxiv.org/pdf/2512.17893.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-12-23 00:50