Математика, рожденная машиной: поиск новых закономерностей

Автор: Денис Аветисян


Исследователи разработали систему, способную самостоятельно открывать и формулировать математические концепции, используя методы машинного обучения с подкреплением.

🧐

Купил акции по совету друга? А друг уже продал. Здесь мы учимся думать своей головой и читать отчётность, а не слушать советы.

Бесплатный телеграм-канал
Система EvoAbstract, предназначенная для автоматического поиска оптимальных критериев «интересности» при построении математических теорий, функционирует посредством итеративного процесса, включающего эволюцию популяций программных кандидатов с использованием мутаций, управляемых языковыми моделями, последующую абстракцию высокоэффективных программ для извлечения переиспользуемых подпрограмм и, наконец, оценку полученных программ в среде формирования теорий Fermat с целью получения обратной связи, направляющей дальнейшие этапы эволюции.
Система EvoAbstract, предназначенная для автоматического поиска оптимальных критериев «интересности» при построении математических теорий, функционирует посредством итеративного процесса, включающего эволюцию популяций программных кандидатов с использованием мутаций, управляемых языковыми моделями, последующую абстракцию высокоэффективных программ для извлечения переиспользуемых подпрограмм и, наконец, оценку полученных программ в среде формирования теорий Fermat с целью получения обратной связи, направляющей дальнейшие этапы эволюции.

Представлен Fermat — среда для автоматизированного формирования теорий, и EvoAbstract — метод обучения метрикам интересности на основе больших языковых моделей для управления процессом открытия новых математических идей.

Автоматическое открытие новых математических теорий представляет собой сложную задачу, требующую преодоления ограничений традиционных подходов. В статье ‘Learning Interestingness in Automated Mathematical Theory Formation’ представлен новый подход, основанный на обучении с подкреплением и эволюционных алгоритмах, для автоматизации этого процесса. Ключевым результатом является разработка среды $\emph{FERMAT}$ и метода $\emph{EvoAbstract}$, использующего большие языковые модели для оценки «интересности» математических объектов и направления поиска новых концепций. Возможно ли с помощью подобных инструментов существенно расширить границы математического знания и открыть новые, неожиданные связи?


Автоматическое Открытие Математических Истин: Новый Рубеж

Традиционно, развитие математической теории неразрывно связано с человеческой интуицией и творческим мышлением. Однако, этот подход имеет свои ограничения, поскольку скорость открытия новых математических истин напрямую зависит от когнитивных возможностей и времени, доступного отдельным исследователям. Несмотря на гениальность некоторых математиков, прогресс в сложных областях, таких как теория чисел или топология, может быть замедлен из-за необходимости перебора огромного количества гипотез и доказательств. В то время как интуиция часто направляет исследователя к наиболее перспективным направлениям, она не способна систематически охватить всё пространство возможных математических конструкций. В результате, многие потенциально важные открытия могут оставаться незамеченными, ожидая, когда человеческий разум обратит на них внимание. Именно поэтому автоматизация процесса математического открытия представляется столь перспективной задачей, способной значительно ускорить прогресс в этой фундаментальной науке и выйти за рамки ограничений, присущих человеческому мышлению, например, при поиске закономерностей в сложных $n$-мерных пространствах.

Автоматизация процесса математических открытий требует создания надежной структуры для исследования математических пространств и оценки потенциала новых гипотез. Такая структура включает в себя алгоритмы, способные генерировать математические объекты, такие как формулы или теоремы, а также механизмы для проверки их корректности и значимости. Особое внимание уделяется разработке эффективных методов поиска в огромном пространстве возможных утверждений, чтобы выделить наиболее перспективные направления исследований. Для этого используются различные стратегии, включая эвристический поиск, методы машинного обучения и комбинацию символьных вычислений с численными методами. Например, система может исследовать различные комбинации математических операций и функций, чтобы найти новые тождества или закономерности, или же анализировать существующие математические тексты для выявления скрытых связей и обобщений. Успешная автоматизация требует не только вычислительной мощности, но и глубокого понимания математической логики и принципов построения теорий, что делает эту область исследований междисциплинарной и крайне сложной.

Определение метрики “интересности” представляет собой ключевую проблему в автоматизированном открытии математических закономерностей. Суть заключается в том, чтобы создать алгоритм, способный отличать тривиальные, очевидные утверждения от действительно новых и значимых. Простое перечисление всех возможных математических выражений неэффективно; необходим критерий, оценивающий потенциальную ценность каждого утверждения. Эта оценка может базироваться на сложности формулы, её связи с уже известными теоремами, или даже на её способности порождать новые, нетривиальные следствия. Например, утверждение, содержащее редкую комбинацию математических функций или оперирующее с ранее не связанными областями математики, может быть оценено как более «интересное». Разработка такой метрики требует сочетания математической интуиции и вычислительных методов, поскольку необходимо учитывать субъективность понятия “ценность” и формализовать его для машинного обучения. Успешное решение этой задачи позволит автоматизированным системам не просто генерировать математические утверждения, но и активно направлять поиск к наиболее перспективным направлениям исследований, открывая новые горизонты в математической науке.

Fermat - это среда для формирования математических теорий, в которой агент, основываясь на текущем состоянии знаний в виде графа, выбирает действия для добавления новых определений, гипотез и доказательств, тем самым развивая математическую теорию.
Fermat — это среда для формирования математических теорий, в которой агент, основываясь на текущем состоянии знаний в виде графа, выбирает действия для добавления новых определений, гипотез и доказательств, тем самым развивая математическую теорию.

Fermat: Среда для Исследования Математических Структур

В системе Fermat процесс формирования математических теорий моделируется как Марковский процесс принятия решений (МППР). Это позволяет применять методы обучения с подкреплением для автоматизированного поиска и доказательства новых математических утверждений. В рамках МППР, состояние системы представляет текущий уровень математических знаний, действия — это операции по построению новых определений и гипотез, а награда — оценка правдоподобия и значимости полученных результатов. Формулировка задачи в терминах МППР позволяет использовать алгоритмы обучения с подкреплением, такие как $Q$-learning или Policy Gradient, для оптимизации стратегии исследования математического пространства и максимизации вероятности открытия новых, валидных теорем.

В основе системы Fermat лежит использование ‘Правил Вывода’ (Production Rules) для автоматического построения новых математических определений и гипотез в заданной области знаний. Эти правила представляют собой логические конструкции вида “если выполняется условие A, то можно вывести определение/гипотезу B”. Каждое правило оперирует с элементами, представленными в ‘Графе Знаний’, и позволяет генерировать новые утверждения, которые затем проверяются с помощью ‘Теоремы Доказательства Z3’. Конкретная структура правил вывода может варьироваться в зависимости от области математики, но общий принцип заключается в применении логических преобразований к существующим математическим объектам и отношениям для создания новых утверждений, которые могут быть потенциально интересными или полезными.

Ключевым компонентом системы Fermat является интеграция с решателем теорем Z3, автоматическим доказателем теорем, основанным на методе SAT/SMT. Z3 используется для проверки истинности сгенерированных системой гипотез и утверждений. После того, как Fermat формирует новое математическое утверждение, оно преобразуется в логическую форму, понятную Z3. Z3 затем пытается найти доказательство или опровержение этого утверждения, используя мощные алгоритмы логического вывода. Результат проверки, полученный от Z3, используется для оценки ценности сгенерированной гипотезы и направления дальнейшего поиска новых математических знаний. Интеграция с Z3 позволяет Fermat автоматизировать процесс проверки и отбора математических утверждений, повышая эффективность исследования.

В основе системы Fermat лежит графовая база знаний, представляющая собой структурированное хранилище математических фактов, определений и теорем. Узлы графа соответствуют математическим объектам (например, числам, функциям, множествам), а ребра — отношениям между ними (например, $x \in A$, $f(x) = y$). Данная структура позволяет системе эффективно осуществлять поиск по существующим знаниям, выявлять закономерности и направлять процесс генерации новых гипотез и определений. Граф знаний используется для оценки перспективности различных направлений исследования и выбора наиболее релевантных производственных правил (Production Rules), что существенно повышает эффективность поиска новых математических результатов.

Представленный граф знаний отображает ключевые теоремы и гипотезы, относящиеся к теории конечного поля 𝔽₂₇.
Представленный граф знаний отображает ключевые теоремы и гипотезы, относящиеся к теории конечного поля 𝔽₂₇.

EvoAbstract: Обучение Оценке Математических Понятий

EvoAbstract — это эволюционный алгоритм, управляемый большой языковой моделью (LLM), предназначенный для автоматического поиска оптимальных ‘Метрик Интересности’. В отличие от традиционных методов, требующих ручной разработки этих метрик, EvoAbstract использует LLM для генерации и оценки новых кандидатов. Алгоритм работает итеративно: LLM предлагает новые метрики, которые затем тестируются в среде Fermat, а результаты используются для корректировки процесса генерации. Целью является нахождение таких метрик, которые наиболее эффективно направляют процесс исследования математических концепций и выявления значимых сущностей, что позволяет автоматизировать и ускорить математические открытия.

EvoAbstract использует процесс ‘LLM-управляемой эволюции’ для генерации и уточнения потенциальных метрик, оценивающих интересность математических концепций. В рамках этого процесса, большая языковая модель (LLM) генерирует новые варианты метрик, которые затем оцениваются на основе производительности агентов, работающих в среде Fermat. Производительность агентов, использующих эти метрики для исследования математического пространства, служит сигналом обратной связи, направляющим LLM в процессе дальнейшей оптимизации и уточнения метрик. Таким образом, LLM не просто генерирует случайные метрики, а адаптирует их, основываясь на эмпирических данных, полученных в результате взаимодействия с Fermat.

Обучение абстракциям играет ключевую роль в EvoAbstract, позволяя идентифицировать и повторно использовать ценные подпрограммы из эволюционирующих программ. Этот процесс заключается в автоматическом обнаружении и извлечении общих фрагментов кода, выполняющих определенные математические операции, с последующим применением этих фрагментов в новых поколениях программ. Повторное использование подпрограмм значительно ускоряет процесс обучения, поскольку позволяет избежать повторной разработки одних и тех же функциональных блоков, что приводит к повышению эффективности исследования математического пространства и более быстрому обнаружению целевых сущностей в среде Fermat. Фактически, обнаруженные абстракции позволяют EvoAbstract накапливать знания и применять их для решения новых задач, сокращая время и ресурсы, необходимые для достижения оптимальных результатов.

В результате применения обученных мер «интересности» в среде Fermat значительно повысилась эффективность математических исследований. На тестовом наборе данных arithmetic_base достигнута частота обнаружения истинных сущностей на уровне 23.98%. Этот показатель свидетельствует о том, что разработанные метрики позволяют более эффективно выделять и исследовать перспективные математические объекты, что приводит к повышению скорости и точности обнаружения ключевых элементов в арифметических задачах. Данный результат демонстрирует практическую значимость предложенного подхода к автоматическому поиску и оценке математических концепций.

Эксперименты показали, что методы EvoAbstract и FunSearch превосходят все базовые алгоритмы во всех трех сценариях, при этом EvoAbstract демонстрирует небольшое преимущество на Onarithmetic_base, а FunSearch обеспечивает более устойчивое улучшение на onsucc_zero_eqandff_27.
Эксперименты показали, что методы EvoAbstract и FunSearch превосходят все базовые алгоритмы во всех трех сценариях, при этом EvoAbstract демонстрирует небольшое преимущество на Onarithmetic_base, а FunSearch обеспечивает более устойчивое улучшение на onsucc_zero_eqandff_27.

Расширение Горизонтов Автоматического Открытия

В рамках исследования продемонстрирована принципиальная возможность автоматизации процесса формирования математических теорий посредством объединения систем Fermat и EvoAbstract. Данный подход позволяет не просто проверять гипотезы, но и самостоятельно генерировать новые математические утверждения, используя эволюционные алгоритмы для поиска интересных закономерностей в формальных системах. Интеграция этих инструментов открывает путь к автоматическому обнаружению скрытых связей и обобщений, что подтверждается успешным выявлением новых отношений в областях конечных полей и элементарной теории чисел. В ходе экспериментов зафиксировано, что система способна находить в среднем 22.41 достоверных математических сущностей на специализированном тесте для конечных полей, демонстрируя тем самым свою эффективность в автоматическом расширении математического знания.

Разработанная система, объединяющая алгоритмы Fermat и EvoAbstract, продемонстрировала способность к автоматическому открытию новых связей в областях конечных полей и элементарной теории чисел. В ходе тестирования на специализированном бенчмарке для конечных полей, система успешно идентифицировала в среднем $22.41$ истинных математических сущностей, что свидетельствует о её потенциале для расширения границ математического знания. Этот результат указывает на возможность использования автоматизированных методов для поиска неочевидных закономерностей и углубления понимания фундаментальных математических концепций, открывая путь к новым открытиям и исследованиям.

Исследования показали, что разработанные метрики «интересности» не ограничиваются областью теории чисел, демонстрируя свою универсальность и применимость к другим математическим дисциплинам. В ходе экспериментов, система успешно идентифицировала в среднем 10.23 достоверных сущностей на бенчмарке $succ\_zero\_eq$, предназначенном для проверки способности к обнаружению закономерностей в последовательностях, и 11.34 сущностей на других тестовых наборах. Этот результат подтверждает, что предложенный подход к автоматическому поиску математических связей может быть расширен за пределы первоначального применения, открывая возможности для обнаружения новых знаний в различных областях математики и потенциально способствуя развитию новых направлений исследований.

Данная работа закладывает основу для качественно нового этапа в исследовании математических знаний, предполагающего тесное сотрудничество между человеком и машиной. Вместо последовательной смены ролей, где человек формулирует гипотезы, а компьютер их проверяет, созданная система позволяет машине самостоятельно выявлять потенциально интересные закономерности и предлагать их для дальнейшего анализа. Это не замена человеческой интуиции, а её усиление — машина берет на себя рутинную работу по обработке больших объемов данных и выявлению неочевидных связей, освобождая математика для более творческих задач — формулирования новых теорий и доказательств. Подобный симбиоз открывает перспективы для ускорения научного прогресса и выхода за рамки традиционных методов исследования, позволяя исследовать более сложные и абстрактные математические конструкции, а также находить неожиданные связи между различными областями математики. Созданная платформа, успешно применившаяся в областях конечных полей и элементарной теории чисел, демонстрирует возможность автоматизации процесса формирования математических теорий и служит прототипом для будущих систем, способных к самостоятельному научному открытию.

В ходе работы на задачах succ_zero_eqandarith_base, EvoAbstract самостоятельно обнаружил базовые теоремы теории чисел.
В ходе работы на задачах succ_zero_eqandarith_base, EvoAbstract самостоятельно обнаружил базовые теоремы теории чисел.

Наблюдения за EvoAbstract, стремящейся к «интересным» математическим конструкциям, не могут не вызвать горькой усмешки. Система учится оценивать новизну, а значит, неизбежно наткнётся на то, что «всё новое — это хорошо забытое старое». Как метко заметил Андрей Колмогоров: «Математика — это искусство того, что очевидно». Проблема в том, что «очевидное» быстро тонет в море коммитов и рефакторингов. Fermat, как и любая среда автоматизированного поиска, рано или поздно выплюнет нечто, что когда-то было простым bash-скриптом, замаскированным под «революционное открытие». И тогда кто-то обязательно назовёт это AI и получит инвестиции. Главное, чтобы документация не соврала о принципах работы этой «интересности».

Куда это всё ведёт?

Представленная работа, безусловно, демонстрирует возможность автоматического формирования математических теорий, однако, как и следовало ожидать, открывает больше вопросов, чем даёт ответов. Идея обучения «интересности» через обучение с подкреплением звучит элегантно, но не стоит забывать, что в конечном итоге, эта «интересность» — лишь прокси-метрика, созданная людьми. Вполне вероятно, что система начнёт оптимизировать её, находя тривиальные или бессмысленные решения, которые формально соответствуют критерию, но не представляют никакой ценности. Если система стабильно выдаёт бессмыслицу — значит, она хотя бы последовательна.

Перспективы дальнейших исследований очевидны: необходимо разработать более надёжные и объективные метрики «интересности», которые бы учитывали не только формальные свойства математических объектов, но и их потенциальную полезность или связь с другими областями знания. Использование графов знаний, безусловно, является шагом в правильном направлении, но возникает вопрос о масштабируемости и поддержании актуальности этих графов. В конечном счёте, мы не пишем код — мы просто оставляем комментарии для будущих археологов, которые будут пытаться понять, что мы имели в виду.

Наконец, стоит признать, что вся эта автоматизация — лишь попытка ускорить процесс, который традиционно требовал огромного человеческого труда. И, как показывает история, каждое «революционное» технологическое решение завтра станет техдолгом. «Cloud-native» математика? Звучит дорого.


Оригинал статьи: https://arxiv.org/pdf/2511.14778.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-11-20 17:39