論文標題:Formal Mathematical Reasoning: A New Frontier in AI
論文地址:https://arxiv.org/pdf/2412.16075
從教科書、論文和講義中自動形式化非形式化數學內容
基於數學公理生成合成的猜想和證明
從不同的證明框架和程式碼等資料豐富的領域遷移知識
建立自動形式化語句的評估指標
將形式化過程分解為小步驟
加強與形式系統的互動
增強多步推理、長文字處理、抽象和分層規劃能力
透過合成基準診斷推理失敗之處
利用檢索和搜尋等推理技術輔助模型
對搜尋進行擴充套件以利用更多的測試時間計算;
對模型、搜尋演算法和超引數進行系統性評估;
用於評估證明目標併為其設定優先順序的價值模型。
將大型、高階證明目標逐步分解為較小的目標。
學習在成熟的證明助手中構建新的定義、引理和策略。
為形式數學推理量身定製的檢索器;
處理動態增長的知識庫。
識別跨領域聯絡的通用方法;
針對各個領域的有效性的專家方法以及與數學家合作的專家方法;
將通用方法和專家方法結合起來,例如為 LLM 配備特定領域的工具。
資源、激勵措施和工程開發,以提高可用性和使用者友好性;
研究數學家如何使用形式化工具的行為;
支援大規模分散式協作的工具。
將形式化方法納入 AI 輔助的系統設計和實現中;
增強 AI 進行形式化軟體和硬體驗證的能力;
將基於 AI 的生成與形式化驗證結合起來。