陶哲軒眾包數學專案完成度99.99%:仍未看到AI工具的重大貢獻

机器之心發表於2024-10-13
陶哲軒發起的「眾包」數學研究專案終於快要迎來勝利時刻!

圖片

大約在三週前,陶哲軒提出了一個眾包專案,結合專業和業餘數學家、自動定理證明器、AI 工具和證明輔助語言 Lean, 來描述與 4694 條 magma(原群) 方程定律相關的蘊含圖,這些定律可以使用最多四次 magma 操作呼叫來表達。也即,需要確定這 4694 條定律之間可能蘊含的圖片的真假。

該專案已執行 19 天,從已解決的原始蘊含的角度來看,該專案(截至撰寫本文)已完成 99.9963%:待解決的圖片蘊含中,圖片已被證明為真,圖片已被證明為假,只有圖片懸而未決。儘管在這個集合中,也有圖片蘊含推測為假,但可能很快就正式反駁。

出於編譯效率的原因,他們沒有在 Lean 中記錄這些推測中的每一個證明;只在 Lean 中證明一組較小的蘊含圖片,然後透過傳遞性來暗示一組更廣泛的蘊含(例如,使用以下事實:如果方程 X 蘊含方程 Y,且方程 Y 蘊含方程 Z,則方程 X 蘊含方程 Z);他們還將很快利用蘊含圖的對偶對稱性實現進一步簡化。

除了感謝眾多志願者為該專案付出的不懈努力,陶哲軒表示現在擁有許多出色的視覺化工具來檢查(尚未完成的)蘊含圖的各個部分。例如,下圖描繪了方程 1491:圖片的所有結果,陶哲軒將其暱稱為「Oberlix 定律」(它有一個「同伴」——Asterix 定律,即方程 65:圖片)。

圖片

下面是正在研究的所有方程定律的表格,以及它們蘊含或被蘊含的定律數量。這些介面也與 Lean 有某種程度的整合:例如,你可以單擊來嘗試證明 Oberlix 定律蘊含方程 359,圖片;陶哲軒將此留作一個挑戰(Lean 中可以進行四行證明)。

圖片

過去幾周,陶哲軒瞭解到其中許多定律以前都出現在文獻中,並在下圖專案中對這些方程進行介紹。例如,除了非常著名的交換律(公式 43)和結合律(公式 4512)之外,一些方程(比如公式 4、公式 29、公式 381、公式 3722 和公式 3744)出現在一些 Putnam 數學競賽中;公式 168 定義了一個有趣的結構,被稱為「中心群」,學者 Evans 和 Knuth 對其進行了研究,併成為 Knuth-Bendix 完成演算法的主要靈感來源;公式 1571 對指數為 2 的阿貝爾群進行了分類。

圖片

方程彙總地址:https://github.com/teorth/equational_theories/wiki/Tour-of-selected-equations

陶哲軒表示 Birkhoff 完備定理起了大作用,如果一個方程定律蘊含另一個,那麼可以透過有限次數的重寫操作來證明,但是所需要的重寫次數可能相當長。上面提到的從 方程 1491 推匯出 359 的蘊含已經相當有挑戰性,需要重寫四五次;從方程 1681 推匯出 2 的蘊含非常長。儘管如此,標準自動定理證明器(例如 Vampire)完全能夠證明這些蘊含中的絕大多數。

更微妙的是反蘊含,他們必須證明一條定律 X 並不蘊含另一條定律 Y。原則上,他們只需展示一個服從 X 但不服從 Y 的 magma。在很大一部分情況下,他們可以簡單地搜尋小的有限 magma(例如兩個、三個或四個元素的 magma)來獲得這種反蘊含。但它們並不總是足夠的,事實上,他們知道只有透過構造無限的 magma 才能證明反蘊含。

例如,現在已知「Asterix 定律」並不蘊含「Oberlix 定律」,但所有反例必然是無限的。奇怪的是,已知的構造與集合論中著名的強迫技術有某種相似之處,因為他們不斷地將「通用」元素新增到(部分)magma 中, 以強迫存在具有某些特定屬性的反例,儘管這裡的構造肯定比集合論的構造簡單得多。

他們還從交換和非交換環中的「線性」magma 構造中獲得了可觀的收益,比如與「合流」方程定律相關的自由 magma,以及更普遍的具有完整重寫系統的定律。因此,未解決的蘊含數繼續穩步減少,不過還沒有到宣佈該專案勝利的時候。

雖然該專案仍在進行中,但陶哲軒對迄今為止取得的進展感到非常滿意,而且對該專案的許多希望已經實現。

在科學方面,他們發現一些新技術和構造,可以證明給定的方程理論並不蘊含另一個方程理論,並且還發現一些奇特的代數結構, 如「Asterix」和「Oberlix」,它們具有有趣的特徵。除了此處進行系統搜尋之外,其他任何方式都可能無法發現它們。參與者非常多樣化,包括各個職業階段的數學家和電腦科學家、以及感興趣的學生和業餘愛好者。Lean 平臺在整合人類生成和機器生成的貢獻方面效果很好,後者在是迄今為止最大的貢獻來源,但許多自動生成的結果首先由人類在特定情況下獲得,然後被泛化和形式化(通常由專案的不同成員完成)。

他們仍在提出許多非正式的數學論證,但它們往往在 Lean 中被迅速形式化,此時關於正確性的爭議就會消失,從而專注如何最好地部署各種經過驗證的技術來解決剩下的問題。

也許陶哲軒目前唯一期待但尚未看到現代 AI 工具的重大貢獻,它們正在以多種次要方式應用於該專案,例如透過 GitHub Copilot 等工具來加速編寫 Lean 證明、LaTeX 藍圖和其他軟體程式碼。此外一些視覺化工具也主要使用 Claude 等大型語言模型共同編寫。

對於解決蘊含這一核心任務,更「老式」的自動定理證明器迄今為止已被證明更為優越。然而,剩餘 700 個左右蘊含中的大多數都不適合這些舊工具,尤其涉及 Asterix 和 Oberlix 的蘊含讓人類合作者困惑了好幾天。所以仍然希望看到現代 AI 在完成剩餘蘊含中最難、最頑固的部分發揮更積極的作用。

部落格地址:https://terrytao.wordpress.com/2024/10/12/the-equational-theories-project-a-brief-tour/

相關文章