AI助攻「菜鳥數學家」解決忙碌海狸問題,陶哲軒轉發分享

机器之心發表於2024-07-04

在 AI 的幫助下,越來越多的數學問題得到了解決。


AI在數學領域的應用對大家來說並不陌生了。數學家陶哲軒作為倡導者,一直走在使用AI輔助證明的前沿。他倡導使用像Lean和Coq這樣的證明助手工具。這些工具可以形式化和驗證複雜的數學證明,減少人為錯誤的可能性。也有不少數學家在他的啟發下有了新成果,例如利用AI形式化費馬大定理的證明。他參與了由Talia Ringer發起的AI在數學中資源列表的推廣和編輯工作。這個資源列表專注於 AI for Math,為那些希望進入數學 AI 領域的人提供幫助。

陶哲軒在推進專案研究進展的同時,還試著學習如何建立動畫圖表,他決定對零密度估計進行文獻回顧 。他講到,自己一直很好奇為什麼沒有一份全面的綜述來涵蓋這些年來建立的所有零密度定理,現在他清楚了,是因為文獻太過複雜,尤其在3/4≤σ<1的這個範圍, 使用了多種方法。界限通常是逐段的,主要是因為這些方法依賴於控制整數矩而不是分數矩。然而,這些界限雖然以人類可讀形式陳述時顯得雜亂,但對計算機來說卻很容易處理。

圖片

陶哲軒將所有的界限彙總到一個Python檔案中,並用它建立了附帶的動畫。

圖片

在這一部落格的評論中,陶哲軒補充道:

不得不說,我確實使用了一些AI輔助來幫助編寫程式碼。在某種程度上,我將AI輔助視為一種心理支援——當我知道除了傳統的除錯和搜尋方法外,還有AI工具可以提供初始程式碼並自動完成部分程式碼時,更容易說服自己花時間程式設計。不過,我發現這些工具在除錯方面並不是特別有用。不過,GPT能夠快速建立一個簡單的動畫測試函式,並且在第一次嘗試時就成功編譯了。儘管如此,我仍花了大部分時間來調整和除錯,才得到了我想要的動畫。

顯然,這次嘗試的結果還不錯。後續陶哲軒還轉發了一篇文章,生動地展示了數學智慧助手如何幫助一群「菜鳥數學家」解決了數學界最難解的問題。

圖片

原文連結:https://www.quantamagazine.org/amateur-mathematicians-find-fifth-busy-beaver-turing-machine-20240702/

程式設計師通常希望最大程度減少程式碼執行所需要的時間,忙碌海狸函式(BB(n))這個電腦科學中的經典問題卻在探尋,一個簡單的計算機程式在終止之前可以執行多長時間,即圖靈機在特定狀態和符號數量限制下所能達到的最大執行步數。

最近的研究表明,尋找長時間執行的計算機程式可以揭示數學知識的現狀,甚至告訴我們哪些是可知的。忙碌海狸遊戲為評估某些問題的難度提供了一個具體的基準,例如未解決的哥德巴赫猜想和黎曼假設。它甚至提供了一個探索數學邏輯計算極限的視角。

那要怎麼理解忙碌海狸函式呢?想象一個小機器人(圖靈機),它有一套指令(對應圖靈機的狀態),可以在一條無限長的紙帶上移動和寫字。紙帶最開始是空白的。這個機器人的目標是儘可能多地在紙帶上寫字,然後停下來。忙碌海狸問題就是要找到這樣的機器人,在給定狀態數量下可以寫最多字的情況。

圖片

由ChatGPT-4o生成

這個問題由匈牙利裔數學家蒂博爾·拉多(Tibor Radó)在1962年提出,由於其複雜性和遞增的計算需求,忙碌海狸函式(BB(n))的值在n較小時可以確定,但隨著n的增加,問題變得極其困難,目前只有前幾個BB(n)值被確定。

圖片

1962年,蒂博爾·拉多重新描述了關於圖靈機行為的著名不可解問題,提出了忙碌海狸挑戰。

單規則的情況很簡單,因為實際上只有兩種可能性。如果規則規定圖靈機在看到 0 時停止計算,它將在第一步停止。有了兩條規則,就有超過 6,000 個不同的圖靈機需要考慮;有了三條規則,這個數字就會膨脹到數百萬,有了四條規則,這個數字就會膨脹到數十億。手工計算所有這些情況是不可能的。

這意味著這個問題只能藉助計算機來解決。一個簡單的程式可以算出 BB(2) = 6。但 BB(3) 已經很難找到了。而更棘手的是無限迴圈問題。有的時候圖靈機並沒有真正停機,而是陷入了無限迴圈。研究人員需要找到一種判斷圖靈機是否真正停機的判斷方法。

圖片

陷入無限迴圈的圖靈機

拉多推出忙碌海狸挑戰後不久,一些研究人員就開始了搜尋。從1964年到1974年, Allen Brady花了十年,證出了BB(4) 的數值。研究啟動時,他還是俄勒岡州立大學數學系研究生,發表時,他已然成為內華達大學雷諾分校的電腦科學教授。

圖片

Allen Brady在整個 20 世紀 60 年代開發了「忙碌海狸」演算法,並於 1974 年確定了第四個忙碌海狸函式的值。

此後40年,研究者們前赴後繼,但始終無法捕獲第五個忙碌海狸函式的身影。如果圖靈機需要遵守五條規則,潛在符合可能的圖靈機數量接近 17 萬億臺——即使以每毫秒一臺的速度列出所有圖靈機,也需要 500 多年的時間。狩獵「海狸」的獵手們,將圖靈機的範圍不斷縮小。1989年,德國程式設計師Heiner Marxen 發現了一個在47,176,870 步後停止的圖靈機,但是他還需證明所有剩餘的機器在此時仍未停機,要算出進一步的結果,還需要30年。

21世紀初,痴迷於研究BB(5) 的保加利亞電腦科學家Georgi Ivanov Geogiev,將17億萬臺圖靈機的名單精簡到了只剩43個。在一封電子郵件中,Geogiev表示,研究忙碌海狸函式問題讓他疲憊不堪。對於「忙碌海狸」的「獵手」們,這是常見的結果。幾十年來,他們獨自或結對工作,卻沒有得到學術界的廣泛認可。需要集體努力才能完成這項工作。

2015年,一位名叫Code Golf Addict的匿名GitHub使用者釋出了一個27規則圖靈機的程式碼,該機器只有在哥德巴赫猜想為假時才會停止。其工作原理是透過所有大於4的偶數進行計數;對於每一個偶數,它會遍歷所有可能的兩數之和,檢查這對數是否為素數。當找到合適的一對素數時,它會移動到下一個偶數並重復這一過程。如果找到一個不能由一對素數之和組成的偶數,它就會停止。

執行這種無腦機器並不是解決猜想的實際方法,因為我們無法知道它是否會停止。但是,忙碌海狸遊戲可以對這一問題提供一些見解。如果能夠計算出BB(27),就可以確定自動解決哥德巴赫猜想所需的最長時間。這是因為BB(27)對應的是這臺27規則圖靈機為了停止所需執行的最大步數。如果我們知道這個數,我們可以執行這臺圖靈機恰好那麼多步。如果它在這期間停止了,我們就知道哥德巴赫猜想是假的。但如果它在這麼多步內沒有停止,我們就能確定它永遠不會停止,從而證明猜想為真。

問題在於,BB(27)是一個無法理解的大數,甚至將其寫下來都不可能,更不用說讓哥德巴赫反例機執行這麼多步了。

2016年,類似的結果得出了,這次是 Aaronson等人做出的成果。他們發現了一臺744規則的圖靈機,只有在黎曼假設為假的情況下才會停止。黎曼假設涉及素數的分佈問題,是Clay數學研究所的「千禧年問題」之一,獎金為100萬美元。Aaronson的圖靈機將在BB(744)步內自動得出解答。

當然,BB(744)是一個比BB(27)更難以企及的大數。Aaronson表示,致力於確定更簡單的數值,比如BB(5),可能會發現一些新的、有趣的數論問題。最近,Aaronson使用忙碌海狸衍生的尺度來衡量他稱之為「不可知閾值」的數學系統整體。

受Aaronson論文的啟發,來自Tristan Stérin在Discord上發起了「忙碌的海狸挑戰」。隨著時間推移,線上社群逐漸壯大,來自世界各地的20多名參與者因為驗證BB(5)的真實值相聚。

一位名為Maja Kądziołka波蘭程式設計師在日常的程式設計工作中經常用到Coq智慧證明助手。Coq是一款強大的工具,用於幫助數學家和程式設計師進行形式化的數學證明和驗證。它透過Gallina程式語言,讓使用者定義數學物件、陳述定理,並一步步構建證明。使用者可以與Coq進行互動,逐步驗證每一步的正確性。Coq還提供了多種自動化工具,幫助簡化證明過程。廣泛應用於數學研究、程式驗證和軟體開發,Coq提高了證明和程式碼的準確性和可靠性。

在學習了Coq之後,Maja開始尋找一個開放性的問題,就在這時,她刷到了「忙碌的海狸挑戰」,並開始將社群內的幾個證明用Coq來解決。和「忙碌的海狸挑戰」使用的其他計算機程式不同,在 Coq 證明中,除非每一行都符合邏輯,否則程式碼將無法執行,因此幾乎不可能出錯。因此,社群裡的成員漸漸對使用Coq「上癮」了。於是,在接下來的幾個月裡,Coq接手了社群內未完成的對BB(5)的證明。

2024年5月10日,「忙碌的海狸挑戰」社群中一位神秘的成員發了一條訊息,稱「BB(5) 的 Coq 證明已完成。」結果證明,30多年前,德國程式設計師Heiner Marxen和他的搭檔Buntrock發現的那臺圖靈機在走了 4700 萬步之後就停了下來,這其實就是第五隻忙碌的海狸——BB(5)的真實值。

圖片

伊利諾伊大學厄巴納-香檳分校電腦科學系的助理教授Talia在看完用Coq解決BB(5)的真實值的故事後表示,她喜歡這些數學證明助手的原因之一,是它們能讓更多的人參與到數學研究當中。

AI正如陶哲軒所說的那樣,幫助數學家們處理更多問題,讓數學之謎逐漸解開。

參考連結:
https://mathstodon.xyz/@TaliaRinger/112719444060361451
https://mathstodon.xyz/@tao
https://www.quantamagazine.org/how-the-slowest-computer-programs-illuminate-maths-fundamental-limits-20201210/

相關文章