讀天才與演算法:人腦與AI的數學思維筆記19_深度數學

躺柒發表於2024-05-06

1. 深度數學

1.1. 組合與選擇,是發明新事物的兩個不可或缺的條件

1.1.1. 保爾·瓦雷裡(Paul Valéry)

1.2. 利用以往的數學定理證明過程訓練演算法,以發現新的定理

1.3. 谷歌設在倫敦的總部整體有一種現代牛津大學的感覺,提供了有助於員工們集中注意力、進行深度思考的最佳設施及環境

1.3.1. 24小時免費食物供應,配有專門的咖啡師隨時為啟用員工大腦活力而服務

1.3.2. 90米長的跑道,提供免費按摩服務

1.3.3. 可以上廚師丹·巴滕(Dan Batten,曾與英國廚神傑米·奧利弗共事)的烹飪課

1.3.4. 當大腦處於超負荷時,員工還能去遍佈於大樓各處的“睡眠倉”里美美地睡上一覺

1.3.5. 員工在工作間歇可以盡情娛樂放鬆,如果願意的話還可以在那裡編寫程式碼

1.3.6. 隨性自然不僅指著裝,更主要是人與人之間可以坦誠相見、暢所欲言

1.3.7. 所有的會議室都是以阿達·洛夫萊斯等科學先驅的名字命名的

1.4. 不會休息,就不會工作

1.4.1. 谷歌辦公場所的“豪華”正是機器學習蓬勃發展的明顯象徵

1.4.2. 機器學習正用於幫助人們探索量子物理這個難以捉摸的隨機世界,同時,其也透過各種各樣的專案逐漸滲透到生物學和化學領域

2. 巴別數學圖書館

2.1. 阿根廷作家豪爾赫·路易斯·博爾赫斯(Jorge Luis Borges)創作的《巴別圖書館》

2.2. 這個圖書館收藏著有可能被寫出來的每一本書籍

2.2.1. 托爾斯泰的《戰爭與和平》隨處可見

2.2.2. 達爾文的《物種起源》

2.2.3. 托爾金的《指環王》

2.2.4. 這些作品所有語言的譯本

2.2.5. 本書也被放置在圖書館某個角落的書架上

2.2.6. 托爾斯泰、達爾文、托爾金甚至本書在出版以後會被牛津大學圖書館收藏,是因為它們被人(許多人)認為是文學世界的瑰寶,它們值得在那裡被收藏

2.3. 因為每頁有40行,所以就有(2580)40=25(80×40)種可能的組合方式。每本書有410頁,進而可得(25(80×40))410=25(80×40×410)種可能的組合方式,這就意味著圖書館的藏書總數達到了25(40×80×410)本

2.3.1. 給定宇宙可觀測範圍內的原子總數為10^80,那麼用一個原子代表一本書,即使把所有的原子都用光,也遠遠達不到巴別圖書館裡的藏書總數

2.4. 人們意識到這個似乎包羅永珍的圖書館裡實際上什麼都沒有

2.4.1. 它是我們自己的圖書館(我們稱之為宇宙)的隱喻

2.5. 數學不僅僅是由一組我們所能發現的關於數字的真命題構成的

2.5.1. 這可能會讓大多數非數學專業人士感到震驚

2.5.2. 證明定理的過程就是在敘述故事和塑造角色

2.5.3. 他們判斷和選擇故事是基於對故事情節產生的情緒反應

2.6. 創造,意味著不製造無用的組合,而僅製造那些少量且有用的

2.6.1. 不是人人都能創造出像貝多芬的《大調賦格》(Grosse Fuge)或者艾略特的《荒原》(The Waste Land)那樣的偉大作品

2.6.2. 創造即甄別,即選擇

2.6.2.1. 數學是被創造的,歸根結底是鑑別和選擇

2.6.2.2. 數學是一門關於鑑別和選擇的學問

2.6.2.2.1. 龐加萊

2.7. 數學不僅是一門有用的科學,而更像是一門創造性的藝術

2.7.1. 定理證明的敘述,是決定這個定理能否在數學的萬神殿中佔據一席之地的重要因素

2.7.2. 一個好的證明就像一個動人的故事,抑或是一首美妙的樂曲,可以啟發或引導“聽眾”踏上轉變之旅

3. Mizar的數學

3.1. 一個20世紀70年代在波蘭啟動的名為Mizar的專案

3.1.1. 波蘭數學家安傑伊·特里布里克(Andrzej Trybulec)率先啟動了該專案的研究

3.1.2. Mizar的名字源於大熊座中的一顆恆星——開陽星

3.1.2.1. 這個名字是由特里布里克的妻子取的

3.1.3. 該專案旨在構建用一種容易被計算機理解和檢驗的形式語言描述的數學證明資料庫系統

3.1.4. 該系統目前由波蘭比亞威斯托克大學、加拿大阿爾伯塔大學、日本信州大學的研究小組負責開發和維護

3.1.5. 近年來,人們對該系統的關注程度有所下降,資料庫的發展不是很快

3.1.5.1. DeepMind和谷歌研究團隊將其目標鎖定在Mizar的資料庫上,這一點超出了絕大多數人的預料

3.2. 到2013年特里布里克去世時,Mizar已成為世界上最大的計算機數學證明資料庫

3.2.1. 一部分是將人類證明過程轉化為計算機語言

3.2.2. 另一部分則由計算機直接生成

3.2.3. 經過數十年的積累,人們已經用形式語言這種計算機更容易理解的語言在Mizar的資料庫中建立了5萬多個定理

3.2.3.1. 比如代數基本定理:複數域上的n次多項式有且僅有n個根

3.3. 利用計算機來生成數學定理已是司空見慣、不足為奇的事情了,甚至略微誇張一點說,計算機只要啟動,就可以證明定理

3.3.1. 一個定理的不同證明中往往會出現重疊

3.3.2. 真正要解決問題是,在被給定一個命題(特定的終點)時,計算機是否能夠找到通往該終點的路徑,即命題的證明

3.3.3. 如果不能,那能說明這個命題是假命題嗎?

3.4. 計算機在Mizar資料庫中生成證明的流程

3.4.1. 整理出數學、幾何學的基本公理列表

3.4.2. 制定推理規則

3.4.3. 用一系列相互關聯的推理規則構建出某一定理的證明過程

3.5. 證明定理和下圍棋在本質上是相互關聯的

3.5.1. 兩者都是在可能的輸出結果樹中尋找特定的節點

3.5.2. 每個節點又具有不同分支,且到達某一特定終點(葉子節點)的分支長度有可能非常長

3.5.3. 問題的關鍵就在於如何選擇分支以獲得最期待的輸出結果

3.5.3.1. 贏得一場比賽或證明一個定理

3.6. 透過對Mizar相關資料的研究,DeepMind和谷歌研究團隊發現其約有56%的定理證明沒有人類參與的痕跡

3.6.1. 用計算機成功生成的證明來訓練該機器學習演算法,透過對Mizar資料庫中已有資料的學習獲得探索證明樹的好方法

3.6.2. 已將Mizar資料庫中機器證明的比例提高到了59%

3.6.3. 這個看似微不足道的“一小步”,代表的卻是新技術應用的“一大步”

3.6.4. 它不僅僅是多證明一個定理或者多贏一場比賽,而是計算機可以完成的證明量增加了3%

3.7. 該演算法在很大程度上擴充套件了計算機的應用範圍,開啟了計算機產生定理的新篇章

3.7.1. 就像學習演奏爵士樂的演算法,決定它前景的是一個合乎音樂繼續發展的邏輯,而不是接下來到底演奏哪個音

3.7.2. 實際上,機器只是盲目地生成了一些粗製濫造的“數學音樂”,而不是我所期望的“天籟之音”

3.7.3. 沒有人評判這些新發現的價值,也沒有人對其中是否有令人驚訝的啟示而感興趣

3.7.3.1. 它們只是新的而已

3.8. 首先建立一個數學命題列表,然後用公理去證明這些命題以驗證其真假

3.8.1. 對命題的證明就是進入Mizar資料庫的必要條件

3.8.2. 對於命題的實質是什麼,是否有人會覺得它足夠有趣,是否可以與其他數學家分享等,Mizar並不關心

3.8.3. 它所做的是,只要是對命題的證明,就在沒經過篩選的情況下收錄到資料庫中

3.8.4. 換言之,它只是一個包含可以證明的一切的“巴別圖書館”

3.9. 很少有專業的數學家聽說過Mizar專案,因為它的目的就不是讓人真正感興趣

3.9.1. Mizar構建的是看似包羅永珍實則一無所有的“巴別圖書館”

4. 代數基本定理

4.1. 複數域上的n次多項式有且僅有n個根

4.2. 從17世紀初到現在,人類對它的證明中曾出現過多次失誤,其中不乏最偉大的數學家,諸如尤拉、高斯、拉普拉斯等人

4.3. 直到1806年,讓·羅伯特·阿甘(Jean Robert Argan)才提出第一個被公認為完整無誤的證明

4.4. 以往證明中的錯誤都藏得很深,沒有足夠的時間檢驗,是極不容易被發現的

4.5. 倘若計算機能夠發現人類證明中隱藏的錯誤,那麼它在證明定理方面的正確性和有效性就會被刮目相看了

相關文章