陶哲軒強調了在數學應用和問題解決中需要找到合適的平衡點:既不過度簡化,也不過度複雜化,避免過度最佳化和過度抽象導致的反效果。
剛剛,著名數學家陶哲軒在個人社交平臺更新的幾篇帖子,引起大家廣泛的共鳴。
陶哲軒用淺顯易懂的語言表達了自己對數學的理解與思考心得。
文中談到了一個關於「度」的問題,陶哲軒表示在設計系統時,缺乏或者過度的數學分析可能都會適得其反,所以要適度。
有時,我們不需要太過複雜精深的專業知識,大道至簡。
對於大多數任務,使用一些相對簡單但通用的數學方法,往往比專門設計的演算法效果更好。
陶哲軒還提到,在純數學中,故意忽略一些直覺上看似非常重要的資訊非常有幫助。
接下來是陶哲軒帖子全部內容。
掌握一點點的數學知識就能大有裨益。系統的設計不僅僅會因為缺乏足夠的數學分析而受到限制,同樣也可能因為過度的數學分析而受到阻礙。
一個常見的例子是網路安全中對密碼的要求。從數學上講,密碼要求越複雜(例如,規定最小長度、特殊字元或不重複使用密碼),密碼就越安全。
然而,如果要求過於複雜,使用者和服務提供商可能會尋找繞過複雜要求的方法,比如尋找簡單的密碼重置或恢復方式,或者將密碼儲存在不安全的系統中。這些做法反而可能降低整體系統的安全性,而不是提升它。
另一方面,只對單一指標(如使用者使用密碼直接登入系統)進行過度最佳化,可能會損害更廣泛的目標。就如古德哈特定律(Goodhart's law)中所說的,「當壓力施於其上以進行控制時,任何觀測到的統計恆性都傾向消散。」
粗略的講,在設計安全性時,直接輸入方式的安全性應該加強到與其他輸入方式的安全性相當,但超過這個程度的加強反而可能適得其反。
舉個例子來說,如果一棟建築的前門有鎖,但窗戶沒有防護,那麼再給前門加更多的鎖就沒有太大意義,這樣做甚至可能導致一種危險的虛假安全感。另一方面,如果窗戶比前門更難進入,那麼在前門上至少加一把鎖就很合理。
在人工智慧領域,強化學習之父 Rick Sutton 的「苦澀的教訓」(Bitter Lesson)就是這一原則的一個例子。
從直覺上來看,大家往往會認為針對具體任務量身定製演算法是最自然的選擇,在某些情況下,確實能取得不錯的效果。
其實,對於大多數任務,使用一些相對簡單但通用的數學方法,如梯度下降和反向傳播,往往比專門設計的演算法效果更好。通用方法不依賴於特定任務的領域知識,而是透過大量的資料和計算資源來訓練模型,通常能帶來更大的進展。
最近,我看到了有人為感測器網路開發更實惠的模數轉換器(ADC),就是這條發現的證明。
傳統上,ADC 電路基於經典電氣工程原理設計,採用常微分方程(ODE)、共振、傅立葉變換等數學工具來構建高效電路。然而,在一些特定環境(如感測器網路)中,我們的目標是大規模、快速且成本低的方式實現模數轉換,同時可以容忍一定的故障率。
在這種情況下,訓練神經網路來設計 ADC 電路,不依賴任何專業領域的知識(如傅立葉分析),反而是更好的方法。
這並不是說領域知識毫無用處 —— 例如,物理資訊神經網路在許多物理領域的表現可以遠超標準神經網路 —— 關鍵在於瞭解在什麼情況下,應該運用多少領域知識。
在純數學中,一個有效的解題方法是故意忽略一些直覺上看似非常重要的資訊。比如,在分析數論中,許多進展都是透過把畫素數這樣的「重要」數學物件轉化為看起來更加簡單、結構較少的形式來實現的。這樣做可以讓我們更容易找到解決問題的途徑。
但抽象也需要把握一個度。如果抽象得過頭,就會丟失關鍵資訊,反而無法解決問題;而如果抽象得恰到好處,問題就會變得更加清晰,從而找到合適的技巧去解決它。在此過程中甚至可以做出一些看似不太合理的變換,讓解題思路更加靈活起來。
我有時會開玩笑說,應用數學家只需要掌握每本純數學研究生教材的前兩章,之後的章節對他們可能幫助不大(甚至可能有負面作用)。
另一方面,正是尋找第 3 到第 12 章的過程,才使得前兩章至臻完美、具有廣泛實用性的瑰寶。
在讀完陶哲軒的這段見解後,有人評論道:這些建議非常有價值,不論是對於哪種問題,都要做到:
簡化細節,直到看到更宏觀的問題結構。 判斷是否已有針對同類問題的解決方案。 或者判斷這個一般性問題類是否過於籠統,或者是否過於具體。
參考連結:
https://mathstodon.xyz/@tao/113482950431855749