今年的諾貝爾物理學獎頒給了兩位享譽盛名的 AI 研究者 John J. Hopfield 和 Geoffrey E. Hinton,這確實讓很多人感到意外。第一層疑問是:Hinton 和物理學有什麼關係嗎?第二層疑問是:AI 科學家是如何提名物理學獎的?這程式合理嗎?當然,更深層的質疑來自一些同賽道的 AI 科學家,比如挑戰 Hinton 多年的 LSTM 之父 ——Jürgen Schmidhuber。在統計物理學中,Hopfield 模型成為最常研究的 Hamiltonians 學派之一,關於它的論文和書籍已有數萬篇。這個想法為數百名物理學家進入神經科學和 AI 領域提供了切入點。在電腦科學中,Hopfield 網路是促使 AI 寒冬(1974-1981 年)結束以及隨後人工神經網路復興的主要驅動思想。Hopfield 在 1982 年發表的論文標誌著現代神經網路時代的開始。但 Jürgen Schmidhuber 認為:「諾貝爾物理學獎授予了電腦科學領域的剽竊和錯誤歸屬,主要涉及 Amari 的 Hopfield 網路和玻爾茲曼機。」在發表於 X 平臺的小作文中,Jürgen Schmidhuber 洋洋灑灑列了四條依據,內容如下:1、Lenz-Ising 神經元遞迴結構發表於 1925 年。1972 年,甘利俊一(Shun-Ichi Amari)使其具有自適應能力,透過改變連線權重,學會將輸入模式與輸出模式聯絡起來。不過,在「2024 年諾貝爾物理學獎的科學背景」中,Amari 只是被簡單引用。遺憾的是,Amari 的網路後來被稱為「Hopfield 網路」。Hopfield 在 10 年後重新發表了它,但沒有引用 Amari,甚至在後來的論文中也沒有引用。2、Ackley、Hinton 和 Sejnowski 的相關玻爾茲曼機論文是關於神經網路隱藏單元內部表徵的學習。它沒有引用 Ivakhnenko 和 Lapa 提出的第一個內部表徵深度學習演算法,也沒有引用 Amari 透過隨機梯度下降(SGD)在深度 NN 中端到端學習內部表徵的獨立工作(1967-68 年)。甚至連作者後來的調查和「2024 年諾貝爾物理學獎的科學背景」都沒有提到深度學習的這些起源。玻爾茲曼機也沒有引用 Sherrington & Kirkpatrick 和 Glauber 之前的相關工作。3、諾貝爾獎委員會還稱讚了 Hinton 等人 2006 年提出的深度神經網路分層預訓練方法(2006 年)。然而,這項工作既沒有引用 Ivakhnenko 和 Lapa(1965 年)對深度神經元進行分層訓練的原始方法,也沒有引用對深度神經元進行無監督預訓練的原始方法。4、如「主流資訊」所說:「在 20 世紀 60 年代末,一些令人沮喪的理論結果讓許多研究人員懷疑這些神經網路永遠不會有任何實際用途」。然而,深度學習研究在 20 世紀 60-70 年代顯然是活躍的,尤其是在英國以外的地區。Jürgen 還表示,關於剽竊和錯誤署名的更多案例,可參見以下參考文獻,可以從第 3 節開始:《3 點陣圖靈獎獲得者如何重新發表他們未能歸功於創造者的關鍵方法和想法》https://people.idsia.ch/~juergen/ai-priority-disputes.htmlhttps://people.idsia.ch/~juergen/deep-learning-history.html但情況真的如 Jürgen 所說嗎?至少一些網友已經指出了表述中的問題:「在機器學習中,那些無法真正證明其想法可行的想法論文比比皆是,而且往往不會被廣泛閱讀或採用。除此之外,我們實際上並沒有一個統一的理論,因此不同的陣營使用完全不同的術語,直到你真正深入研究它,你才會意識到獨立建立的各種模型之間存在數學等價性。」維基百科詞條中,關於 Hopfield 網路的簡介如下:第二個要新增的組成部分是對刺激的適應。中野薰(Kaoru Nakano)於 1971 年和甘利俊一(Shun'ichi Amari)於 1972 年分別對此進行了描述,他們提出透過 Hebbian 學習規則修改 Ising 模型的權重,使其成為聯想記憶模型。William A. Little 於 1974 年發表了同樣的想法,Hopfield 在 1982 年的論文中對他表示了感謝。基本上,有 3 個不同的人想到使用 Hebbian 學習進行聯想記憶。因此 Hopfield 將這個想法歸功於他所知道的人,儘管看起來 Amari 更早(或許 Nakano 甚至比 Amari 還早)。還有網友說,玻爾茲曼機論文並沒有使用反向傳播、Hebbian 學習或 Schmidhuber 認為沒被引用的任何方法。這篇論文字身並沒有說它發明了第一個學習演算法,只是說它發現了一種可以產生有用且有趣的中間表示的學習演算法。而 Hinton 早就在幾年前解釋過 Jürgen Schmidhuber 指出的問題,並表示「從此不會再做出任何回應」。與 Schmidhuber 就學術信用問題進行公開辯論並不可取,因為這隻會助長他的氣焰,而且他會不惜花費大量時間和精力來詆譭他所認為的對手。他甚至不惜使用維基百科中的多重別名等伎倆,讓別人看起來似乎同意他的說法。他網站上關於艾倫・圖靈的頁面就是一個很好的例子,說明他是如何試圖削弱其他人的貢獻的。
儘管我有最好的判斷力,但我覺得我不能完全不回答他的指控,所以我只回應一次。我從未聲稱反向傳播是我發明的。David Rumelhart 是在其他領域的人發明反向傳播很久之後才獨立發明它的。的確,當我們第一次發表論文時,我們並不瞭解這段歷史,所以我們沒有引用之前的發明者。我所聲稱的是,是我清楚地證明了反向傳播可以學習有趣的內部表徵,而這正是它廣受歡迎的原因。我是透過強迫神經網路學習單詞的向量表徵來做到這一點的,這樣它就能根據前一個單詞的向量表徵來預測序列中的下一個單詞。正是這個例子說服了《自然》雜誌的審稿人發表了 1986 年的論文。
的確,媒體上有很多人說我發明了反向傳播,我也花了很多時間來糾正他們。以下是 Michael Ford2018 年出版的《智慧架構師》(Architects of Intelligence)一書的節選:
在 David Rumelhart 之前,很多不同的人發明了不同版本的反向傳播。他們主要是獨立的發明,我覺得我的功勞太大了。我在媒體上看到有人說是我發明了反向傳播,這完全是錯誤的。這是一個罕見的例子,一個學者覺得他在某件事情上獲得了太多的榮譽!我的主要貢獻是展示瞭如何使用它來學習分散式表徵,所以我想澄清這一點。
也許 Jürgen 想澄清是誰發明了 LSTM?
在諾貝爾獎的物理學獎和化學獎分別頒發給 AI 之後,大家開始懷疑:莫非今年的諾貝爾文學獎要頒給 ChatGPT?面對諾貝爾獎評選結果的多重「意外」,頂刊也是早有預料了。前兩天,Nature 雜誌就發表了一篇社論,炮轟諾貝爾獎在全球範圍內代表性不足,提名過程必須更加公開透明。類似於 AI 的推理過程還是個「黑盒」,諾貝爾獎的評選過程也是一個有點像「黑盒」的機制,提名人和被提名人名單在評獎結果公佈之前必然嚴格保密,被提名名單更是要保密 50 年。因此,諾貝爾獎評選的具體細節,我們無從得知。為了預測下一年的諾貝爾獎得主,人們只能從往年的獲獎者中尋找規律。於是,一直有傳言稱,諾貝爾文學獎的評選存在一個不成文的規定,即來自五大洲的作家輪流獲獎。與此相對照的是,負責評選諾貝爾獎的組織表示過,他們正在積極努力提升諾貝爾獎得主的多樣性,並且已經取得了顯著進展。整個 20 世紀,諾貝爾化學獎、物理學獎以及生理學或醫學獎僅有 11 次被授予女性;而在 2000 年至 2023 年間,這個數字就提升到了 15 次。 1910 年 - 2020 年女性獲得諾貝爾獎的數量變化雖然性別的多樣性取得了可喜的進展,但大家似乎已經習慣了科學界權力和資金分配在全球範圍內的不均衡,往往忽視了這一點。在諾貝爾獎的歷史中,只有 10 位獲獎者出生於目前被世界銀行歸類為中低收入以下的國家,並且他們中的絕大多數在獲獎時已經移居北美或歐洲。正如《TWAS at 20(第三世界科學院 20 年)》這本書中所寫,四十年前,許多非發達地區的科學家面臨著艱難的選擇:「背棄你的家鄉,專注於職業生涯;或者留在家裡,獻祭你的職業生涯。」在更隱秘的角落,諾貝爾獎之上還籠罩著一層巨大而無形的「人情網」。Nature 的調查顯示,無論看起來有多離譜,幾乎所有諾貝爾獎得主都存在某種聯絡。令人驚訝的是,獲得科學類以及經濟學獎項中的 736 位得主,其中有 702 位屬於同一個學術家族 —— 他們透過學術關係在歷史的某個節點彼此相連。這可能與諾貝爾獎提名採用邀請制有關。根據諾貝爾基金會章程,歷屆諾貝爾獎得主、瑞典、丹麥、芬蘭、冰島和挪威的大學教授、瑞典皇家科學院成員以及相關諾貝爾獎評審委員會成員可以無需許可,直接提名候選人。其他有資格參與評獎的人則必須獲得官方邀請函,才能提名入圍名單。提名過程分為兩個階段:首先高階領導、院長和教授們收到諾獎官方的信件;然後,被這些被選中的科學家們按照標準進行提名。來自斯德哥爾摩大學的 Peter Brzezinski 對 Nature 表示,瑞典皇家科學院今年聯絡了大約 1250 所大學。但由於人力有限,平均每五年,每所大學只會收到一次邀請。這種情況可能是諾貝爾在設立獎項時未曾預見的。諾貝爾獎的評選歷史已接近 120 年,當初科學研究還是個小眾領域。20 世紀初,全世界的物理學家大約只有 1000 人,而如今廣義上的物理學家已多達數百萬。諾貝爾獎的揭曉再次激起了世人對科學與技術的熱情,但如何在當今科技日新月異的時代設立一個更加全面和包容的評獎機制,確實也是不容忽視的重要議題。