對於那些希望使用大模型LLM從事突破性科學研究的人來說:大模型尤其不適合從事這項工作。(如果你是一名研究人員,你一定已經注意到了這一點)。
突破性研究需要
- 朝著一個全新的、出乎意料的方向前進,而每個人在很久以前就認為這個方向是愚蠢的;或者
- 發現一些非同尋常的新實驗資料,這意味著我們必須改變我們的理論
大模型無法進行實驗,所以我們將重點關注第一條。
僅僅說 "LLM不會推理 "是沒有用的,因為很明顯,
- LLM 會做一些人類會用到推理的事情。
但是,LLM 首先是:
- 模糊子圖匹配機器(*大規模*)。
換句話說(稍微簡化一下),LLM 主要是透過模糊查詢和插值在其訓練集中發現的概念來工作的。
由於搜尋的模糊性和訓練集的規模,這可以產生一些非常令人印象深刻的結果。
每當我試圖探討一些哪怕是稍稍有悖於普遍接受的觀念的問題時,大模型們總是重複那些普遍接受的觀念。 作為一名研究人員,我發現這種行為比無益更糟糕。它給人的錯誤印象是,沒有什麼可探討的。
公平地說,這不僅僅是大模型的問題。研究界也是如此。
例如,@planetmoney 的最新一期節目就採訪了一位諾貝爾經濟學獎得主,他在首次發表成果時被評審人稱為 "江湖騙子"。
但有些人,有些時候,即使沒有人支援他們,也能頑強地、創造性地探索出突破常規的想法。 比如卡塔林-卡里科(Katalin Karikó)。
因為 LLM 是模糊子圖匹配器,所以它們只是對已有的內容進行插值,而且它們會對訓練集中最常見的內容進行加權。(根據大多數人意見)
那麼,如何在研究中利用大模型優勢呢?
有兩種好方法:
- 利用 LLMs 的大規模插值能力,向其輸入大量半隨機和/或不斷變化的提示,並配備自動答案檢查器,或者...
- 向 LLM 提供精心設計的想法集,讓它幫助你考慮和構建這些想法的含義。告訴 LLM "我們只是在集思廣益",可以幫助它轉向插值不常見的子圖。 例如,AlphaGeometry 成功運用了這些想法
總之:
LLM 在與人類結合時效果最佳。 這意味著最值得興奮(或害怕)的是計算機+人類的力量,而不僅僅是計算機本身的力量。