如何使用大模型實現突破性創新研究?

banq發表於2024-06-30


對於那些希望使用大模型LLM從事突破性科學研究的人來說:大模型尤其不適合從事這項工作。(如果你是一名研究人員,你一定已經注意到了這一點)。

突破性研究需要

  1. 朝著一個全新的、出乎意料的方向前進,而每個人在很久以前就認為這個方向是愚蠢的;或者
  2. 發現一些非同尋常的新實驗資料,這意味著我們必須改變我們的理論

大模型無法進行實驗,所以我們將重點關注第一條。

僅僅說 "LLM不會推理 "是沒有用的,因為很明顯,

  • LLM 會做一些人類會用到推理的事情。

但是,LLM 首先是:
  • 模糊子圖匹配機器(*大規模*)。


換句話說(稍微簡化一下),LLM 主要是透過模糊查詢和插值在其訓練集中發現的概念來工作的。
由於搜尋的模糊性和訓練集的規模,這可以產生一些非常令人印象深刻的結果。

每當我試圖探討一些哪怕是稍稍有悖於普遍接受的觀念的問題時,大模型們總是重複那些普遍接受的觀念。 作為一名研究人員,我發現這種行為比無益更糟糕。它給人的錯誤印象是,沒有什麼可探討的。

公平地說,這不僅僅是大模型的問題。研究界也是如此。

例如,@planetmoney 的最新一期節目就採訪了一位諾貝爾經濟學獎得主,他在首次發表成果時被評審人稱為 "江湖騙子"。
但有些人,有些時候,即使沒有人支援他們,也能頑強地、創造性地探索出突破常規的想法。 比如卡塔林-卡里科(Katalin Karikó)。

因為 LLM 是模糊子圖匹配器,所以它們只是對已有的內容進行插值,而且它們會對訓練集中最常見的內容進行加權。(根據大多數人意見)

那麼,如何在研究中利用大模型優勢呢?
有兩種好方法:

  1. 利用 LLMs 的大規模插值能力,向其輸入大量半隨機和/或不斷變化的提示,並配備自動答案檢查器,或者...
  2. 向 LLM 提供精心設計的想法集,讓它幫助你考慮和構建這些想法的含義。告訴 LLM "我們只是在集思廣益",可以幫助它轉向插值不常見的子圖。 例如,AlphaGeometry 成功運用了這些想法

總之:
LLM 在與人類結合時效果最佳。 這意味著最值得興奮(或害怕)的是計算機+人類的力量,而不僅僅是計算機本身的力量。
 

相關文章