用還原論方法研究大語言模型?

banq發表於2024-05-05


這篇文章(點選標題)介紹了電腦科學家 Ellie Pavlick 的工作,她正在嘗試將哲學概念(如“意義”)轉化為具體且可測試的想法。

Pavlick 在布朗大學和 Google DeepMind 研究語言模型,探索它們如何理解概念。她的工作經常將哲學與科學相結合。

意義與理解

  • 要理解一個詞(如“蘋果”)的意義,就需要該詞所指向概念

Pavlick 試圖尋找大模型中的證據,以證明:
  • 大模型內部存在一個能夠一致地被同一詞彙引用的“蘋果”概念。

內部結構:
Pavlick 專注於表徵語言模型內部結構的特徵,這可能包括神經網路中的權重子集、線性代數運算或幾何抽象。

  • 這些特徵必須在模型行為中起因果決定性作用。

實驗結果:
Pavlick 發現,當語言模型檢索資訊時,例如回答“法國的首都是哪裡”時,模型能夠在一個小型向量中將問題和答案聯絡起來(建立一種關係,也許是關係語言的作用?),這表明模型能夠將概念系統化,而不僅僅是靠記憶。

基礎與應用:
Pavlick 強調,儘管當前的研究可能看起來並不激動人心,但這些基礎性的工作對於未來理解更深層次的智慧問題至關重要。

哲學問題與科學方法:
Pavlick 認為,透過語言模型,可以將哲學問題轉化為科學問題

  • 她透過實驗方法來探索模型是否真正理解概念,而不僅僅是模擬理解。

對當前研究的批判:
Pavlick 提醒說,儘管人們可能會宣稱大模型取得了突破,但在她看來,現在談論重大突破還為時尚早。

未來研究方向:
Pavlick 認為,未來十年的研究可能需要關注那些看起來不那麼吸引人的方法論問題,但這些是科學上合理的方法,對於找到智慧的基本構建塊至關重要。

banq注:

  • 大模型的智慧可能是一種從下而上的湧現,人們試圖使用還原論方法從上而下探究其因果,這種研究方向可能本身就是錯的,南轅北轍,大模型智慧已經顛覆了科學和哲學的傳統研究方法,用還原論方法研究複雜系統的湧現是刻舟求劍。
  • 傳統還原論觀點是:意義需要理解,否則怎麼會用呢?假設前提是:某個事物本身內部肯定包含一種一致性的概念(類似DDD聚合),這種假設已經潛移默化成為科學分析法和還原論的公認信仰,只要我們進入事物內部發現其內部結構組成,就能如法炮製還原這個事物。
  • 意義需要理解以後使用嗎?不必,意義即使用, 意義不必理解以後才使用,只要建立其上下文關係,就可使用,這是關係Relation語言

 

相關文章