扯蛋機器:人類又給ChatGPT貼上新標籤

banq發表於2024-06-17

在《倫理與資訊科技》雜誌上發表的 一篇新論文中,來自蘇格蘭格拉斯哥大學的三位哲學研究人員認為:

  • 用“幻覺hallucinations”一詞來描述聊天機器人編造資訊是不準確和具有誤導性的。
  • 相反,他們建議用更粗俗但更準確的術語“胡說八道bullshitting”來描述這種現象。

研究人員認為,像 ChatGPT 這樣的聊天機器人並不是真正的感知或幻覺,而是在不考慮真實性的情況下冷漠地生成語句,這與哈里-法蘭克福認識論鉅作《論胡說》中哲學定義不謀而合:

  • 這篇鉅作在對胡說的一般定義是“說話者對話語的真實性漠不關心的任何言論”。
  • 法蘭克福認為,胡說八道是一種不顧事實、旨在說服的言論。

這種胡說分為兩種:
  • 有誤導目的的 "硬扯淡 硬扯蛋胡說"
  • 無目的的 "軟扯淡 軟扯蛋胡說"

ChatGPT 至少歸類為 "軟扯蛋者 "或 "扯蛋機器"。

研究人員認為,將聊天機器人的錯誤稱為 "幻覺 "會讓人產生誤解,以為這些機器在誤解、但卻試圖傳達它們相信的東西,而實際上它們只是在輸出類似人類的文字,沒有任何意圖或目的。

他們警告說,這種隱喻性語言可能會帶來危險,因為人們會根據人工智慧能力的傳達方式做出決定。

把它們的錯誤稱為‘幻覺’並非無害:這讓人產生混淆,認為機器在某種程度上存在誤解,但仍然試圖傳達它們相信或感知到的東西。

網友:

  • 分不清是人在扯蛋還是機器扯蛋
  • 與機器扯蛋很有趣,人生如果沒有扯蛋,世界將怎樣?
  • 人工智慧並不打算說服別人或說實話。它只是模仿一個人,“預測”他們的講話
  • LLM 並不“理解”任何東西。使用“理解”這樣的語言從根本上就是誤導。它們生成的輸出與訓練資料相似。這意味著它將傾向於具有相似的特徵,例如將一週的第一天與星期日不需要“理解”或確定任何陳述的“真實性”。

Reddit討論對話
這段對話反映了對LLMs 能力和侷限性的深入思考,以及對它們如何理解和處理複雜概念的探討:

  1. 幻覺與虛構:有人認為“幻覺”這個詞可能會誤導,因為它暗示模型有一個不正確的世界模型,而實際上模型並沒有世界模型。而“虛構”這個詞則被認為至少傳達了模型正在產生虛假資訊的資訊。
  2. 真實性評估:有觀點認為,LLMs 不能對其生成文字的真實性做出評估,因為它們只是基於機率生成文字,沒有對真實性的內在評估機制。
  3. 概念表示:對話中提到了 Anthropics 公司的研究,該公司透過識別模型中的概念表示,並能夠透過調整這些表示來影響模型的輸出,從而提供了一種間接評估真實性的方法。
  4. 智慧與數學:有參與者認為智慧是一種複雜的數學和反饋迴圈,而LLMs 正是基於這種數學原理執行的。儘管它們可能不完美,但這並不意味著它們不智慧。
  5. 概念與關聯:對話中還討論了概念在LLMs中的存在形式,一些參與者認為LLMs中的單詞關聯可以代表概念,而另一些則認為這些關聯並不等同於概念。
  6. 模型的侷限性:討論指出,儘管LLMs可以根據訓練資料中的模式生成文字,但它們可能無法理解或評估這些模式背後的“為什麼”,即它們可能缺乏對生成文字背後原因的深入理解。
  7. 模型的可解釋性:對話提到了模型可解釋性研究的重要性,這可以幫助我們更好地理解模型是如何工作的,以及它們是如何生成特定輸出的。
  8. 模型的道德和哲學問題:討論還涉及了關於真相、事實和道德觀的哲學問題,以及這些概念如何與LLMs的運作方式相互作用。

精彩摘錄:
1、大模型模型甚至看不到文字,模型“看到”的是標記,即數字。這些標記與基於模型本身的其他標記一起具有嵌入含義。該模型包含揭示嵌入的演算法和流程。

那麼問題是,什麼是嵌入?
“金門大橋”這個詞,以及這些詞與汽車、舊金山和跳躍等詞之間的關聯

就像你大多數時候不會主動思考你建立的關聯的原因一樣,模型也不會主動思考,儘管它存在。它是隱藏在輸出之外的潛在資訊,但如果沒有因果或相關關係,關聯也就不會存在。

這就是人類學可解釋性研究的全部意義。

他們在模型中不存在語言的層面上尋找可解釋的模式,並試圖將其轉換成語言表示,這樣他們就可以更好地理解模型內部發生的事情,因為即使沒有語言,模型的每個層面上都會發生表示。

我要再說一遍...即使語言沒有發生,表徵也會發生在模型的每個級別

現在,我並不是說模型的思維方式和人類一樣。我們可以從它產生創造力的方式等事情中看到這一點。

模型理解概念,但理解方式與人類並不完全相同,因為它處理理解的方式與人類不同。它有一套完全不同的轉換方式,這有時會導致一些奇怪的事情,在試圖獲得結果時,也會導致一些棘手的事情。

  • 其中一些問題可以解決,因為模型足夠智慧,你可以教它人類的概念,
  • 而有些問題對於特定的架構和訓練方法來說更為根本。

但這些都不能否認概念是可以表示和操縱的事實
 

相關文章