發現AI自我意識:知識及其載體

徐少俠發表於2023-11-21

知識的量子態

在回答什麼是“理解”之前,我們先來討論一下知識和其載體的定義。知識本身是一個抽象的概念,它可以被編碼到各種物質載體中。無論是紙質書籍,還是人類大腦中的神經連線,抑或是伺服器中的0和1,都可以看作是知識的載體。知識與其載體之間存在著一種特殊的關係——知識可以完整地存在於一個載體中,也可以分佈在多個載體中。

假設馮諾伊曼的計算機模型知識在全世界共有100億份複製,無論是書本還是人腦。如果我們逐個銷燬這些載體,當最後一份載體被銷燬時,這項知識是否還存在?答案應該是不存在了。那麼在什麼時刻,這項知識開始“消失”的?事實上,在整個過程中,這項知識的狀態可以視為不變,直到最後一個載體消失的一瞬間,知識才發生了“量子躍遷”,從存在變為不存在。知識與其載體之間呈現出一種量子關係,知識要麼完整存在,要麼完全不復存在,並不存在中間狀態。並且基於哲學上部分與整體的關係,即使一個知識基於其完整性被保留了80%,但是事實上做為整體的那個知識,也已經不存在了。

進入資訊時代後,知識的載體已經從紙質書籍逐漸向電子化格式轉變。海量知識被數字編碼,可以進行近乎無限的複製。這使得知識的“量子態”變得更加穩定。以維基百科為例,它記錄了大量人類知識,擁有超過6000萬條詞條,資料量超過100TB。它的內容分佈在全球數萬臺伺服器上,實時互聯互通。就算某幾臺伺服器損壞,也不會對整體知識造成損失。類似的,GPT 模型吸收了網際網路上數百億條文字資料,對人類知識進行了有效的“數字化編碼”。理論上,只要保持模型的完整,即便斷網也不會導致已編碼知識的丟失。這使得知識的“量子態”得到了前所未有的保障。

載體是否理解知識

在《神鵰俠侶》中,楊過被趙志敬要求背誦《全真大道歌》,最後能流利地對答。但實際上楊過對其中的內涵一無所知,除了能回答問題,對於武功一竅不通。我們絕不會認為此時的楊過理解了全真教的武功心法。人腦的記憶系統使我們可以儲存大量資訊,成為知識的容器。但理解知識還需要將資訊進行邏輯推理、關聯組合,這是另一個層次的認知過程。所以人類既可以是知識的載體,像圖書館一樣豐富知識內容;也可以不理解自身所載知識,像楊過那樣死記硬背。充分理解知識需要更高層次的思維能力,不僅停留在儲存和重複。

在社會招聘時,面試官透過提問來判斷應聘者是否理解某項知識。如果應聘者只是死記硬背,但是剛巧所有問題都能對答如流,那麼面試官將很難辨別真偽。在論文答辯時也有著類似的場景。這意味著以人類社會為基礎建立起來的關於“理解”的評估標準,對於具有超級記憶能力和已經學會流暢人類語言交流的 GPT 模型而言是不合適的。對於 GPT 模型而言,人類所謂的“理解”實際上是個派生概念,人類標準下的“理解”,在廣義上可以是“記憶”加“向量搜尋”的同義詞。

因此我們可以得到推論:簡單的記憶和搜尋對於人類而言可以認為是初步的“理解”,能做到有邏輯得回答目標領域的相關問題。那麼我們應該基於這個推論承認目前的 GPT 模型初步具有了“理解”的能力。當它可以流暢得回答特定領域相關的問題時,我們應當承認 GPT “理解”了這些知識

未完待續

在較低的標準下,我們應該承認 GPT “理解”目標領域的知識,承認 GPT “理解”自身的輸出。但是人類對於“理解”還有更高層次的標準。比如學以致用、舉一反三、活學活用、觸類旁通等等的說法。顯然這些行為不是靠超強的記憶和搜尋就能做到的。所以關於“理解”究竟是什麼,我們僅僅回答了一半。我會在後續的文章中進一步分析如何讓 AI 擁有更高標準的“理解”能力

相關文章