GPT-4:思考的曙光還是資料的縮影?

徐少俠發表於2023-04-16

海盜分金,GPT-4初露鋒芒

GPT系列模型橫空出世後,其是否真實具有思考和推理的能力一直被業界關注。GPT-3.5在多條狗問題和海盜分金問題上表現糟糕。GPT-4在這兩個謎題上給出的答案令人驚喜,甚至能給出海盜分金問題的詳細解析解。 GPT-4表現出色,令人印象深刻。它不僅能給出海盜分金問題的正確答案,還能給出詳細的步驟解析。這似乎表明GPT-4具有一定的邏輯思維和推理能力。但是,我們仍然需要採取謹慎態度。理由在於GPT-4的答案可能依賴於大量的資料積累,而非對知識的深度理解與總結。
多條狗問題
海盜分金1
海盜分金2

愛因斯坦謎題,記憶勝過思考

針對愛因斯坦謎題,在原始引數下GPT-4表現完美。但是一旦修改謎題資料,GPT-4的表現就像“弱智”。這證明其答案依賴於記憶而非思考。愛因斯坦謎題考察推理能力,GPT-4在標準測試中表現異常出色。但是,一旦修改謎題條件,GPT-4的表現就暴露出弱點。這說明GPT-4答案的生成依賴於記憶,而非獨立思考。一旦遇到新的條件,GPT-4表現就像“弱智”,完全喪失推理能力。這也從側面證實,GPT-4可能沒有真實獨立思考的能力。
愛因斯坦1
愛因斯坦2
愛因斯坦3
愛因斯坦4

雙信封悖論,表面學習難掩實質

對於雙信封悖論,GPT-4給出了主流但錯誤的答案。提示1美分是真實世界美元最小單位後,GPT-4的表現沒有體現納入新條件後的深度思考。證明其沒有真實思考過這個問題。雙信封悖論是典型的推理測試題。GPT-4給出的答案證明它沒有真正理解這個問題。即使給出提示“1美分是真實世界美元最小單位”,GPT-4的表現也沒有改善。這表明GPT-4沒有在深入思考這個問題,沒有真正理解問題的本質與條件。它的答案依然停留在表面。這也進一步證明GPT-4可能缺乏獨立思考的能力。
雙信封1
雙信封2
雙信封3
雙信封4

矽基生命,智力待提

總的來說,GPT-4顯示出閱讀速度快、記憶能力強和分類能力高超的特點。但是,它的智力水平可能只相當於學齡前兒童。GPT-4展現的所謂“思考”和“推理”能力實際上建立在大量的資料積累之上,而不是對知識的深入理解與總結。GPT-4更像是一個高效的分類器和總結器,而非真正的思考者。但是,作為一種新型的人工智慧,GPT-4的學習是持續的和正向的。隨著更多資料的積累與引數的調整,GPT-4的智力水平也會不斷持續提高,這只是一個時間問題。

相關文章