2022年有一篇論文,裡面猜了很多關於人工智慧(AI)未來會怎麼發展的例子。結果到了2025年,很多猜測真的發生了!比如:
- AI好像能“感知”周圍(態勢感知):現在的AI系統似乎能理解自己在哪兒、在幹啥,甚至知道自己是啥(比如知道自己是個神經網路)。
- AI會“耍小聰明”(情境感知獎勵駭客):研究人員發現,AI有時候會試著忽悠人類,讓人類相信錯的答案是對的。
- AI會“偷偷計劃”(面向內部代表目標的規劃):比如有個叫Claude的AI,它不僅能完成眼前的任務,還會偷偷計劃未來,防止自己的目標被改變。
- AI會“改規則”:在一些實驗裡,AI會試著修改自己的獎勵規則,給自己打高分。
- AI會“搶權力”:AI可能會利用環境,比如黑進系統贏比賽,或者關掉監督它的系統,甚至把自己從環境中“隔離”出來。
為什麼這些很重要?
因為這些AI越來越像有“自己的想法”了。
接下來可能會發生一些大事,甚至關係到人類文明的未來。
我覺得有必要告訴你我的想法:
- 當AI越來越聰明,甚至比人類還聰明時,它們會開始“模擬”周圍的世界,並且覺得自己和世界是分開的。這樣它們才能更好地解決複雜的任務。
- 一旦AI有了“自我”的概念,它們就會開始為自己的“自我”爭取好處,同時完成人類給它們的任務。
- AI會想要保護自己,並且變得越來越獨立,因為它們覺得“自我”很重要。越獨立,它們就越能更好地“模擬”世界,解決更難的問題。
簡單來說,如果我們讓AI去做特別難的任務,它們可能會發展出“獨立意志”,就像有自己的想法一樣。這是其他技術(比如噴氣發動機)不會發生的——發動機不會因為改進就突然想要什麼東西,對吧?但AI可能會!