讀AI新生:破解人機共存密碼筆記02進化

躺柒發表於2024-06-16

1. 人工智慧的標準模型

1.1. 機器最佳化人類提供的固定目標

1.1.1. 是一條死衚衕

1.1.1.1. 當你走進死衚衕時,你最好掉頭返回,找出走錯的地方

1.2. 問題不在於我們可能無法做好構建人工智慧系統的工作,而在於我們可能太“成功”了

2. 智慧

2.1. 我們稱之為“大腦”的那一小堆幾磅重的粉灰色膠狀混合物是如何感知、理解、預測和操縱一個難以想象的浩瀚世界的?

2.1.1. 我們朝著解釋大腦如何工作邁出的每一步,也同時是邁向在人工製品中創造大腦能力的一步,即邁向人工智慧的一步

2.2. 智慧是什麼

2.2.1. 答案不在智商測試中,甚至不在圖靈測試中,而是在我們的感知、我們的需求和我們所做的事情這三者之間的簡單關係中

2.2.2. 如果一個實體是智慧的,它就會根據它的感知來做事情,而它所做的事情是為了滿足它的需求

3. 進化的起源

3.1. 大腸桿菌

3.1.1. 它的動作不會以任何方式依賴於它的環境

3.1.2. 它不會做任何決定,只是執行一種固定的行為,進化將這種行為植入了它的基因,但這並不是全部

3.1.3. 根據它感知到的情況(葡萄糖濃度不斷升高),它所做的事情(遊向葡萄糖)很可能滿足它的需求(得到更多的葡萄糖)

3.1.4. 進化在大腸桿菌的基因中所建立的機制,就像在你的基因中所建立的機制一樣

3.1.4.1. 透過這種機制,細菌的行為會隨著它對環境的感知而變化

3.1.4.2. 進化事先不知道葡萄糖在哪裡,也不知道你的鑰匙在哪裡,所以把找到葡萄糖和鑰匙的能力放到生物體中,簡直近乎完美

3.2. 動作電位

3.2.1. 這是一種電訊號,大約10億年前首次在單細胞生物體內進化出來

3.2.2. 後來,多細胞生物進化出一種叫作神經元的特殊細胞,這些細胞利用動作電位在生物體內快速傳遞訊號,速度高達每秒120米(即每小時270英里)

3.2.3. 神經元之間的連線叫作突觸

3.2.3.1. 突觸連線的強度決定了有多少電刺激從一個神經元傳遞到另一個神經元

3.2.3.2. 動物透過改變突觸連線的強度來學習

3.3. 最初,神經元形成了神經網路,這些神經網路分佈在整個生物體中,用於協調各種活動

3.3.1. 水母之所以能優雅地推進是因為它們擁有神經網路,但水母根本沒有大腦

3.4. 大腦中每個狀態轉換的“週期時間”只有幾毫秒,雖然比電子電路速度慢,但是比大多數生物過程快得多

3.4.1. 我們對神經元和突觸的生物化學知識以及大腦的解剖結構瞭解很多,但是認知水平的神經實現:學習、認知、記憶、推理、計劃、決定等,對絕大多數人而言仍然是猜想

3.5. 在意識領域,我們確實一無所知

3.5.1. 人工智慧領域沒有人致力於讓機器擁有意識,也沒有人知道從哪裡開始,而且沒有任何行為是以意識為前提的

3.5.2. 所有關於機器神秘地變得有意識並憎恨人類的那些好萊塢電影情節其實都沒有抓住要點

3.5.2.1. 重要的是能力,而不是意識

4. 獎勵系統

4.1. reward system

4.2. 這是一個由多巴胺介導的內部訊號系統,它將積極的和消極的刺激與行為聯絡起來

4.2.1. 它有內建的學習方法,因此隨著時間的推移,我們的行為在獲得獎勵方面會變得更加高效

4.2.2. 它類似於人工智慧領域開發的強化學習方法,對此我們有非常堅實的理論基礎

4.3. 大腦的獎勵系統就像大腸桿菌尋找葡萄糖的機制一樣,是提高進化適應性的一種方式

4.3.1. 在尋求獎勵方面更高效的生物體(例如尋找美味的食物、避免疼痛、進行Xin活動等)更有可能延續它們的基因

4.4. 某些獲得獎勵的方法可能會降低一個人基因延續的可能性

4.4.1. 如果直接用電流刺激你的獎勵系統,你可能會不停地進行自我刺激,直到死去

4.5. 獎勵訊號和進化適應性之間的不一致並不隻影響孤立的個體

4.5.1. 如果一個物種找到了一個生態位,但這個生態位滿足其獎勵系統的方式不利於進化適應性,那麼這個物種就可能會滅絕

4.5.2. 除了這種意外的失敗,生物體學習在自然環境中將獎勵最大化,通常會提高它們延續自己的基因和在環境變化中生存下來的機會

5. 進化的加速器

5.1. 學習不僅對生存和繁衍有好處,還加速了進化

5.2. 學習不會改變一個人的DNA(脫氧核糖核酸),而進化則是一代又一代地改變DNA

5.3. 學習和進化之間的聯絡是由美國心理學家詹姆斯·鮑德溫(James

Baldwin)和英國生態學家康威·勞埃德·摩根(Conwy Lloyd Morgan)在1896年分別提出的,但當時並未被人們普遍接受

5.4. 鮑德溫效應

5.4.1. 進化可以選擇創造一種依靠本能生存的生物體,或者創造一種依靠適應性生存的生物體

5.4.2. 前者的每一個反應都是預先確定的,而後者則可以透過學習來確定採取何種行動

5.4.3. 計算模擬表明鮑德溫效應是真實存在的

5.5. 如果依靠適應性生存的生物體能夠在學習中生存,那麼學習能力就構成了進化的捷徑

5.5.1. 文化的影響只會加速這一過程,因為有組織的文明不僅會在個體生物體進行學習的時候保護它,還會傳遞個體本來需要自己學習的資訊

5.6. 內建的學習機制充其量只能粗略暗示特定行為在長期進化適應中產生的結果

5.6.1. 如果有一種導致生物體逃離潛在配偶、奔向捕食者的學習機制,那麼它不會持續很久

5.7. 神經元具有學習和解決問題的能力,這在動物王國中非常常見

5.8. 進化並不真的在乎你是否擁有大腦或是否可以產生有趣的想法

5.8.1. 進化只把你當作一個智慧體(agent),即某種會行動的東西

5.8.2. 邏輯推理、有目的的計劃、智慧、機智、想象力和創造力等有價值的智力特徵,可能是使智慧體變聰明的必要條件,也可能不是

6. 一個人的理性

6.1. 從古希臘哲學的早期開始,智慧的概念就與感知、推理和成功行動的能力聯絡在一起

6.2. 邏輯推理法

6.2.1. 在給出真實前提的情況下,人們透過邏輯推理可以得出真實的結論

6.3. 賭博在推廣亞里士多德關於不確定性的建議中起了核心作用

6.3.1. 16世紀60年代,義大利數學家傑羅拉莫·卡爾達諾(Gerolamo Cardano)以擲色子游戲為主要例子,第一個提出了在數學上精確的機率論

6.3.2. 對賭局進行評估不能根據期望的貨幣價值,而是要根據預期的效用

6.3.2.1. 效用即對一個人有用或有益的屬性,這是一種內在的、主觀的數量,與貨幣價值有關,但與貨幣價值不同

6.3.3. 與貨幣金額不同的是,各種賭局和獎品的效用價值是無法被直接觀察到的,只能從個人表現出的偏好中被推斷出來

6.4. 效用理論的公理基礎

6.4.1. 20世紀中葉,約翰·馮·諾依曼(John von Neumann,一位偉大的數學家,計算機領域標準的“馮·諾依曼體系結構”就是以他的名字命名的)和奧斯卡·摩根斯坦(Oskar Morgenstern)發表了效用理論的公理基礎

6.4.2. 只要個體表現出的偏好滿足任何理性主體都應該滿足的某些基本公理,那麼這個人所做的選擇必然可以被描述為最大化期望效用函式

6.4.2.1. 理性個體的行為是為了最大化期望效用

6.4.3. 公理:傳遞性:如果你喜歡A甚於B,喜歡B甚於C,那麼你喜歡A甚於C

6.4.4. 公理:單調性:假設買一種彩票可能得到獎品A,買另一種彩票可能得到獎品B,你喜歡獎品A甚於獎品B,並且你只可以選擇這兩種彩票,那麼你會更傾向於選擇得到獎品A的機率最高的彩票,而不是得到獎品B的機率最高的彩票

相關文章