讀天才與演算法:人腦與AI的數學思維筆記21_語言遊戲

躺柒發表於2024-05-08

1. 語言遊戲

1.1. 如果你想成為一名作家,理解語言是很重要的,或者至少要有理解語言的願望

1.2. 若要透過圖靈測試,演算法需要能夠接受千變萬化的“自然語言”作為輸入,並對其進行處理,然後生成與人類可能做出的反應相對應的輸出

1.3. “自然語言”一般指人類在自然進化過程中不斷被重複、被使用的,沒有經過有意識的預先設想和計劃的語言

1.3.1. 其與計算機程式碼有著鮮明的區別

1.4. 第一個成功透過圖靈測試的演算法,是電腦科學家約瑟夫·魏澤鮑姆(Joseph

Weizenbaum)在1966年開發的名為“ELIZA”的程式

1.4.1. 如果你曾經看過心理醫生,而這名心理醫生剛好接受過卡爾·羅傑斯(Carl

Rogers)的以當事人為中心的治療培訓,你就會了解,心理醫生會問一些問題,但不會把談話導向一個新的方向

1.4.2. 他問的這些話僅僅是繼續了前面的話題,而這為患者提供了進一步闡述其精神狀態的空間

1.4.3. 關鍵是要編寫很多的規則來讓對話令人信服

1.4.4. 應答的範圍有限也不靈活,並且對以往的對話沒有記憶、聯想

1.4.5. 之所以其在治療情景中應用效果良好,是因為治療通常取決於患者是否能解決他們自己的問題

1.4.6. 作為醫生的演算法應能診斷病情,所以ELIZA並不擅長進行疾病診斷,但另一些演算法可能會比你的全科醫生更擅長疾病診斷

2. 勒布納人工智慧獎

2.1. Loebner Prize

2.1.1. 20世紀90年代初,發明家休·勒布納(Hugh Loebner)贊助設立

2.2. 勒布納人工智慧獎分設金、銀、銅獎。金獎、銀獎的獎金分別為10萬美元、2.5萬美元

2.3. 銅獎又分為四個等級,獎金分別為4000美元、1000美元、500美元、200美元

2.4. 該獎項旨在遴選在人機互動方面更具靈活性和說服力的程式

2.4.1. 這個測試的內容包括破譯和理解文字、視聽元件等內容,透過標準是評委們無法將其與真正的人類區分開來

2.4.2. 第一個透過擴充套件版圖靈測試的程式將獲得一枚金質獎牌和10萬美元獎金

2.4.2.1. 如果程式不僅能以文字方式透過交談測試,在音訊和影片方式的測試中也能過關,則獲金獎,贏得10萬美元和一枚18K金質金牌

2.4.3. 如果一個程式能夠獲得半數評委的確認票,那麼它的建立者將會獲得一枚銀質獎牌和2.5萬美元的獎金

2.4.3.1. 如果它能在比較長的時間內以文字談話的方式迷惑至少半數評委,則獲銀獎

2.4.3.2. 在2013年獲得第23屆勒布納人工智慧獎銀獎的“三井”,在與人們對話的時候,會對人們提出的問題給出一些非常有見地的回答

2.4.4. 在未達到以上標準的程式中,迷惑住最多評委的將獲銅

2.5. 如果你曾經和聊天機器人聊過天,那麼你就用你跟它的對話有效地訓練過它

2.6. 如果聊天機器人在未來遇到類似的情況,它可以逆轉角色,使自己應對起來更像是人類。但大多數演算法都是基於ELIZA“如果……那麼……”的規則和更為複雜的規則,因而,這些演算法永遠無法真正處理語言的多樣性

2.6.1. 我們需要理解語言是如何組合在一起的

3. 威諾格拉德的測試

3.1. “威諾格拉德”的測試由史丹佛大學教授威諾格拉德提出

3.2. 在這個測試中那些不能很好理解語言模糊性和語言情境方面問題的人工智慧很快就會原形畢露

3.2.1. 人工智慧系統在嘗試處理“自然語言”時,會在語言模糊性和語言情境方面存在一些問題

3.3. 基於對語境和過往經驗的認知,人類知曉如何理解這個謎語似的句子,但是對於機器真的很難

3.3.1. “威諾格拉德”測試正是利用了“自然語言”的複雜性、豐富性和模糊性等特徵

3.4. 人類所使用的程式碼是長久以來在與他人的語言交流中逐步形成的

3.4.1. 從幼年開始,人類就在語言環境中浸染,在這個過程中我們不斷地學習,不斷地犯錯,不斷地再學習

3.5. 網際網路上有大量的可作為資料庫使用的例項

3.5.1. 我們為什麼不能將演算法投入網際網路任其自由發展,去學習駕馭語言的複雜性、模糊性呢?

3.6. 諾姆·喬姆斯基(Noam Chomsky)認為語言天賦是我們與生俱來的,就好像我們是按照老式的自上而下的模型進行程式設計的,而不是從零開始學習

3.6.1. 語言學家們驚奇地發現,一個孩子想要理解其他人並與之互動,所需要的語言真的不用很多

3.6.2. 對機器學習來說,僅通對一個龐大的語言使用資料庫來學習語言將會是非常困難的

4. 危險邊緣

4.1. 哥倫比亞廣播公司的益智問答遊戲節目,已有數十年曆史

4.1.1. 《危險邊緣》以答案的形式提問、提問的形式作答

4.1.1.1. 開局階段,人類選手發揮得不錯,並在一段時間內保持了領先,但最終還是不敵IBM演算法的威力

4.1.2. 更多的困難來自問答的方式

4.1.2.1. 節目以一種問答倒置的方式進行,以答案的形式提問、提問的形式作答

4.2. 2011年,IBM將注意力轉向了與國際象棋或圍棋截然不同的一個方向:挑戰變幻莫測的“自然語言”

4.2.1. 參加益智問答節目《危險邊緣》

4.3. 常常利用雙關語、文字遊戲、轉移注意力等方法來迷惑參與者,即使是人有時也很難理解其問題的意思

4.3.1. 由這些因素帶來的模糊性使得演算法幾乎不可能100%準確

4.3.2. 贏得比賽將標誌著機器在解析語言語義方面的能力有了重大提升

4.4. 肯·詹寧斯(Ken Jennings)

4.4.1. 已經連勝74場

4.5. 布拉德·拉特(Brad Rutter)

4.5.1. 直被認為是一個“學痞”

4.6. 《危險邊緣》之王

4.6.1. 兩人在學校的智力測驗小組中都曾嶄露頭角

4.7. IBM的演算法“華生(Watson)”

4.7.1. 為了紀念IBM公司的第一任執行長托馬斯·J.沃森(Thomas J.Watson)

4.8. 節目在全美電視網上播出,讓所有人看到了人類被機器超越

4.9. 要贏得比賽不僅僅要擅長回答問題,有時也需要一定的策略

4.9.1. 參賽者可以在最後一個題目上下賭注,這使得落後的選手有可能在最後一題時將手裡的錢數翻倍,從而贏得比賽

4.9.2. 華生”也分出了一部分算力,來確保它能有效地運用所有數學技能進行下注

4.10. 一定程度的運氣因素

4.10.1. 答題的過程中在題板上會給出所謂的“雙賭法”,“華生”很幸運地在比賽中選到了

4.10.2. 雙賭法通常指在賽馬博彩中,選擇兩場次指定的比賽都勝出即為贏的押注法

4.11. 有一個不公平的優勢:搶答器

4.11.1. 一開始“華生”被允許使用電子訊號的方式按搶答器,而不是像人類那樣按下實物按鈕

4.11.2. 人們很快意識到,這將給“華生”帶來巨大的優勢

4.11.3. “華生”每次都能在微秒級精確地按下搶答器

4.11.3.1. 人類的反應能力和計算機電路相比差遠了

4.12. 需要下注的,在下注的環節,“華生”依然對自己的答案表示不那麼確定,所以它下了很小的賭注

相關文章