Edge 2017年度人工智慧話題預測:從演算法、遷移學習到自產生程式

機器之心發表於2017-01-25

Edge.org 為著名知識分子俱樂部 The Reality Club 的線上社群,自 1996 年上線,如今已有 20 年曆史。在其創刊 20 週年之際,Edge.org 也推出了 2017 年度問題——2017 年,最值得關注的科學術語或概念是什麼?


以下是我們從206個回答中精選的一部分:


Terrence J. Sejnowski,計算神經科學家;薩克生物研究學院(Salk Institute)弗朗西斯·克里克學院(Francis Crick Institute)教授;《The Computational Brain》聯合作者


科學術語:演算法(Algorithms)


在 20 世紀,我們使用方程和連續變數的數學方法作為主要洞見來源,因此對物理世界有了一個深刻的認識。一個連續變數在空間和時間上的變化是平滑的。與火箭僅僅遵循牛頓運動定律不同,還沒有一種簡單的方法來描述。在 21 世紀,我們在演算法的數學基礎上——通常含有離散變數而非連續變數——在理解電腦科學和生物學中的複雜性質方面取得了進展。演算法是一個按步驟進行以實現某個目標的方法,就像在烤一個蛋糕。


自相似分形(Self-similar fractals)產生自簡單的遞迴演算法,該演算法能建立類似於灌木和樹的模式。一個真正的樹結構也是一個演算法,由一系列決定著細胞分裂時基因的開啟和關閉的決策所驅動。大腦的結構也許是宇宙中最苛刻的構造專案,它也受到嵌入 DNA 中的演算法所支配,該演算法能夠調節大腦中數百個不同的部分的成千上萬種不同型別的神經元之間的連線的發育。


大腦中的學習與記憶是由演算法控制的,該演算法根據神經元活動的歷史來改變神經元之間突觸的強度。學習演算法最近也被用於訓練深度神經網路模型來識別語音、翻譯語言、為照片新增說明以及進行錦標賽水平的圍棋對弈。獲得這些驚人能力的方法就是將同一個簡單的學習演算法應用到不同型別的資料上。


生成複雜性的演算法有多常見?「遊戲人生(The Game of Life)」是一個元胞自動機,其生成物件似乎有自己的生命。Stephen Wolfram 想知道能夠導致複雜行為的最簡單的元胞自動機規則,因而對所有的規則開始了搜尋。前 29 個規則產生的模式總是返回到無聊的行為:所有節點都以相同的值結束,陷入一個無限重複的序列或無盡的混亂變化中。但規則 30 卻能產生不斷演化的複雜模式。甚至可以證明,規則 30 能夠進行一般計算——可以計算任何可計算函式。


這一發現的啟示之一是,我們在自然界中所發現的顯著複雜性,可能來自對分子間最簡單的化學作用空間的取樣。複雜的分子應該是從進化中演化來而不應該被視為一種奇蹟。然而,元胞自動機可能不是一個早期生命的良好模型,而對於何種簡單化學系統能夠創造出複雜分子的探討還仍然是一個懸而未決的問題。也許只有特殊的生化系統才有這種特性,該特性或許有助於縮小生命起源中相互作用的可能範圍。Francis Crick 和 Leslie Orgel 認為,RNA 可能會有這些特性,它們在 DNA 的概念於進化早期出現之前開啟了一個 RNA 的世界。


有多少演算法?想象所有可能的演算法空間,空間中的每一點都是一個處理問題的演算法。其中有些演算法有用而多產得令人吃驚。在過去,這些有用的演算法是由數學家和電腦科學家像工匠那樣手工製作的。與此相反,Wolfram 發現元胞自動機透過自動搜尋能產生高度複雜的模式。Wolfram 定理規定,你不必在演算法空間中走得太遠去尋找一個解決一類有趣問題的演算法。這就像是讓機器人在網上玩 StarCraft 之類的遊戲,嘗試所有可能的策略。根據 Wolfram 定理,在能夠贏得遊戲的演算法宇宙中的某個地方,應該有一個辦法可以找到該演算法。


Wolfram 專注於研究元胞自動機空間——所有可能演算法空間中一個小的子空間——中最簡單的演算法。我們現在已確認了神經網路空間——人類所設計過的最複雜的一部分演算法空間——中的 Wolfram 定理。每個深度學習網路是所有可能演算法空間中的一個點,而且它們是透過自動搜尋被發現的。對於一個大網路和一個大資料集,從不同起點進行的學習可以產生無限的網路,它們解決問題的能力大致相等。每個資料集產生自己的演算法星系,而資料集還在激增。


誰知道宇宙演算法對我們來說會是什麼樣子?可能整個有用的演算法星系還未被人類發現,但可以透過自動搜尋實現。21 世紀才剛剛開始。


Peter Lee,微軟全球資深副總裁


科學術語:遷移學習(Transfer Learning)


「你永遠不能理解一種語言——除非你至少理解兩種語言」。


任何一個學過第二語言的人,對英國作家傑弗裡·威廉斯的這句話應該都會「感同身受」。但為什麼這樣說呢?其原因在於學習使用外語的過程會不可避免地加深一個人對其母語的理解。事實上,歌德也發現這一理念的強大威力,以至於他不由自主地做出了一個與之類似但更為極端的斷言:


「一個不會外語的人對其母語也一無所知」。


這種說法極為有趣,但令人驚訝的是恐怕更在於其實質——對某一項技能或心理機能的學習和精進能夠對其他技能或心理機能產生積極影響——這種效應即為遷移學習。它不僅存在於人類智慧,對機器智慧同樣如此。如今,遷移學習已成為機器學習的基礎研究領域之一,且具有廣泛的實際應用潛力。


今天的機器學習領域主要圍繞著能力可隨資料及經驗的積累而提高的演算法,且已取得驚人進步,並由此催生出可比肩甚至超越人類智慧的計算系統,例如具有理解、處理及翻譯語言能力的系統。近年來,機器學習研究多聚焦在深度神經網路(DNN)——一種透過從大量資料中推斷異常複雜模式而進行學習的演算法概念。例如,向一臺基於 DNN 的機器輸入數千個英文錄音片段及其對應文字,機器便可從錄音與文字的關聯中推斷出相關模式。伴隨著關聯模式的逐漸精確,系統最終將能「理解」英語語音。事實上,今天的 DNN 已經相當成熟,一臺功能強大的計算機在學習過足夠的訓練樣本後,完全可以對真人對話進行文字速記,並達到比專業速記員更高的準確率。


一些人也許會很驚訝,計算機化的學習機器(computerized learning machines)展現出遷移學習的能力。我們可以透過一項涉及兩套機器學習系統的實驗來思考這個問題,為了簡單起見,我們將它們稱為機器 A 和機器 B。機器 A 使用全新的 DNN,機器 B 則使用已經接受訓練並能理解英語的 DNN。現在,假設我們用一組完全相同的普通話錄音及對應文字來對機器 A 和 B 進行訓練,大家覺得結果會怎樣?令人稱奇的是,機器 B(曾接受英語訓練的機器)展現出比機器 A 更好的普通話技能,因為它之前接受的英語訓練將相關能力遷移到了普通話理解任務中。


不僅如此,這項實驗還有另一個令人更為驚歎的結果:機器 B 不僅普通話能力更高,它的英語理解能力也會提高!看來威廉斯和歌德確實說對了一點——學習第二語言確實能夠加深對兩種語言的理解,即使機器也不例外。


遷移學習的理念至今仍是基礎研究的課題之一,因此,許多根本性的問題仍然懸而未決。例如,並非所有的「遷移」都是有用的。要讓「遷移」發揮作用,學習任務之間至少需要相互關聯,而這種關聯方式仍然缺乏精確定義或科學分析,且與其他領域相關概念之間的聯絡仍有待闡明,如認知科學和學習理論。誠然,對於任何一個電腦科學家而言,從事計算機系統的「擬人化(anthropomorphizing)」在理智層面都是危險的,但我們卻不得不承認,遷移學習讓人類學習和機器學習之間產生了強烈而誘人的相似性;當然,如果通用人工智慧真能有朝一日成為現實,遷移學習恐怕將是這一過程中的決定性因素之一。對於善於哲學思考的人來說,遷移學習的正規模型可能會為知識和知識遷移帶來新發現和分類方法。


遷移學習同樣具有極高的應用潛力。過去,機器學習在搜尋和資訊檢索等領域中的實用價值較為單一,大多聚焦於透過全球資訊網上大量資料集和人物資訊進行學習的系統。但我們是否想過,經過網路訓練的系統可以瞭解關於較小社群、組織甚至個人的資訊麼?未來智慧機器可以學習與特定個人或小型組織相關的、高度專業化的任務麼?遷移學習讓我們可以想象這樣一種可能性,讓所有網路資訊都成為機器學習系統的基礎,而系統則可透過遷移學習獲得更個性化的資訊。實現這個願景,我們將向人工智慧普及化邁出又一大步。


Susan Blackmore,心理學家,《Consciousness: An Introduction》一書作者


科學術語:Replicator Power(複製體能力)


宇宙中的一切設計都從何而來?無論在何處,我都能看見一系列事物——它們有的被設計過,而有的則沒有——岩石、星星、水窪裡的雨水,桌子、書本、草地、兔子乃至我的雙手。


人們並非透過這樣的方式來區分被設計的與未被設計的(事物)。通常人們將地上的書與岩石區分開來——因為書籍是為特定目的而設計的,但岩石則不是。書籍會有作者、出版商、印刷者、封面設計者等等,這代表著一種自上而下(譯者注:由整體概念到具體細節)的設計模式,是「真正的」設計。但對於青草、兔子乃至雙手,它們的確能夠服務於特定的功能,但它們是透過一種無意識的、自下而上的過程演化的。因而,它們不是「真正的」設計。


對於真正的設計與演化的「設計」之間的區別,偶爾被明確地說清。但在未被說清時,進化生物學家們往往對於將「設計」一詞用在無意識的過程上會有某些畏懼的陳述。但它們真的「好像」是被設計的。它們並非是依據某種計劃或意識的由上至下的模式,而是一種完全根據無意識過程的由下自上的模式。換句話說,我們大腦與「真正的」設計是不同的。


如果關於複製力(Replicator Power)的概念被更好的瞭解,那麼這種錯誤的區分方法也許就會消除。因為我們會發現,所有的設計都基於一種相同底層過程。一個複製體(Replicator)是能夠影響環境並能複製自身的資訊(information)。基於變化與選擇進行復制的進化演算法,是一種能夠無限制增加已有資訊的過程。而複製體的能力,就從它在這種進化演算法中扮演的資訊載體的角色而來。基因就是最為明顯的例子,它們帶來了各種各樣的生物作為它們(達到目的的)媒介或產物。而自然選擇的作用則決定了複製體的成敗。


「複製體」這個術語的價值在於它的普適性。這也是道金斯(英國演化生物學家)在撰寫關於普適達爾文主義(Universal Darwinism,即將達爾文主義中最基本的想法應用到到所有的自複製資訊中)時所強調的。當複製體存在並且環境適宜的情況下,「設計」將會隨之發生。所以道金斯創造術語「文化基因(meme)」來說明世界上不止有一個複製體在進化。遵循關於進化的方式的思考,他也做出了這樣的斷言:複製體的有差別倖存(differential survival)導致了各個地方生命的進化。我則會補充認為:複製體的有差別倖存導致了各個地方智慧的進化。


這也就表明,人類設計從本質上與生物設計並無二致。兩者都基於複製體被複制(的過程)——要不然是以 DNA 鹼基對的分子順序進行復制,要不然是以書本上字詞的順序進行復制。在分子複製的情況下,新的序列由複製過程的錯誤、突變或重組而產生。在撰寫書籍的過程中,新的序列透過作者重組熟悉的詞彙到新片語、句子乃至段落產生。在兩個例子中,許多不同的序列被創造但很少的被保留被繼續複製,而創造性設計的產品因複製力而出現。要理解人類以這種方式進行設計,就要放棄對於自上而下設計、智慧與規劃對創造力必不可少這樣的假設,要將那些能力及它們帶來的設計視為進化的原因而非結果。


接受這樣的觀點也許會帶來不適,因為它意味著認同我們一切認為我們設計的東西實際上是一種從下到上、毫無頭緒的過程利用我們作為一種複製機器(copy machinery)。這種不適也許就如同伯明翰主教之妻所說:這樣知識貶低了人類自身,並且會消除我們的人性乃至能力。但我們已經能(或多或少在世界上的某些地方)學會擁抱而非畏懼這樣的知識,我們的身體透過一種無意識的自下而上的過程進化。在相同方向上還有另一過程。


認識到複製力的意義在於認識到現在還有其他的複製體、以後還會有更多。這種無意識的過程將我們人類從猿猴轉變為能講話、能夠複製文化基因(meme)的動物,讓我們能生產桌子、書本、汽車、飛機以及複製機器——這是最重要的一步。這(複製機)包括了導致印刷過程的寫作、產出傢俱的陶論、木頭加工工具,以及導致現在資訊爆炸的計算機技術。


人工智慧,無論是被造成桌上箱子的樣子,還是分佈在網路世界中的機器人,都被以複製能力的方式而創造,就如同我們的智慧被複制能力創造一般。它們以遠超過我們的速度進化,並且會帶來更深刻乃至更快的複製體。這種能力不停止,因為我們即希望如此。並且它的產物並不會臣服於我們的陳述,不會受我們的控制也不會按照(我們希望的)它興盛的方式設計。這種智慧會不斷地成長,並且我們越快接受複製能力的概念,我們將會對有人工機器的未來生活的態度越現實。


Ursula Martin,牛津大學電腦科學教授


科學術語:抽象(Abstraction)


翻開 Ada Lovelace 在 1843 年關於 Charles Babbage 未建成的分析引擎 (Analytical Engine) 的論文,如果你足夠「極客」的話,你依然能夠應付 19 世紀的長難句——令人驚訝的是,它們到如今仍然具有可讀性。


這個分析引擎是完全機械的。設定一個具有十個齒的重金屬盤來儲存數字,五十個這樣的盤堆疊後可以儲存五十位數字,並且儲存器將包含 100 個這樣的堆疊。新增兩個數字的基本指令將它們從儲存器移動到 CPU 中,在那裡它們將被新增在一起,而後移回到儲存器中的新位置等待進一步使用,這些過程全都是機械的。它用衝孔卡來程式設計,代表了變數和操作,並進一步用精心設計的機制來移動衝孔卡,在需要迴圈時以組為單位重新使用。Babbage 估測認為這個巨大的機器將兩個 20 位的數字相乘需要三分鐘的時間。


這篇論文可讀性非常高,因為 Lovelace 所描述的機器使用抽象——儲存、mill、變數、操作等,而非精心製作的鐵器。這些抽象及它們之間的關係在識別主要元件和元件間傳遞的資料的過程中捕獲了機器的本質。他們用當時的語言捕獲當時和現在計算中的一個核心問題——使用不同的機器可計算和不可計算的內容。本文確定了「若所有智力執行的操作本身能夠被精確定義,則重現這些操作以獲得確定結果」所需的元素,並且算術、條件分支等恰恰是百餘年後阿蘭·圖靈證明其關於計算力量的結果所需要的元素。


僅在代表它們的機械行為中,你不能在 Babbage 的機器中指向一個變數或一個附加指令。在 20 世紀 60 年代,曾經 Lovelace 只能用來應對官方解釋的抽象已被改進得更加精良。牛津大學的 Dana Scott 和 Christopher Strachey 等電腦科學家使用單一抽象來對機器和執行的程式建模,使得精確的數學推理能夠預測其行為。這些概念已經進一步完善,如電腦科學家 Samson Abramsky 使用先進的邏輯和數學來捕獲更微妙的抽象,不僅可以用於經典計算機,也可用於量子計算。


為實際問題確立一個優質的抽象不僅是一門科學,也是一門藝術。確立過程需要捕捉問題的構建塊和連線它們的元素,這些元素應具有恰到好處的細節量;確立過程提取的是遠離塊內部複雜區域的部分,所以設計者只需關注與其他元件互動所需的元素即可。Jeannette Wing 將這些技能描述為計算思維,而這個概念可以在程式設計之外的許多情況下被指出。


Lovelace 發現了更廣泛的抽象力,希望透過發展「利用法則建立大腦分子的相互作用」來理解神經系統,實現自己的理想。並且如今的電腦科學家確實在為此擴充套件技術開發並建立合適的抽象。


Samuel Arbesman,複雜性(Complexity)科學家;拉克斯資本公司(Lux Capital)住宅研究方面科學家;《Overcomplicated》一書作者


科學主題:自產生程式/奎因(Quines)


在計算機程式的無限空間中有一個特殊的程式碼子集:當執行程式時輸出該程式本身。換句話說,這是一些自複製程式;當你執行它們時,它們會輸出自身。這些短小的程式通常被稱為「自產生程式/奎因(quines)」,來源於哲學家韋拉德·範·奧曼·奎因(Willard Van Orman Quine)的名字,基於侯世達(Douglas R. Hofstadter)所著的《哥德爾、埃舍爾、巴赫:一條永恆的金帶(Gödel, Escher, Bach: an Eternal Golden Braid)》一書中的術語。


Quines 一詞給人的第一印象往往顯得不可思議。你要是曾經寫過程式碼就更會有這種感覺,因為如果你不瞭解建立 quines 的技巧,便可能會覺得難以構建。它們往往是優雅的小東西,而現在有大量的計算機語言寫出了各種各樣的 quines 案例,從簡短可愛型到不可思議之長。

 

不過它們為什麼如此重要呢?quines 是電腦科學、語言學及其他學科思想的精華。簡單點說,quines 可以被認為是定點,即數學中的 fixed point:一個輸出自身而保持函式值不變的數學函式的值(想想 1 的平方根為什麼仍然為是 1)。


不過我們可以進一步地討論一下。Quines 表明計算機所產生的語言既可以是運算子也可以是運算元——一個 quine 文字執行並透過一個向自身反饋的過程輸出原始程式碼。文字可以是有意義的單詞,也可以是「有意義的單詞」,思考這個句子「This sentence has five words.」,我們很高興地看到,此句中的單詞不僅是在描述(充當一個運算子)也是在被描述(充當一個運算元)。不過這個文字遊戲也很有用。文字和功能之間的這種關係是 Kurt Gödel 在不完備性數學研究中用到的一個基本組成部分,而這又與阿蘭·圖靈在解決停機問題時所用的方法有關。這些基本思想顯示出數學和電腦科學中的某種侷限性:我們不能證明某些陳述在一個給定系統中的對與錯,並且也沒有任何演算法可以確定任何給定的計算機程式是否將會永遠地終止執行。


更廣泛地說,quines 還表明了複製(reproduction)行為不是生物領域所獨有的。就像一個細胞利用物理及化學規律來生存和繁衍一樣,一個 quines 會新增一門程式語言的規則來執行程式碼。雖然它並不完全複製自身,但其工作原理是相似的。你甚至可以進一步在某個「輻射硬化(radiation hardened)」quine 中發現這種生物性質的跡象:在這種 quine 中,任何字元都可以被刪除,而它仍然可以進行復制!對我們中的許多人來說,輻射硬化 quine 聽起來無疑就像基因的 DNA 序列那樣令人費解。冗長與堅固——生物學的標誌——在有機體與計算機中輸出的是相似的結構。


馮·諾依曼(John von Neumann)是計算機界的先驅之一,他在機器的自我複製方面做過大量的思考,把從計算早期開始研究的技術與生物學結合起來。我們仍然會在小段的 quine、小段的計算機程式碼中看到,它們透過其微小的努力將各個領域一個接一個地縫合起來。


Sean Carroll,加州理工學院理論物理學家;《The Big Picture》一書作者


科學術語:貝葉斯定理(Bayes's Theorem)


你擔心朋友生你的氣。你設了一個晚宴而沒有邀請他們;這就是那種會令他們不開心的事情。但你並不確定。所以你給他們發了一條簡訊:「今晚想出去嗎?」二十分鐘後你收到一個回覆:「不能,忙。」我們怎麼解釋這條新資訊?


當然部分答案可以歸結為人類心理學。但其中一部分是統計推理的一個基本原理,稱為貝葉斯定理。


當我們不確定某些命題的真假時就會尋求於貝葉斯定理,而新資訊會影響該命題為真的機率。這個命題可以是朋友們的感受、世界盃結果、總統選舉結果,或有關早期宇宙活動的特定理論。換句話說:我們真的一直在使用貝葉斯定理。可能是以某些正確或不正確的方式,但它無處不在。


該理論本身理解起來不是很難:給定一些新資料,一個命題為真的機率正比於其在資料出現之前就為真的機率乘以該命題為真時出現該新資料的可能性。


因此它有兩個影響因素。第一個是先驗機率(prior probability),即我們在收集任何新資訊前就確定某一想法的機率。第二個是在該想法為真時所收集的一些特定資料的可能性。貝葉斯定理認為:不同命題在新資料收集過程之後的相對機率就是二者的乘積。


科學家們總是以精確、定量的方法使用貝葉斯定理。但這個定理——或實際上是構成其基礎的「貝葉斯推理」這個思想——無處不在。在你給朋友發簡訊之前,你已經知道他們有多大可能會生你的氣。換句話說,你對「生氣」與「不生氣」的命題有一個先驗預期。當你收到他們的回覆時,你含蓄地對這些機率做了一個貝葉斯更新(Bayesian updating)。如果他們生氣,那麼他們有多大可能會傳送這樣的回覆?要是他們不生氣呢?乘以適當的先驗機率,有了新資訊後,現在你就可以明白他們生氣的可能性有多大。


在這一條純統計學邏輯背後潛伏有兩個偉大而深刻、足以塑造世界觀的思想。


一個是先驗機率的概念。不管你承認與否,不管擁有什麼樣的資料,你都隱約會對所能想到的每一個命題持有一個先驗機率。如果你說,「我不知道它是真是假,」那麼其實你是在說「我的先驗機率是 50%。」並且其設定過程不涉及客觀的、事先準備好的步驟。人與人之間想法差別巨大。對某個人來說,一張看起來像是鬼魂的照片無疑是人死後生命的憑證;對另一個人來說,它更可能是偽造的。無論我們以何種先驗機率開始思考,給定無限量的證據和完美的理性,我們都應該會趨於相似的信仰——但沒有無限的證據,理性也並不完美。


另一個偉大的思想是,你對一種思想的信仰程度將永遠不可能是 0 或 1。對某些資料的收集永遠不是絕對不可能的,無論真相是什麼——即使最嚴格的科學實驗也容易出錯,而大多數日常資料的收集根本算不上嚴格。這就是為什麼科學從來沒有「證明」什麼;我們只是增加了對某些思想的憑證,直到它們幾乎(但不完全)達到 100%。貝葉斯定理提醒我們在面對新資訊時應當保持思想的開放性,而且它會告訴我們到底需要什麼樣的新資訊。


Ian Bogost,Ivan Allen 學院媒體研究名譽主席,喬治亞理工學院互動式計算教授;Persuasive Games LLC 創始合夥人;《The Atlantic》特約編輯


科學術語:機率空間(possibility space)


有些問題很容易,但大多數問題都很難。它們超越了人類掌握和推理可能答案的能力。不僅僅是複雜的科學與政治問題,例如制定複雜的經濟決策或建立模型以應對氣候變化,日常生活也是如此。「今晚去吃晚飯吧。」「好啊,但是去哪呢?」這樣的問題很快就陷入了無結構形式的存在主義危機(existential crisis)。甚至是,「我是誰?」


數學家思考複雜問題的一種方法是利用可能解的機率空間(possible solutions,有時也稱為解空間/solution space 或 probability space)在數學中,機率空間被用作一個暫存器或所有可能解的分類帳目。例如,擲一枚硬幣的機率空間是頭或尾。對於兩枚硬幣:正面-正面、正面-反面、反面-正面、反面-反面。


這是一個相對簡單的例子,因為任何機率空間的給定子集都可以被測量和記錄下來。但在其他情況下,機率空間可能非常大,甚至無限大。例如宇宙中可能存在的生命形式,或可能的未來進化分支。或是可能的圍棋遊戲。甚至是你能夠用一晚上的時間所能做到的所有事情。


在這些情況下,要完整地描繪機率空間不僅很難或根本不可能做到,而且往往連嘗試甚至都毫無意義。一個經濟學家可能會依據某些行為的相關效益成本而從其淨邊際效益(net marginal benefit)中建立一個可能外出吃晚飯的模型,比如看一部電影、騎一次腳踏車或吃一份惠靈頓牛排,但這種做法假定了日常生活中所不存在的理性主義。


在遊戲設計中,創作者經常將自己的工作看作是為玩家創造機率空間。在源自古代中國的圍棋遊戲中,棋子、棋子擺放規則以及一塊棋盤為整個對弈提供了一個非常大的機率空間。但每個人的行動都會越來越受限——依賴於每位棋手的先前決策集。否則棋手就不能移動一步。任何人都不能在所有圍棋比賽的全部數學機率空間之內下棋,卻可以在——於給定的時間點、給定的棋盤上所進行的可能且合乎規則的移動步驟中——更窄的機率空間內下棋。


一些設計師尊崇圍棋和象棋類遊戲的數學幫助,希望用最少的元素創造出最大的機率空間。但更多時候,令一款遊戲在美學上顯得獨特的東西不是數學上的大或深,而是其組成元素及其可能配置有多麼有趣而獨特。俄羅斯方塊只有七個不同的元素,所有元素以相同方式運作。俄羅斯方塊的樂趣來自於學習在各種情況下識別和操作這些元素。


積極且慎重地去限制一個機率空間的練習效用遠遠超出了科學、數學和遊戲設計。每種情況都可以透過確認或強加限制以產生一個可行的、可操作的可能行動領域而被更加慎重且卓有成效地解決。這並不意味著你每次啟動洗碗機或與朋友進行通宵辯論時都必須制定效用圖表。而是說,任何問題的第一步都得承認,現有的大量限制已經存在,正等待被確認和啟用。


在面對巨大或無限大的機率空間時,科學家們試圖強加一些限制以創造可測量且可記錄的工作。例如,一個生物學家可以透過限制對一定規模和組成成分的恆星或行星的請求來建立一個可能存在外星生命的機率空間。當你為一頓晚飯的選址進行爭論時也會這樣做——即使你在正常情況下不這樣想:你喜歡什麼樣的食物?你想花多少錢?你願意跑多遠?要決定其中的一兩個問題往往會產生一些進步。而它在避免進入一個存在主義螺旋中時也是這樣做的,向內心深處尋問你到底是誰,或人類選擇的終極來源:你真正想要的是什麼。在日常生活中,就像在科學中一樣,答案已然存在於世,比它們在你頭腦中被發明的都要多。


Scott Aaronson,德克薩斯大學奧斯汀分校電腦科學 David J. Bruton 的榮譽教授;《Quantum Computing Since Democritus》一書作者


科學術語:態(State)


在物理學、數學和電腦科學中,系統的狀態是封裝所有你所需要的預測它將做什麼,或至少預測它做這件事而非另一件事的機率的資訊,來響應任何可能的刺激。從某種意義上說,態是一個決定系統在表面外觀下的行為的「隱藏現實」。但在另一種意義上,沒有什麼隱藏的態——對於從不重視觀察的態的任何部分,都能夠用奧卡姆剃刀原理(Occam』s Razor)將其切割,來產生更簡單、優質的描述。


這樣看來,「態」這個概念似乎很明顯。那麼,為何愛因斯坦,圖靈和其他人還會在這個概念上,在走向人類最難得的知識勝利的道路上奮鬥那麼多年?


 一起來看幾個迷題:


如果要新增兩個數字,計算機顯然需要一個包含著新增說明的新增單元。但是,它還需要一些說明解釋這些說明,而後它便需要說明來解釋這些說明的說明……所以我們得出結論,新增數字對於任何範圍有限的機器來說是不可能的。


根據量子重力的現代理念,空間(space)可能並不是根本,而是對普朗克量級自由度的量子位(qubit)網路的描述。我曾有過疑問:倘若宇宙是一個量子位的網路,那麼這些量子位在哪裡?它們是不是沒有意義(例如,假設兩個量子位是「鄰居」,卻沒有預先存在的空間來使量子位成為鄰居)?


根據狹義相對論,可知光速最快。但假設我翻轉一枚硬幣,將結果寫在兩個相同的信封中,然後將一個信封放在地球上,另一個放到冥王星。接著,我開啟地球上信封的瞬間,改變了冥王星上信封的狀態,從「正面和反面可能性相同」變成「絕對是正面」或「絕對是反面」(我們可以看到,這種型別的量子糾纏甚至成為了經典謎題)!


關於計算機的謎題是我與非科學家知識分子進行無數次辯論的一個話題。我認為,解析度可以指定計算機的狀態,涉及到要新增(編碼,如二進位制)的數字,和橫跨數字的新增和攜帶、由布林邏輯操控並最終透過物理定律實現的有限控制單元。你可能會問:物理定律本身是什麼?無論對於這個問題有什麼答案,它的基礎在哪裡?這些都是我們的問題;同時,計算機工作所需要的一切都包含在它的態中。


 這個關於量子位的問題是許多其他問題的附加問題:例如,如果宇宙正在擴張,那麼它正擴張到哪裡?這些問題未必不好。但從科學的角度來講,一個人完全有理由回應:「你在建議我們在世界的態上建立新事物,比如擴張或尋找我們的第二個生存空間。那麼這第二個空間對觀察有什麼影響?如果永遠不會有影響,為什麼不把它切割出去呢?」


關於信封問題,可以透過認為你在地球上決定是否開啟信封不會影響觀察者在冥王星上感知信封內容的機率分佈來解決。如此便可以證明一個定理——即使地球和冥王星之間存在量子糾纏,類似的事實在量子情況下同樣成立:在這裡你選擇做的任何事情都不會改變區域性量子狀態(即密度矩陣)。這就是與愛因斯坦的擔憂相反,量子力學與狹義相對論相一致的原因。


 這種情況下,相對論、量子力學、計量理論、密碼學、人工智慧以及其他 500 個可能的領域都可以總結為「沒有差異的區別不能算作區別」。這個總結可能會使一些讀者想到 20 世紀早期的邏輯實證主義教義,或者想到波普爾所堅持的理論:從不冒險偽造預測的理論都是偽科學。然而我們沒有必要冒險做出關於實證主義者或波普爾究竟是否正確的複雜辯論(或者實證主義本身是實證主義的還是可偽造的)。


我們只要記住一個簡單的道理就足夠了,那便是——世界真實存在於我們的感覺之外,但我們不能坐在扶手椅中便說出它的態由什麼組成。我們的工作是圍繞最優的科學理論建立本體,而不能本末倒置。也就是說,我們應實時修改對於「實際存在」的概念,將我們所發現的可以透過觀察來區分的新事物包含進來,並排除不能區分的事物。


有些人發現把自己的本體限制在態的程度似乎遠遠不夠,只達到解釋觀察的程度。但考慮到替代時,Charlatans 這個種族主義者的每個有說服力的忠告都在不斷地激勵我們超越系統的態,到達它隱藏的本質,並在沒有要求的地方做出區分。


甚至在自由意志中的許多困惑也存在對「態」概念的不清晰。許多人認為,根據物理學,你未來的選擇由宇宙的當前狀態所「決定」。但這忽視了一個事實,即無論何種物理學都需要與該主體契合,宇宙的當前狀態總會被認為秘密地決定未來的選擇,而這確實是隱藏變數所解釋的量子力學,如 Bohmian 力學。對我來說,這使得「決定(determination)」這一概念在這些討論中幾近空洞,而實際的可預測性更為重要。


態是應當廣為人知的科學概念,因為在我看來,這其中蘊含著全部的科學世界觀。


Joshua Bongard,佛蒙特大學威諾德電腦科學教授,《How the Body Shapes the Way We Think》一書作者


科學術語:符號接地問題(The Symbol Grounding Problem)


阿蘭·圖靈二戰期間的合作者 I.J. Good 曾經寫道,比人類更聰明的機器將是我們所做的「最後發明」。許多人認為社會將走到這一步,因為智慧機器正愈加侵入我們的日常生活和想象力,而這種入侵正沿著兩條戰線前進。這些機器愈發被扣上誘發經濟變革的帽子,導致一些人質疑工作的必要性。但更深層的是,我們不知道這樣的超級智慧機器是否會「和我們一樣」:他們可能會思考,但他們有感覺嗎?


 為了幫助錨定後面的問題,Stevan Harnad 提出了符號接地問題(symbol grounding problem)。對機器而言,透過將所聽到的單詞直接轉換為口語來學習構成人類語言的符號的意思是有問題的。這就像試圖使用詞典學習埃及象形文字,其中每個象形文字是使用其他象形文字定義的。下面來看我剛剛與網路上功率最大的聊天機器的交流內容:


我:你好。

它:你好,最近過得怎麼樣?

我:不錯啊,你呢?

它:我過得很好,謝謝。

我:我最近一直在思考。

它:思考什麼?

我:符號接地問題。

它:你可以給我講一個令人開心的故事嗎?


符號接地問題的解決方案是使符號在物理經驗豐富的土壤中接地。例如,機器人可以知道符號「跳躍(jump)」與其腳底壓力的突然消失有關。這個機器人可以透過讓一個人跳躍,觀察她的雙腳離開地面,並推斷這個人類的感覺與它在跳躍時的感覺相同來與人類共情。最後,這樣的機器可以遞迴地將已接地的符號中越來越抽象的符號接地,直到最終它可以在第一次聽到成語「don』t jump to conclusions」時理解為「三思而後行」。


公眾理當關注這個看似神秘的認知科學角落,因為不以這種方式將符號接地的機器會很危險。來看我與這個聊天機器的交流:它不僅不知道它最後的回覆是「錯誤的」,也沒能預測我對於它的回覆會感到沮喪還是開心。同樣,另一臺機器也可能無法預測我對於它的行為的恐懼反應。


如今機器可以在接收到一百萬張包含人類的照片和另一百萬張不含人類的照片之後,不必經歷接地符號便可分辨新照片是否包含人類。但換成由兩百萬段對話組成的資料集:第一百萬中,演講者正在討論如何最好地幫助 Bob; 在第二百萬中,他們在密謀傷害他。就算目前最先進的機器也不能分辨一個新的對話中的發言者是想幫助還是傷害 Bob。


大多數人可以透過聽一段談話來預測被討論的人是否處於危險之中。因為我們在現實生活、書籍和電影中聽過足夠的討論,從而能夠延伸至當前的談話,而不像在之前未見到的照片中識別人類的計算機,所以我們也許可以對電腦也這樣做。然而,我們也可以透過連線詞,影像和親身體驗來感同身受:我們可以處於談論 Bob 的人的立場中或 Bob 自己的立場中。如果一個人說「善有善報」,並伴以一個諷刺的嘲笑,我們可以提取這些語言符號(「一個」,「好」,...)且結合視覺提示,並做一些心理模擬。


首先,我們可以回溯並假裝自己是 Bob,並想象他/我們的行為減緩了講話者的飢餓或消融了另一個身體或情感的痛苦。然後我們做回自己,想象她會說的話。我們不會像她那樣做出諷刺的嘲笑,我們的預測失敗了。


所以我們再次想象自己是 Bob,但這次精神上模擬在某種程度上想要傷害講話者。在此行為期間,我們再轉變為講話者並遭受她的痛苦。回到現在,我們想象自己說同樣的話,並且預期中報復的感覺出現了,於是我們做出冷笑來匹配講話者的嘲笑。故而我們預測,講話者想要傷害 Bob。


神經科學越來越多的證據表明,聽到的詞點亮了大部分的大腦,而不僅僅是某些本地化的語言模組。這會不會表明一個人扭曲的話、行動、自己之前的感受經歷和精神搶到了感官/行動/經歷的編織電纜?這些電纜可以作為從他人的行為和感覺轉到我們自己的行為和感覺,而後再返回去的橋樑嗎?


這些機器可能是有用的,甚至能夠共情。但它們會有意識嗎?意識是目前科學無法達到的,但我們可以思考。倘若我「感覺」你的痛苦,主體和客體是清晰的:我是主體,你是客體。但倘若我感到自己腳趾的疼痛,主體和客體的區分便不那麼明顯了。或者他們是一致的?如果兩個人能夠透過彼此的共情相連,當我傷害自己時,我的大腦的兩個部分不能共情嗎?也許感覺是動詞而不是名詞:它們可能是細胞群之間的特異性交換。那麼,意識可以不僅僅是一個更小的上接接地符號的感覺/運動/經驗的分支的分形安排嗎?如果神話告訴我們地球是平的,並且放在一隻巨龜的背面,我們可能會問什麼拿著烏龜。答案當然是:一直都是烏龜。所以也許意識也一直只是細胞群之間的同感。


Roger Highfield,Science Museum Group 外事部門負責人、 Supercooperators 作者之一、複雜度前沿者


科學術語:可以採取行動的預測(Actionable Predictions)


 對顯而易見的事根本不值一提的想法一般不會被怪罪,更不用說它即將成為一種文化越來越流行。畢竟,「pre」意味著「以前」,因此毫無疑問你應該在得到預測後採取行動來改變你的未來——舉個例子,就像大雨要來了買傘一樣。


 天氣預報確實是一個促使你採取行動的預測的例子,是從衛星和各處感測器彙總過來的資料與模型的完美結合。但是當你的視線從物理科學轉移到醫學,這些預測卻很難辨別。


 在醫生能夠針對每個患者做出規範的、可信並能夠採取行動的預測上,我們仍有很長的路要走——哪種治療會對患者的幫助最大,哪種藥會對患者的副作用最小等等。


 很遺憾,對於很多簡單的問題,答案依然不易捉摸。我應該因為嗓子疼而吃抗生素嗎?免疫療法對我管用嗎?那個長長的藥品副作用清單中的哪部分應該引起我的注意?對我來說最好的食譜安排是什麼?如果我們能像氣象學家預測明天的天氣那樣預測出每個患者需要的答案。


 今天很多人講大資料可以提供所有答案。在生物學上,舉個例子,曾經,人類基因工程所得到的資料曾經為我們帶來了很大的希望和願景——如果我們獲得一段病人的 DNA 序列,我們可以預測它們最後的衰亡。


 拋開基因組的擴散、表觀基因組、蛋白質組和轉錄物組不談,情況已經比預想的糟糕了,最初有關個性化定製的基因藥物的夢想已經降格成了精確藥物,在這裡我們假定一個特定的人會與之前研究過的基因相似的人群相同的藥物反應。


 生物學領域裡盲目地蒐集大資料依然盛行,不過重點突出變換技術,比如機器學習—人工神經網路—來發現所有資料中有意義的特徵。但不管它們多「深」多複雜,神經網路僅僅是儘可能適配了可用資料的變化曲線。它們也許能做插值,但對於超過訓練範圍的外擴,效果依然讓人憂心忡忡。


 資料的量並不是能成為解決問題的全部。我們是收集了很多資料,但是我們收集到保質保量的資料了嗎?我們能從一系列錯誤的關聯關係中分辨出有用訊號嗎?假定身體是動態且不斷變化的,資料的即時記錄樣本真的能記錄下生命的全部複雜性嗎?


 為了得到醫學上有效的預測,我們同樣要在生物學的數學建模中進行一個改變,這改變很好理解:細胞是非常複雜的,更不用說器官和身體了。


 我們應該增加對複雜系統的研究興趣,以使得我們能預測單個病人的後續發展。而不是從早期傳播研究中推斷應該存什麼,誰開的新處方,誰沒有,誰有嚴重的副作用。我們需要更深入的探究,至少不能到死後屍檢的程度,這可以防止成千上萬的人免於人為醫療事故的傷害。


 最終我們需要在醫學理解的基礎上更好的開展建模,只有這樣,終有一天,你的醫生可以在你的數字分身上做實驗,而後才是你。現代醫學需要更多的可操作的預測。


Daniel Rockmore,達特茅斯學院 Neukom 計算科學學院主任、數學教授、計算科學 William H. Neukom 1964 終身傑出教授


科學術語:電車問題(The Trolley Problem)


科學的歷史是由各種各樣的「思想實驗」堆成的。「思想實驗」這個詞是愛因斯坦想出來的,它的意思是針對一個虛構的場景,在這個場景中能夠精精準的表達一些難於思考的問題癥結,以這種方式能夠激發一些就此問題的深度思考最終得到解決方法或者相關發現。這些「思想實驗」中最著名的是愛因斯坦的「追光傳說」,最終促使他發現了狹義相對論。還有薛定諤的貓,它被困在一個刻意嚴格設計的量子機械盒裡,永遠半生半死,這更加明晰地揭示了波動理論機理與測量間的複雜互動關係。


「電車問題」是另一個思想實驗,它源自於道德哲學。它有許多的流傳版本,這就是其中一個:一個有軌電車沿著鐵軌行駛,遇到了一個鐵軌分叉點,其左方向上,有一個人被困在鐵軌上,右方向上則是五個人。你可以改變分叉點以使電車從朝向五個人的方向變為一個人的方向。你會怎麼做?這個電車無法剎車。如果鐵軌上的人中有我們的熟人我們會怎麼辦呢?也許如果其中一個是兒童而另外五個是成年人呢?又或者是其中一個有孩子而其他五個是單身呢?所有這些不同的場景如何來決定事情的發展變化呢?什麼是至關重要的?你更珍視什麼以及為什麼?


這是一個有趣的思想實驗,但在很多時候遠不是這樣僅僅有趣而已。鑑於我們正逐漸將我們的決定賦予管理這些事情的機器和軟體,開發人員和工程師將要做越來越多這樣需要解析那些重要並很有可能潛在關乎生死的決策機制的事情,並把這些事情直接編碼給機器。決策機制來源於一種價值評估系統,一種「效用方程」,在這種系統中我們決定做這件或那件事原因在於這樣做比其他選擇能獲得更大的價值。有時這種價值評估看上去很平常且顯而易見——推薦給你這個食物攪拌器而不是那個是因為你有更大的機率買這個,這是基於各種各樣歷史上的購買資料得出的結論。這雙鞋比其他的更好賣(或者不算更好賣但起碼因為它某些方面利潤更高所以值得一試——這使得我們願意計算機率和期望的回報)。這首歌對比那首歌等等。


 但有時在緊要關頭它會更重要:是這條新聞還是那條?更廣泛意義上來說,是這件事的這條資訊還是那條資訊?嵌入價值評估體系的程式可以開始評估你的價值了,並以此類推以至於整個社會的價值。有一些是價值相當大的決策賭注了。電車問題告訴我們價值評估體系滲透在程式設計的方方面面,甚至有時關乎生命:很快我們會有無人駕駛的電車、汽車、卡車。當糟糕的事情發生了,決定就需要做:事故車道上的騎車少年還是停在前面車裡的世界 500 強公司的 CEO 和他的助理?你的演算法會怎麼做以及為什麼這麼做?


我們終將製造出無人駕駛汽車而它們也一定會具備道德指南。我們的機器人伴侶也是一樣的情況。它們會有價值評估體系且必然是受道德約束的機器,而它的道德和倫理是由我們設計的。「電車問題」是我們時代的思想實驗,它是我們新人機時代工程高度複雜的光輝體現。


Bruno Giussani,TED 歐洲辦事處主任及全球活動策劃人


科學術語:指數(Exponential)


(有關指數的這一小故事)已經不清楚當時用來計數的是米粒還是麥粒了,由於故事有很多版本,我們對故事的起源也不太確定。但故事的內容大致是這樣:國際象棋的發明者向國王展示了有趣的象棋遊戲,國王甚是開心,便要求象棋發明者自己點名要獎賞。象棋發明者謙虛地要了些米粒(或者是麥粒),具體數量透過最簡單的公式計算得出,即第一個格子 1 粒,第二個格子 2 粒,第三個格子 4 粒,依次往下格子中谷粒的數量翻倍,直至第 64 個也就是最後一個。國王欣然同意,直到發現自己已經受騙。到棋盤一半時,國王的城堡就幾乎不夠存放穀物了,但剩下棋盤中的第一個格子就會將穀粒數量再翻一倍。


從 13 世紀的穆斯林學者到物理學家/作家卡爾·薩根(Carl Sagan),再到社會傳媒界的電視錄影製作人無不引用該故事來闡釋指數序列的威力,事務起於微小,非常微小,但之後一旦開始增長,就增長地越來越快—按歐內斯特·海明威(Ernest Hemingway)的說法:成長緩慢,然後突然暴漲(they grow slowly, then suddenly)。


每個人都應該更深刻地知道並理解指數及其衍生(棋盤寓言是一個非常實用的比喻),因為我們生活在一個指數世界。實際上,這種情形已經存在一段時間了。但是,目前為止我們處在棋盤的上半部分,也就意味著由於我們即將進入棋盤的下半部分,事物將急劇加速發展。


1999 年雷·庫茲韋爾(Ray Kurzweil)在他的著作《靈魂機器的時代》(The Age of Spiritual Machine)中提出了「後半個棋盤」的概念。他指出,儘管指數在前半個棋盤時重要,但正是在進入後半個後其影響變得巨大,事情變得瘋狂,其加速度開始遠超人類的想象和控制。


15 年後,Andrew McAfee 和 Erik Brynjolfsson 在《第二次機器時代》中透過對比摩爾定律來討論庫茲韋爾的觀點。戈登·摩爾(Gordon Moore)是仙童公司(Fairchild)和英特爾公司(Intel)的聯合創始人,這兩個公司是矽谷很有開拓性的公司。回顧矽電晶體剛發展的前幾年,在 1965 年摩爾做出了一個預測,在給定的成本下,大約每 18 至 24 個月,計算能力會翻一番。換句話說,也就是呈指數級增長。摩爾的預測已經維持了數十年,對科技與商業帶來了巨大的影響,儘管近些年節奏有一點點放緩——需要指出的是摩爾定律是一個產業規律的洞察定律,而非物理定律,而且,我們很可能從電晶體時代邁進量子計算的時代,而後者依賴粒子來進行計算。


McAfee 和 Brynjolfsson 認為,如果我們把摩爾定律的起始點定為 1958 年,即第一個矽電晶體商業化的時間,那麼依指數曲線,從數字技術的角度看,我們進入棋盤第二部分的時間是 2006 年(這種觀點是考慮到,人類基因組第一次繪製完成是在 2003 年,當前智慧手機作業系統啟動是在 2007 年,同一年 IBM 的 Deep Blue 在象棋比賽中打敗了 Garry Kasparov,同時耶魯大學的科學家開發出第一個固態量子處理器是在 2009 年。)


因此,我們會發現我們自己正處於棋盤第二部分的第一個,可也能是第二個格子中。這有利於幫助我們理解我們所見的在科技領域發生的引人注目的高速進步,這些進步表現在從智慧手機、語言翻譯、區塊鏈到大分析、自動駕駛和人工智慧的領域,從機器人學到感測器,從太陽能電池到生物技術,再到基因組學和神經學及更多其他領域中。


當這些領域中的每一個其自身都呈指數級增長時,它們的組合效應——每個對其他領域的加速性影響是巨大的。另外還要加上人工智慧系統自我改進能力的空間以及我們正在聊的近乎不可思議的改變速度。


還是以最初的棋盤寓言作為比喻,進入棋盤的第二半部分意味著:到目前,穀粒是以越來越快的速度累積著,但還在國王城堡能容納的限度內。但之後格子的穀粒就會淹沒這座城市,然後淹沒這片土地,這個世界。之後仍然有 32 個格子還要走,所以這將不是一個短暫的轉變期,而將是一個長期、深度、史無前例的劇變。這種發展將帶領我們進入一個物質豐富,並以技術為驅動的新興時代,我們的權利和/或希望與墜入無法控制的黑洞等其他憂慮一樣多。


當然,我們仍然生活在一個對其大部分都不甚瞭解的世界,這部分也不適用於指數規律。基本上社會執行的每一結構和方法——政府機關、民主、教育和醫療系統、法律和規範性框架、出版業、公司、安全防範設施,甚至科學管理本身都被設計為在一個可預測的線性世界發揮作用,在此,猛然上升或下降被看作為危機。因此,我們幾乎每天都在見證的各種指數級變化所帶來的從政治到社會再到心理學方面的憂慮及壓力也就不足為奇了。


在沒有深入思考,深思熟慮和細緻入微關注的情況下,我們該如何以指數式思維思考問題?在棋盤第二半的現實條件下,社會該如何執行?在指數型社會中,政府治理與民主的意味著什麼?我們又該如何重新審視從教育到法律框架再到倫理與道德理念的諸多事宜?

 

這些事情都開始於對指數和「後半個棋盤」的比喻更好的理解,以及將這種「後半程思考」的思維方式施加到幾乎所有事情上所帶來的結果。

相關文章