演算法:人工智慧的新曙光

演算法與數學之美發表於2019-01-11

--從核彈到早產嬰兒,人工智慧技術已經最終成為足夠可靠的監視一切的手段。

640?wx_fmt=jpeg

在一個有血有肉的醫生和一個人工智慧系統之間,兩者選擇其一來作出疾病診斷,佩德羅·多明戈斯更樂意把自己的生命押注到人工智慧系統上。佩德羅·多明戈斯是西雅圖華盛頓大學的一名電腦科學家,“我寧願相信機器也不要相信醫生,”他說。考慮到人工智慧(AI)通常獲得的差勁口碑——過度炒作,乏善可陳——如此強烈的支援聲音確實鮮見。


回到二十世紀六十年代,AI系統在複製人腦的某些關鍵方面似乎大有前途。通過使用數理邏輯,科學家開始重現和推理現實世界的知識,但是,很快這種方法淪為AI的枷鎖。儘管數理邏輯在模擬人腦(解決問題)方面富有成效,但是它在本質上並不適合處理不確定性。


然而經過因自我枷鎖造成的漫長封殺之後,AI這個廣受詬病的領域卻重新興盛起來。多明戈斯並非唯一對其抱有全新信心的科學家。研究者希望通過成熟的電腦系統來檢測嬰兒疾病,把口頭語言翻譯成文字,甚至是找出惡意核爆。這些由成熟的電腦系統展現出來的早期能力就是最初在AI界引起人們廣泛興趣的東西:即使在紛繁複雜的世界,電腦仍具有像人類一樣的推理能力。

處於AI復興核心的是一種叫概率性程式的技術,它在舊有AI的邏輯基礎上加入統計概率的應用。“它是兩種最強大的理論的自然統一,這兩種理論已經被髮展來理解和推導這個世界。”史都華·羅素說,他是加州大學伯克利校區現代人工智慧方面的先驅。這套強大的綜合體終於開始驅散籠罩在AI漫長嚴冬上的迷霧。“這肯定會是一個(AI的)春天。”麻省理工學院的認知科學家約什·田納邦說。


“人工智慧(artificial intelligence)”一詞於1956年由MIT的約翰·麥卡錫創造。那時,他提倡使用邏輯語言開發能進行推理的電腦系統。該方法隨著所謂的一階邏輯的應用趨於成熟。在一階邏輯中,現實世界的知識通過使用正式的數學運算子號和標記進行模化。它為客觀體世界和客觀體間相互關係而設,能夠用來解析他們之間的聯絡並得出有用的結論。例如,如果X(某人)患有高傳染性的疾病Y,患者X與某人Z近距離接觸,那麼用這種邏輯便可推導Z患有Y疾病。


然而,一階邏輯最大的功勞是它允許越來越複雜的模型由最小的結構模組構建起來。例如,上述情況可以輕易地延伸到建立流行病學的致死傳染病模型,以及對其發展進行結論性推導。這種把微小概念不斷擴充套件成概念集合的邏輯功能意味著人類大腦中也存在類似的思維模式。


這個好訊息並沒有存在得太久。“不幸的是,最終,邏輯沒能實現我們的期待。”加州史丹佛大學的認知科學家諾阿·古德曼說。由於使用邏輯來表現知識並進行推理的過程要求我們對現實世界的實際知識有精確的掌握,容不得半點模糊。要麼“真”要麼“假”,不存在“也許”。而不幸的是,現實世界,幾乎每一條規則都充滿了不確定性、干擾和例外情況。簡單地用一階邏輯構建的AI系統不能處理這些問題。舉例來說,你想分辨某人Z是否有疾病Y,這裡的規則是清晰明白的:如果Z與X接觸,那麼Z患病。但是一階邏輯不能處理Z在或者已經感染或者沒有之下的情況。另一個嚴重的問題是,一階邏輯不能逆向推導。例如,如果你知道Z患有疾病Y,你不可能完全確定Z的疾病是從X那裡感染的。這是有醫學診斷系統面臨的典型問題。邏輯規則能夠將疾病和症狀聯絡起來,而一個醫生面對症狀卻能逆推出其病因。 “這需要轉變邏輯公式,而且演繹邏輯並不適合處理這種問題,”田納邦說。


這些問題意味著到了二十世紀八十年代中葉,AI的冬天到來了。當時流行的看法是:AI毫無發展可言。然而,古德曼私下相信,人們不會放棄AI,“AI轉入地下發展了,”他說。


1980年代末神經網路的到來讓AI的解凍露出第一線曙光。神經網路的想法之簡單讓人驚歎。神經系統科學的發展帶來了神經元的簡單模型,加上演算法的改進,研究者構建了人工神經網路(ANNs)。表面上,它能夠像真正的大腦一樣學習。受到鼓舞的電腦科學家開始夢想有上百萬或者上萬億神經元的ANNs。可是很快地,事實證明我們的神經元模型顯然過於簡單,研究者都分不清神經元的哪些方面的性質是重要的,更不用說模仿它們了。


不過,神經網路為新的AI領域構築了一部分基礎。一些繼續在ANNs上奮鬥的研究者終於意識到這些網路可以被認為是在統計和概率方面對外部世界的重現。與“突觸”和“動作電位”這些生理學上的稱呼不同,他們稱之為“引數化”和“隨機變數”。田納邦說,“現在,ANNs聽起來更像一個龐大的概率模型而不是一顆大腦。”


然後在1988年,加州大學洛杉磯校區的朱迪亞·珀兒寫了一本里程碑式的書《智慧系統的或然性推理》,裡面詳細地描述了AI的全新方案。支援這本書的理論是湯瑪斯·貝葉斯提出的一個原理。湯瑪斯·貝葉斯 是18世紀的一名英國數學家和牧師,他把以事件Q發生為前提下事件P發生的條件概率和以事件P發生為前提下事件Q發生的條件概率聯絡起來。這個原理提供了一個在原因和結果間來回推導的方法。“如果你能對感興趣的不同事物用那樣的方式描述,那麼貝葉斯推論的數學方法會教你如何通過觀察結果,然後逆推各種不同起因的可能性,”田納邦如是說。


新方案的關鍵就是貝葉斯網路,一個由各種隨機變數組成的模型,在這個模型裡每個變數的概率分佈都取決於其他變數。給定一個或多個變數的值,通過貝葉斯網路則可推匯出其他變數的概率分佈,換言之,得出他們的可能值 。假定這些變數表示症狀、疾病和檢查結果,給出檢查結果(一種濾過性病毒感染)和症狀(發熱和咳嗽),則可給可能潛在的病因賦予不同的機率(流感,很可能;肺炎,不太可能)。


二十世紀九十年代中期,包括羅素在內的研究員開始開發演算法,使貝葉斯網路能利用和學習現有的資料。這很大程度上跟人類基於早期理解的學習方式相同,新的演算法卻能通過更少的資料來學習更復雜和更準確的模型。對ANNs來說,這是前進的一大步,因為無需考慮先驗知識,可以從頭學習解決新的問題。


搜獵核武器

人們開始逐漸理解各種努力和嘗試,去創造為現實世界而設的人工智慧。一個貝葉斯網路中,各種引數是概率的分佈,如果我們對這個世界知道得越多,這些分佈值越有用。與一階邏輯下構建的網路不同,不完整的知識並不會導致貝葉斯網路迅速崩潰。


儘管這樣,邏輯也並非無用武之地。事實證明貝葉斯網路本身並不充分,因為它不允許以簡單片段任意構建複雜結構,取而代之的是一個由綜合的邏輯程式和貝葉斯網路組成的,進入熱門話題領域的概率性程式。


這種新AI的最前端是少數合併基礎元素和所有靜止研究工具的計算機語言,其中有Church語言,由古德曼、田納邦和同事開發,以某計算機程式邏輯的開創者阿隆索·丘奇命名。多明戈斯的團隊開發了馬爾科夫邏輯網路,融合了邏輯型網路和與貝葉斯網路相似的馬爾科夫網路。羅素則和他的同事使用了一個直接明瞭的名字,叫“貝葉斯邏輯”(BLOG).


最近在奧地利維也納召開的聯合國全面禁止核試條約組織(CTBTO)大會上,羅素展示了Church語言的表達能力。CTBTO邀請了羅素,因為他們預感到新的AI技術可能有助於監測核爆炸。聽過一上午的關於監測地震背景下遠距離核爆引發的地震特徵、穿過地球的訊號傳播異常和世界地震站的噪音探測器的演示報告後,羅素開始著手用概率程式的設計(神經資訊處理系統前沿,卷23,麻省理工學院出版Advances in Neural Information Processing Systems, vol 23, MIT Press)。他說,“在午飯時間,我已能為整個問題編寫一個完整的模型。”,這個模型足足有半頁之長。


這類模型能整合先驗知識,例如,對印度尼西亞蘇門塔臘和英國伯明翰地區發生地震的機率做比較。CTBTO同時要求任何一個系統首先假定發生在地球上任何地方的核爆機率均等,然後才使用來自CTBTO監測站接收的真實訊號資料。AI系統要做的就是獲取所有資料,對每組資料最可能的解釋作出推斷。


挑戰就在其中。像BLOG這樣的語言是由所謂的通用推理機組成的。已知某個現實問題的模型和眾多變數及概率分佈,推理機只能計算某種情況的可能性,例如,在已知期望事件的事前機率和新地震資料下,推斷一次在中東發生的核爆。但是如果變數改成代表症狀和疾病,那麼它就必定能做出醫學診斷。換言之,其中的演算法必須是非常普遍的,這也意味著這些演算法極其低效。


結果是,這些演算法不得不根據每個新問題逐一定製。但正如羅素所說,你不能每遇到一個新問題就請一個博士學生來改進演算法,“那並不是你大腦的工作方式,你的大腦會趕緊適應(新問題)。”


這一點讓羅素、田納邦和其他人緩下來仔細考慮AI的前途。“我希望人們會感到興奮,但不是那種我們向他們推銷蛇油(萬靈藥)的感覺,”羅素說。田納邦也有同感,儘管已是一個年過40的科學家,他覺得只有一半的機會在他有生之年見證有效推理這一難題的解決。儘管計算機將執行得更快,演算法會改進得更精妙,他覺得“這些是比登月或者登火星更艱深的問題”。


無論如何,AI團體的意志並沒有因此消沉。例如,史丹佛大學的達菲·柯勒正在用概率程式設計解決非常特殊的問題並且頗見成效。他與同在史丹佛的新生兒學專家安娜·潘和其他同事一起開發了名為PhysiScore的系統,可以預測一個早產兒是否有任何健康問題。這是個眾所周知的難題,醫生不能作出任何確定程度的預測,“這種預測卻是對那個家庭唯一要緊事,”潘迴應。


PhysiScore系統把多方面的因素考慮進去,諸如孕齡、出生體重,以及出生後數小時內的實時資料,包括心率、呼吸率和氧飽和度(Science TranslationMedicine,DOI:10.1126/scitranslmed.3001304)。“我們能夠在頭3個小時內得出哪些嬰兒將來會健康,哪些可能患上嚴重的併發症,甚至是兩週後會出現的併發症,”柯勒解釋道。


“新生兒專家對PhysiScore這個系統感到興奮,”潘說。作為一名醫生,對於AI系統具有處理上百個變數並作出決定的能力,潘尤其滿意。這種能力甚至讓該系統超越了他們的人類同行。潘說:“這些工具能理解和運用一些我們醫生和護士看不到的訊號。”


這正是多明戈斯一直對自動化醫學診斷抱有信心的原因。其中一個著名例子是“快速醫學參考,決策理論(QMR-DT)”,它是一個擁有600種重要疾病和4000種相關症狀模型的貝葉斯網路,其目標是根據一些症狀推斷可能疾病的機率。研究者已經針對特殊疾病的推理演算法對QMR-DT進行微調,並且教會該系統使用病人的檔案。“人們對這些系統和真人醫生做過比較,這些系統似乎更勝一籌,”多明戈斯說,“人類對自己的判斷,包括診斷,不能保持一致的觀點(態度),而醫生們不願意放棄他們工作中這一有意思的部分是唯一讓這些系統不能廣泛應用的原因。”


AI領域裡的這些技術還有其他成就,其中一個矚目的例子是語音識別,它已經由過去因經常出錯備受嘲笑提升到今天令人驚訝的準確度(New Scientist, 27 April 2006, p26)。現在,醫生可以口述病人檔案,語音系統軟體會把口述檔案轉換成電子文件,由此可以減少手寫處方。另外,語言翻譯也開始仿效語音識別系統的成功之處。


會學習的機器

但是仍然有重大的挑戰顯現在各個領域中。其中之一就是弄明白機器人的照相機看到什麼,解決這個問題將為設計出自我導航的機器人縮短一大段距離。


開發靈活和快速的推理演算法的同時,研究者必須提高AI系統的學習能力,無論是根據現存資料還是現實世界檢測到的新資料。今天,大部分的機器學習是由定製演算法和小心地構建的資料組完成的,為教會一個系統處理特定的任務而專門設計。“我們希望那些系統更加通用,這樣你可以把它們投入到現實世界,同時它們也能從各種輸入資訊中學習。”柯勒說。


一如既往,AI的終極目標是建造出能用我們完全理解的方式複製人類智慧的機器。“那可能是和尋找外星生命一樣遙遠甚至同樣危險的事,”田納邦說。“‘擬人AI’是一個更廣義的詞,有謙虛的餘地。如果我們能構造一個視覺系統,像人類能做到的一樣,看一眼就可告訴我們那裡有什麼,我們將無比高興。”


安尼爾·安娜索斯娃米是一位《新科學家》的顧問

譯者:DLM (Miller),Mr. YXD 也有貢獻於此譯文

翻譯組合介紹:DLM, 80後業餘科學小野人,流連 New Scientist, National Geography,Economist,接收雜七雜八的資訊。失業期間偶遇松鼠會小紅豬,便想停下來學著剝一下“果殼”。Mr. YX D,來自火星的地球科學怪人。




微信公眾號“演算法數學之美”,由演算法與數學之美團隊打造的另一個公眾號,歡迎大家掃碼關注!

640?wx_fmt=jpeg


更多精彩:

如何向5歲小孩解釋什麼是支援向量機(SVM)?

自然底數e的意義是什麼?

費馬大定理,集驚險與武俠於一體

簡單的解釋,讓你秒懂“最優化” 問題

一分鐘看懂一維空間到十維空間

☞ 本科、碩士和博士到底有什麼區別?

小波變換通俗解釋

微積分必背公式

影響計算機演算法世界的十位大師

資料探勘之七種常用的方法

演算法數學之美微信公眾號歡迎賜稿

稿件涉及數學、物理、演算法、計算機、程式設計等相關領域,經採用我們將奉上稿酬。

投稿郵箱:math_alg@163.com

相關文章