「主演算法」即將改變我們的生活

PSI內容合夥人發表於2016-01-04

我們可以這樣說,大多數人都不會花太多時間去思考演算法。我們點開亞馬遜會發現根據我們的購買記錄所生成的推薦商品。我們可以看到Netflix根據我們的喜好精心挑選電影。但是我們並不需要考慮這意味著什麼或是這背後執行的機制。無論是Facebook的一個錯誤,華爾街的暴跌或是網上商店出售的由電腦生成的毫無品味的T恤,大概只有當演算法亂套的時候我們才會想起它。  

只有在這些時候我們才會想起,這個世界的執行是多麼地依賴演算法:它們是一些越來越複雜和難以理解的規則,統治著我們身邊的所有計算機。當演算法變壞時(參考天網),我們才意識到自己是多麼的脆弱;我們意識到,他們的錯誤不是人為的,當然了,因為演算法不是人。Pedro Domingos已經潛心研究演算法許久。他的新書《主演算法(The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World)》是對那個領域的介紹——同時也是對最先進的技術的報告。他相信我們生活在一個演算法的時代。並且,他認為我們也許能看到演算法徹底重塑我們的世界的那一天——甚至比今天已經做到的更多。review-the-master-algorithm-pedro-domingos-allen-lane我和他透過郵件討論了人類和計算機之間「思考」和學習的差別,演算法已經在多大程度上影響了我們的生活,以及當機器最終學會如何學習時將會發生什麼。您說我們生活在一個演算法時代。可是,為什麼我們卻感覺不到每天有如此多的演算法在為我們工作,或是給我們搗亂呢?機器學習是如何在幕後悄悄工作,而不被我們注意到呢?計算機所做的每一件事都使用到了演算法。你的手機、電腦、汽車、房子和家用電器都是基於演算法。但是它們卻是隱蔽的:你看見一個閃光的小裝置,但是卻不知道里面的執行機制。Siri用演算法來理解你說的話,Yelp用演算法來幫你選擇餐館,車子內的GPS系統用演算法來幫你選擇最佳路線,刷卡機用演算法來幫你支付。公司用演算法來選擇職位申請者,共同基金使用它們來交易股票,國家安全域性用它們來標記可疑電話。  

「常規」演算法和學習演算法的不同是前者必須由軟體工程師來人為程式設計,一步一步地解釋計算機需要做的事情。而後者則是由計算機自己透過觀察資料來決定它們需要怎麼做:這是輸入資料,那是想要的輸出,我該怎麼實現中間的轉化?引人注目的是,同樣的學習演算法能學習做無數不同的事情——從下國際象棋到醫學診斷——只需要給它們合適的資料即可。書名中的「主演算法(master algorithm)」是什麼?它與Ray Kurzweil的奇點有何不同?它有哪些潛在的優勢呢?主演算法是一種能夠從資料中學習任何東西的演算法。如果給它關於星球運動、斜面和鐘擺的資料,它能發現牛頓定律。如果給它關於DNA的晶體影像資料,它能發現雙螺旋結構。從你手機裡所有的資料,它能學習預知你接下來會做什麼並想辦法幫助你。也許從大量的癌症病人的病歷資料中它甚至能找到一個治療癌症的辦法。  

它能帶來的其他好處還有:家庭機器人、一個能回答你問題的萬維腦(World Wide Web)而不僅是一個只能呈現網頁的全球資訊網;一個瞭解你和你最好的朋友的360度推薦系統,不僅僅推薦書籍和電影,還有約會、工作、住房和假期——你生活中的任何事情。  

Kurzweil的奇點是人工智慧超越地球人的一個點,因此變得無法理解。或者更確切的說是奇點的「視界」,就像任何光都無法逃脫的黑洞視界一樣。如果沒有主演算法,我們就無法很快到達奇點。如果有了主演算法,人工智慧的發展必然會加速,但我認為我們依然能夠理解這個世界,因為人工智慧將會設計來為人類服務。我們也許不會理解它們是如何生產出它們給予我們的東西,但是我們能夠理解這些產品能為我們做些什麼,否則我們也不會想要它們。除此之外,這個世界總有一些部分已經超出我們的理解範疇。不同的是,現在它的一部分是由我們設計的,這無疑是一個改善。您在形容這個領域時,將其劃分為多個「部落」,每一個都有一個不同的機器學習方法,它們在某些特定問題上的表現比其他方法更好,但是沒有一個部落擁有可以包羅永珍的演算法——也就是一個可以回答所有可回答問題的機器學習程式。您將主演算法與粒子物理學標準模型或分子生物學中心法則相比較:「它是一個統一的理論,能理解我們迄今為止所知的一切,併為今後幾十年甚至幾十年的發展奠定了基礎。」這聽起來口氣很大。為什麼主演算法看起來可行?又是什麼在阻止著分離的部落們來創造它呢?就算是一些最簡單的學習演算法也有數學上的證據,證明它們能從足夠多的資料中學習。因此從這個層面上說,主演算法無疑是存在的。實際上,每個部落中都有一些研究者們相信他們已經找到它了。但問題是演算法要能夠利用實際的資料和計算來學習你想要它做的事情。這裡讓我們轉向經驗證據:自然為我們提供了至少兩個能學習(幾乎)任何事物的演算法例子,即進化和大腦。因此我們知道主演算法是存在的。問題在於我們是否能夠準確完整地把它弄清楚並寫下來,就像物理學家將物理定律用公式寫出來一樣(公式本身也是一種演算法)。  

不幸的是,五個機器學習的部落像盲人摸象一般:一個摸到了象鼻認為是一條蛇,一個倚靠著象腿認為是一棵樹,另一個摸到了象牙以為是一頭牛。我們真正需要做的是退後一步來看整體,看看各個部分是如何契合在一起的。諷刺的是,這對那些不會沿著5個部落鋪好的道路去思考的外行反而會更容易一些。開啟您的書,有一句來自Alfred North Whitehead的引文:「文明的進步是靠增加那些不需思考就能完成的重要操作來實現的。」無論我們贊不贊同這個籠統的觀點,它似乎喚醒了一些與「思考」的概念有關的重要事情,並且關係到文明與人性。我們傾向於認為「思考」是人類獨有的活動,甚至是決定性的一個活動。一些人(如Nicholas Carr)告誡人們不要將我們的思考外包,他認為這會減少人性——擔憂缺少思考會讓我們變得更像廣義上的機器人。與此同時,我們也很擔心「思考」機器:你提到Skynet等毀滅性的人工智慧依然只是人類虛構的產物。我們是否應該認為計算機已經具備了「思考」的能力?還是說,思考只是人類所特有的活動?——如果是這樣,人類思考者與未來的機器學習者之間的分界線該如何劃分呢?著名電腦科學家Edsger Dijkstra說計算機是否能思考的問題和潛艇是否能游泳同樣重要。先把定義放到一邊,重要的是計算機能解決人類透過思考所解決的問題——並且這些問題的範圍還在擴大。藉助機器學習,計算機甚至能解決我們不知道如何透過程式設計來解決的問題——它們自己會找出解決方法。所以劃分的界線非常模糊,並且一直在移動之中。  

我不同意Nicholas Carr關於「外包部分思考會消滅我們」的觀點——恰恰相反,這反而會使我們受益,它讓我們集中精力在更好的事情上。我想,這是Whitehead的觀點。蘇格拉底不喜歡書寫,因為這會讓人們忘記事情。於他而言,幸運的是柏拉圖替他記下了他的想法,正因如此人類到今天都還記得他。書寫加強我們的記憶,Google更是如此。它絕不會讓我們變得愚蠢,相反,它會讓我們更加聰明。書的結尾您寫到:「人們擔心計算機會變得太聰明,將來會統治世界,可是實際問題是,它們太愚蠢卻已經統治了世界。」您能對這一點再補充解釋一些嗎?像Stephen Hawking和Elon Musk這樣的傑出人士已經拉起人工智慧的警報,聲稱它是會威脅到人類的生存。 但是邪惡AI統治世界的「天網情境」有點過於牽強了。我認識的AI專家大都不把這當回事。它的問題是在於,人們混淆了智慧與人的概念。在好萊塢的電影中,人工智慧和機器人總是偽裝成人類,但是現實中它們是完全不同的。計算機沒有自己的意志、情感或意識。它們只是我們的延伸。只要它們做的工作是我們設定的,我們設定了邊界並檢查方案,計算機就能夠永遠智慧而無害。 這並不意味著我們可以高枕無憂。和其他所有技術一樣,人類可能會用AI來實現一些不好的目的。但更多的情況可能是,AI會給予我們嘴上要求而非內心真正想要的東西,從而造成傷害:這是一個魔法師學徒問題。在今天的世界,計算機已經能進行所有重要的決策——誰得到工作,誰得到信用卡,誰被標為潛在恐怖分子。它們也經常犯錯誤,因為它們沒有最基本的常識。解決的辦法是讓它們變得更聰明,而不是更愚蠢。所以我們應該擔心的不是人工智慧太多,而是太少。在機器學習的過程中,我們應該注意的最重要的事情是哪些?我們每個人應該控制我們身邊的機器學習演算法。否則它們將為建立它們的組織服務,而不是我們。就像開車一樣:你需要知道哪個是方向盤和哪個是踏板,怎麼去操作它們。如果一個計程車司機跟你說:「我覺得我知道你想去哪裡。」你大概會匆忙逃出來。但這就是現在學習演算法正在做的事。它們有控制旋鈕,但是被隱藏起來了。  

你應該能,比如說,告訴亞馬遜的推薦系統你想要它為你做些什麼,要它去修正它的選擇,解釋它哪些方面做錯了等等。機器學習變得越廣泛,它就越重要。我不想委屈您來做一個可證偽的預測,但是:為了創造主演算法,我們需要做哪些改進呢?許多人認為我們已經擁有創造主演算法所需的主要思想了;剩下的事情只是如何去綜合它們。在這個方向我們也確實取得了很大的進步;事實上我們離成功已經不遠了。但是我感覺我們仍然缺失了一些重要思想,需要有人來研究。我手上已經在操作一些候選者,但我畢竟只是一個人。所以我寫這本書的目標之一是開拓所有人的眼界。我的秘密願望就是,某處的一個孩子——未來AI領域的牛頓——能夠讀到這本書,開始思考與機器學習有感的事情,併產生眾望所歸的靈感。  

來自kernelmag,作者Jesse Hicks,機器之心編譯出品。參與:鍾靚,汪汪。

相關文章