《演算法帝國》:被演算法和演算法交易改變的未來(上)

楊靜lillian發表於2014-06-27

enter image description here

當我們用嶄新的視角去觀察與思考,世界就會變成另外的模樣。這是我們籌備舉辦“改變未來的演算法與演算法交易”研討會的初衷。

美國雄霸全球依賴華爾街與矽谷等強大支柱,而近年來,演算法對華爾街的滲透與控制體現出顛覆未來產業生態的力量。圖靈公司出版的《演算法帝國》一書中介紹,2000年,華爾街通過計算機程式交易的比率不足美國股市交易量的10%;2008年上半年,自動化電子交易佔了全美股市交易量的60%;現在,華爾街70%以上的交易依靠所謂的黑盒子或者演算法交易(閃電交易)執行。銀行家和股票經紀人也聞風而動,不僅招聘聰明的交易員,還大量僱傭聰明的物理學家和數學家,將數學和科學融入金融交易,演算法交易在華爾街引發巨震。

2014年6月21日,以《演算法帝國》為延伸,財訊傳媒集團網路智酷與靜沙龍聯合圖靈公司共同邀請了中國計算機領域三位傑出專家——中科院計算所研究員、中國計算機學會副祕書長陳熙霖,英特爾中國研究院院長吳甘沙,上海證券交易所CTO白碩,從演算法和演算法交易的角度探究演算法如何改變未來並統治世界,以及演算法交易在中國引發的技術生態變革。中科院自動化所研究員、中國自動化學會副理事長兼祕書長王飛躍,北京郵電大學教授、中國密碼學會副理事長楊義先等諸多業界高手前來論道。

研討會由財訊傳媒集團總裁戴小京和圖靈公司總經理武衛東開場,財訊傳媒集團首席戰略官段永朝和我共同擔任主持。由於財訊傳媒集團在中國金融界包括“一行三會”的強大輿論影響力,以及中國計算機學會、中國自動化學會、中國密碼學會等“三會”權威齊聚會場,本次研討會吸引了金融投資界與IT界、媒體界精英的熱烈參與。在這裡,我要特別感謝財訊傳媒集團網路智酷的發起人段永朝老師和趙婷婷對會議籌備的支援,婷婷不僅會議流程操辦專業,還特地為研討會設計了羊皮古捲風格的封面圖,讓這場思想風暴更具經典意味。

enter image description here

❶【陳熙霖】改變未來的演算法

中科院計算所研究員、中國計算機學會副祕書長陳熙霖首先引領大家“用演算法來看世界”,他將抽象的演算法與日常生活緊密聯絡在一起,對隱匿在世界執行表象背後的9大演算法進行了生動剖析。陳熙霖的演講開宗明義地說:“演算法無處不在”,從這個獨特的維度出發,似乎世界無處不演算法。

他面對在座中國自動化學會和密碼學會的權威,謙虛且風趣地說: “一個翻譯胡言亂語,兩個翻譯吞吞吐吐,三個翻譯金口難開”,但他用深入淺出的例項與比喻,對搜尋引擎索引、PageRank、公鑰加密、糾錯編碼、圖形識別(模式識別)、資料壓縮、資料庫、數字簽名等演算法的本質與機理進行了精準到位的“翻譯”。

在陳熙霖看來,演算法無處不在,但演算法執行的效果往往受設計的目標、實現能力等的制約。例如對於一個多部電梯聯動的系統,如果排程的目標是“能量最優”,則不可避免地出現電梯響應遲緩、甚至久等不來的情況,相反如果排程的目標是響應時間最小化,那麼即使電梯的數量減少些,仍然能夠做出快速的響應。沒錯,我們身邊的電梯,就是被演算法操控的。

被演算法操控的不止是電梯,還有人類的精神生活。例如搜尋引擎,藉助與圖書後面的倒排索引沒有本質區別的類似演算法,但谷歌網站上為我們推薦圖書、電影和音樂的是演算法;Facebook網站上為我們推薦朋友的也是演算法:PageRank就是一種將繁雜的網頁資訊通過類似眾望所歸的引用機理為核心的,通過計算扇入和扇出進行網頁排序的演算法。

enter image description here

陳熙霖還用演算法來看人類歷史,例如“密碼”,他開玩笑說中國古代的“文字獄”就是一種對密碼學的誤用,是用臆想的密碼來誤讀他人的作品。已知最早的密碼就是斯巴達密碼,把條繞在樹棍上,寫上文字,然後展開。要想恢復的時候找同樣直徑的棍繞上就有了。還有凱撒密碼,就是置換密碼,而大家最熟悉的是福爾摩斯探案集裡的故事“跳舞的小人”使用的密碼,也是一種置換密碼。

演算法改變的還有現代經濟與產業。例如與“資料壓縮”演算法相關的數字視音訊產業,已成為電子資訊第一大產業,2013年產值達2萬億元。過去我國視聽終端產品由於缺乏核心技術,需支付的專利費每年多達40億元。這就是演算法的巨大經濟威力!

關於模式識別的問題,陳熙霖認為模式識別是讓機器、機器人有辨別是非能力的一大類演算法。這類演算法的目的是將識別物件從高維進行降維或升維以提高區分形,最終目的就是實現一維可分。其基本的實現路徑是通過一系列訓練集,讓機器從實踐當中學習。

聽完陳熙霖老師的講解,會忽然醒悟,演算法原來已經在我們所在的物理世界和人類的精神世界起到了重要的作用。電腦科學與技術,已經成為支撐社會發展的重要基礎設施,滲透到生活的方方面面。

enter image description here

❷【吳甘沙】演算法統治世界

如果說陳熙霖研究員的演講讓我們洞察到生活中無處不在的演算法控制,那麼英特爾中國研究院院長吳甘沙的分享,則直觀展現了演算法對當今世界的巨大影響,以及對未來的顛覆。他說:如果你把網際網路、把大資料分析看做執行在龐大機器上的演算法,而把每個人的一言一行、一舉一動作為資料,那麼我們已經開始去營養這麼一個機器了。我們提供的養料在幫助機器成長,從某種程度上這已經發生。

enter image description here

在闡釋演算法對世界的統治之前,他先用一頁PPT回溯了演算法在人類歷史當中產生的影響,公元前1600年古巴比倫人的一塊石板上,可能是目前已知的第一個演算法,是做因式分解。此後,歐幾里得、萊布尼茨、高斯、帕斯卡和費曼、尤拉、布林等重要的歷史人物對演算法的進化做出了重大貢獻。

吳甘沙還列舉了構建現代世界的基礎演算法:壓縮、糾錯碼、隨機數生成、公鑰體系、數字簽名、排序、傅立葉變換、卡爾曼濾波、最短路徑和隱馬爾可夫模型。其中RSA是最標準的公鑰和簽名演算法,這些與安全相關的演算法對於構築現代社會的信用體系、交易起到了基石作用,比特幣也是基於數字簽名的演算法。而地圖導航使用的是“最短路徑”這種演算法,卡爾曼濾波演算法則從宇宙飛船到車到手機都在大量使用。

檢索、推薦和預測是關乎人類生活的演算法。吳甘沙介紹,預測當中很經典的是貝葉斯理論,貝葉斯理論專門搞預測,最早做棒球預測,後來做美國選舉預測、奧斯卡預測。他演示了一張圖,是前幾年法航出事以後,根據貝葉斯理論預測進行搜尋的結果,圖中進行搜尋的部分,紅色部分概率最高,最終發現殘骸的部分就是紅色區域。

吳甘沙說,演算法在跟世界互動的過程當中,對世界的測量可能是準的也可能是不準的。谷歌曾預測流感趨勢,但2013年其預測值超過疾控中心資料的兩倍以上。《自然》雜誌就此尖銳批評道:觀測即干涉,觀察的過程當中對於被觀察物件造成影響。因為谷歌對流感的預測值偏高,還造成了2013年1月流感疫苗供應短缺。《科學》雜誌也評論谷歌對流感的預測是大資料的傲慢。有理論認為大資料只要相關性、不要因果性,有相關性就行了。但其實迷信就是相關性。觀測到某種天象、事件的序列跟某一個結果有關係,就是有相關性。

既然演算法已經影響了人類歷史、構建了現代世界,那麼更復雜的演算法就可能統治未來。在《演算法帝國》一書中,以華爾街為例,不斷複雜化的演算法和自動化機器,讓華爾街成為演算法比拼的戰場。Quants即“寬客”,這群數量金融工程師利用複雜數學模型和超級計算機,在稍縱即逝的市場機會中淘金,在1980年到2007年成為華爾街新貴,當時在華爾街工作的約有2000名數學或物理學家。

吳甘沙用“演算法統治華爾街”來概括華爾街交易日益自動化、程式化的發展歷程,並將金融危機歸結於“華爾街成也演算法、敗也演算法”。他認為,華爾街現在的統治者可以說是演算法,這個演算法叫Black Scholes,網友俗稱“黑壽司”,高盛公司的費希爾·布萊克、史丹佛大學的米隆·肖爾斯和哈佛大學的羅伯特·默頓共同指出瞭如何定價以及如何用似乎能夠保障利潤的方式對衝這些期權。這就是日後被寬客們奉為黃金標準的布萊克-肖爾斯模型。《演算法帝國》中提到的托馬斯.彼得菲提前發現了一個公式,這個公式是做期權、權證等等金融衍生品的定價。他的財富現在已經超過了安迪.克魯夫,他們都是匈牙利難民。

後金融危機時代,則由於“寬客奔向西岸”的人才遷徙,推動了華爾街與矽谷的權力更替。他說,寬客奔向西岸,可能是位元奔向原子的前奏,例如谷歌隱藏的發力點,無一例外都跟演算法控制的物理世界相關:如谷歌街景、谷歌地圖、谷歌地球。更重要的是谷歌X實驗室,谷歌的自動駕駛汽車、眼鏡、網路氣球、隱性眼鏡等四大專案將會把演算法的威力從虛擬世界帶回物理世界。

演算法要對整個世界實施控制,那就需要演算法加資料、加軟體、加系統。例如智慧城市的軟體系統,底下是作業系統,是城市作業系統,上面是資料交易市場,可以是開放的、或者像資料交易市場,再上面是城市應用商店,在不同層面,系統裡有演算法、有資料、有架構,這就形成了一個比較完整的複雜系統。

被“演算法”控制的物理世界,如無人機、智慧城市、物聯網等,還將催生“統治物理世界的系統”。該系統首先將是基於大量資料,也將體現演算法的學習、進化和創新能力,這種新的系統架構與腦(溼件)或生物、社會學隱喻相關。

如果說《三體》是一種宇宙社會學,那麼未來會否形成演算法社會學或複雜系統社會學?華爾街演算法就是一種社會學現象,未來世界可能是無數種系統競爭的社會,系統之間必然產生博弈,如果博弈採用像《三體》中“黑暗森林”的哲學,形成囚徒困境,結果將很悲觀。

演算法也有可能通過生物神經網路的分層認知與學習,腦功能替代,從序列到平行計算的架構改變等獲得智慧的進化。吳甘沙稱之為“計算智慧”:演算法生物學隱喻的集中體現。

enter image description here

吳甘沙認為,演算法應該具備學習、進化和自我創新、變革的能力。從基於資料的學習能力,到基於演算法的學習能力,而且演算法和演算法有希望進行融合,獲得進化可能性。例如IBM的Watson採用了若干種演算法,每種演算法佔的權重只有個位數,把這麼多演算法積分組合起來,形成最後的演算法,可以達到90%的回答正確率。

他總結道:未來機器腦有一定優勢和劣勢,首先機器具有無限擴充套件的並行性,加入更多資源就能夠擴充套件,而人腦每十萬年才增加一立方英寸,計算資源增加速度非常慢。還有容量和速度的問題,人的神經元一秒鐘只能發射幾十次,而計算機頻率非常高。此外,人的神經網路裡傳輸電訊號的速度是一秒走一百米,而機器接近光速。這些方面機器腦有一定優勢。但能耗是機器相對於生物的劣勢。所以現在大家也在探索很多新的方式,像DNA計算機、量子計算機,包括奈米電晶體,試圖去解決機器腦的能源問題。最後,他寄望於生物智慧與機器智慧的融合,對演算法統治的世界未來,持有樂觀其變的開放態度。

下篇

相關文章