美國“四院院士”為你實力科普深度學習!
作者:特倫斯 · 謝諾夫斯基,世界十大 AI 科學家之一,美國四大國家學院(國家科學院、國家醫學院、國家工程院、國家藝術與科學學院)在世僅 3 位的“四院院士”之一,AI 會議 NIPS 基金會主席。
不久之前,人們還常說,計算機視覺的辨別能力尚不如一歲大的孩子。
如今看來,這句話要改寫了。
計算機不僅能和大多數成年人一樣識別圖片中的物體,在馬路上駕駛汽車的安全性還高過 16 歲的青少年。
更神奇的是,如今的計算機不再是被動按照指令識別和駕駛,而是像自然界的生命由數百萬年前開始進化那樣,自主地從經驗中學習。
是資料的井噴促成了這一技術進步。如果說資料是新時代的石油,那麼學習演算法就是從中提取資訊的煉油廠;資訊積累成知識;知識深化成理解;理解演變為智慧。
深度學習是機器學習的一個分支,它根植於數學、電腦科學和神經科學。深度網路從資料中學習,就像嬰兒瞭解周圍世界那樣,從睜開眼睛開始,慢慢獲得駕馭新環境所需的技能。
深度學習的起源可以追溯到 20 世紀 50 年代人工智慧的誕生。關於如何構建人工智慧,當時存在兩種不同的觀點:
一種觀點主張基於邏輯和計算機程式,曾主宰人工智慧的研究和應用數十年;
另一種觀點則主張直接從資料中學習,經歷了更長時間的摸索才逐漸成熟。
如今,計算機能力日趨強大,資料資源也變得龐大且豐富,使用學習演算法解決問題比以前更快、更準確,也更高效。
此外,同樣的學習演算法還能用來解決許多不同的難題,這遠比為每個問題編寫不同的程式更加節省人力。
汽車新生態:無人駕駛將全面走入人們生活
在 2005 年美國國防部高階研究計劃局(以下簡稱 DARPA)舉辦的自動駕駛挑戰賽中,一輛由史丹佛大學塞巴斯蒂安 · 特隆(Sebastian Thrun)實驗室開發的自動駕駛汽車 Stanley 最終贏得了 200 萬美元現金大獎。團隊利用了機器學習技術教它如何自主地在加利福尼亞州的沙漠中穿行。
132 英里的賽道中有若干狹窄的隧道和急轉彎,還包括啤酒瓶道(Beer Bottle Pass),這是一段蜿蜒曲折的山路,兩側分別是碎石遍佈的陡坡和斷壁。
特隆並沒有遵循傳統的 AI 方法,即透過編寫計算機程式來應付各種偶發事件,而是在沙漠中駕駛 Stanley,讓汽車根據視覺和距離感測器的感應輸入,學習如何像人一樣駕駛。
上圖為啤酒瓶道,圖中遠處的一輛卡車正要爬坡。圖片來源:DARPA。
特隆後來參與創立了高科技專案重點實驗室 Google X,並開始了進一步研究自動駕駛汽車技術的計劃。
谷歌的自動駕駛汽車自此開始,在舊金山灣區累積了 350 萬英里的車程。優步(Uber)已經在匹茲堡投放了一批自動駕駛汽車。
蘋果也步入自動駕駛領域,以擴大其作業系統控制的產品範圍,並希望能夠再現它在手機市場上的輝煌。
2017 年,英特爾以 153 億美元的價格收購了 Mobileye,它是一家專門為自動駕駛汽車研發感測器和計算機視覺的公司。在價值數萬億美元的交通運輸領域,參與的各方都下了極高的賭注。
雖然目前自動駕駛汽車仍面臨很多監管和法律層面的障礙,但這一技術一旦開始普及,我們就將迎來一個嶄新的世界。
兩個聖盃:自然語言翻譯與語音識別
深度學習快速改變格局的一個例子是它對語言翻譯的影響。語言翻譯是人工智慧的一隻聖盃,因為它依賴於理解句子的能力。
谷歌最近推出了基於深度學習的最新版谷歌翻譯(Google Translate),代表了自然語言翻譯質量的重大飛躍。幾乎一夜之間,語言翻譯就從零散雜亂的拼湊短語,升級到了語意完整的句子。
人工智慧的另一隻聖盃是語音識別。不久之前,計算機的獨立語音識別應用領域還很有限,如機票預訂。而如今,限制已不復存在。
2012 年,一名來自多倫多大學的實習生在微軟研究院(Microsoft Research)的一個夏季研究專案中,讓微軟的語音識別系統效能得到了顯著的提升。
2016 年,微軟的一個團隊宣佈,他們開發的一個擁有 120 層的深度學習網路已經在多人語音識別基準測試中達到了與人類相當的水平。
圖為微軟首席研究官裡克 · 拉希德(Rick Rashid)在 2012 年 10 月 25 日於中國天津舉行的一場活動中,使用深度學習進行了自動語音識別的現場演示。
AI 醫療:醫學診斷將更加準確
深入皮膚
隨著機器學習的成熟並被應用於可獲取大資料的許多其他問題,服務行業和其相關職業也將發生轉變。基於數百萬患者病情記錄的醫學診斷將變得更加準確。
最近的一項研究將深度學習運用到了囊括超過 2000 種不同疾病的 13 萬張皮膚病學影像中,這個醫學資料庫是以前的 10 倍大。
該研究的網路被訓練用於診斷“測試集”(testset,它從未見過的新影像集)中的各種疾病。它在新影像上的診斷表現與 21 位皮膚科專家的結論基本一致,甚至在某些情況下還要更準確。
深入癌症
如果專家在轉移性乳腺癌的淋巴結活檢切片影像上判斷錯誤,就有可能導致致命的後果。這是一種深度學習擅長的模式識別問題。
實際上,一個經過大量結論清晰的切片資料訓練出來的深度學習網路能達到 0.925 的準確度,還不錯,但還不及人類專家在同一測試集上達到的 0.966。
然而,把深度學習與人類專家的預測結合起來,準確度達到了 0.995,幾近完美。
金融科技:利用資料和演算法獲取最佳回報
紐約證券交易所超過 75% 的交易都是自動完成的,高頻交易能在幾分之一秒內進出倉位。如果你不用為每筆交易支付費用,那麼即使是很小的優勢也能帶來鉅額利潤。
更長時間範圍內的演算法交易會考慮到基於大資料的長期趨勢。深度學習在賺錢和提高利潤方面做得越來越好。
預測金融市場,問題在於資料嘈雜,條件不穩定—— 一場選舉或國際衝突可能會導致投資者心態在一夜之間發生變化。這意味著用來預測今天股票價值的演算法可能到明天就不準了。
圖為延遲 vs 頭寸持有時間。線上機器學習正在推動演算法交易,它比傳統的長期投資策略更快速,比股票市場中的高頻交易更加慎重。許多不同型別的機器學習演算法被組合運用以獲得最佳回。
早在 20 世紀 80 年代,我還在為摩根士丹利的股票交易神經網路模型提供諮詢時,遇到了專門設計平行計算機的電腦科學家大衛 · 肖(David Shaw)。
哥倫比亞大學學術休假期間,肖曾在自動化交易早期擔任量化分析師,隨後他在華爾街創立了自己的投資管理公司德劭集團(The D. E. Shaw Group),現在他已經是億萬富翁了。
德劭集團非常成功,但仍然遜於另一家對沖基金文藝復興科技公司(Renaissance Technologies)。這家基金是由傑出的數學家、紐約州立大學石溪分校數學系前主任詹姆斯 · 西蒙斯(James Simons)創立的。僅 2016 年,西蒙斯就掙了 16 億美元,這還算不上他最好的一年。
更廣泛的金融服務正在金融科技(fintech)的大背景下發生大規模轉型。諸如區塊鏈這樣的資訊科技—— 一種安全的網際網路記賬方式,取代了金融交易的中間商——正在接受小規模的測試,但它很快就會擾亂價值數萬億美元的金融市場。
機器學習正在被用於改進貸款信用評估,準確地提供業務和財務資訊,在社交媒體上獲取預測市場趨勢的訊號,併為金融交易提供生物識別安全服務。誰擁有最多的資料,誰就是贏家,而世界上充斥著財務資料。
德州撲克:當機器智慧學會了虛張聲勢
一對一無限注德州撲克是最受歡迎的撲克玩法之一,常見於賭場,無限注投注方式則通常出現在世界撲克系列賽(World Series of Poker)的主賽事中。
撲克很有挑戰性,因為與國際象棋玩家可以獲得相同的資訊不同,撲克玩家的資訊不完整,而且在最高階別的比賽中,詐唬、欺騙的技巧和拿到的牌一樣重要。
數學家約翰 · 馮 · 諾依曼(John von Neumann)創立了數學博弈理論,也是數字計算機之父,他就對撲克特別著迷。
他說過:“現實生活包括虛張聲勢,一點欺騙手段,以及自問另一個人會怎麼評判我做事的意圖。這就是我理論中博弈的內涵。”
撲克是一種博弈,反映了經過進化精煉過的人類智慧的一部分。一個名為“DeepStack”的深度學習網路和 33 名職業撲克選手進行了 44852 場比賽。
令撲克專家震驚的是,它以相當大的優勢,一個標準差,擊敗了最出色的撲克玩家,同時以四個標準差在整體上擊敗了全部 33 名玩家——多麼巨大的差距。
如果這一成就能複製到其他基於不完全資訊、需要人來做判斷的重要領域,比如政治學和國際關係,其影響可能是極其深遠的。
圖為一對一無限注德州撲克,強勢手牌。DeepStack 已經掌握瞭如何在高籌碼撲克中虛張聲勢,以大比分優勢擊敗職業撲克玩家。
弗林效應:深度學習讓人類更加智慧
在圍棋上大勝人類的 AlphaGo 有智力嗎?除了“意識”這個主題,關於智力的文章比心理學中任何其他主題都要多得多,這兩個概念都很難界定。
自 20 世紀 30 年代以來,心理學家就對流體智力和晶體智力進行了區分——流體智力能夠將新條件中的推理和模式識別用於解決新問題,而不依賴於以前的知識;
晶體智力則依賴於先前的知識,也是標準智商測試(即 IQ 測試)的物件。流體智力遵循一種拋物線式發展軌跡,在成年早期達到高峰,並隨著年齡的增長逐漸下降;
而晶體智力會隨年齡的增長,緩慢漸進式地提高,直至暮年。AlphaGo 只在一個相當狹窄的領域同時展現出了晶體智力和流體智力,但在這個領域,它表現出了令人驚訝的創造力。
專業知識的獲取也是基於在狹窄領域的學習。我們都是語言領域的專家,每天都在使用語言。
AlphaGo 使用的強化學習演算法可以被用來解決許多問題。這種形式的學習只取決於在一系列動作結束時給予獲勝者的獎勵,這似乎和提前做出更好的決策相矛盾。
結合了許多強大的深度學習網路,就會生成許多領域相關的智慧。而且事實上,已經出現了與領域相關的不同型別智慧,例如社會、情感、機械和建築等的案例。
智力測試測量的一般因素(general factor,簡稱 g 因素)與這些不同型別相關。我們有理由認真審視 IQ 測試。自 20 世紀 30 年代首次測試智力以來,全人類平均的 IQ 分數每 10 年會上升三個點,這一趨勢被稱為“弗林效應”(Flynn effect)。
環境會影響基因調控,從而影響大腦內在的連線,行為也會隨之發生變化。隨著人類越來越多地生活在人造環境中,大腦正在以某種超越自然進化軌道的方式被塑造。
在更長的時間內,人類是否能一直都在變得更聰明?智商增長會持續多久?
用電腦玩國際象棋、西洋雙陸棋和圍棋的人數自計算機程式達到冠軍級別後一直在穩步增加,而機器也強化了人類玩家的智慧。
深度學習提升的將不僅僅是科學研究人員的智慧,還包括所有行業從業人員的智慧。
回到未來:當人類智慧遇到人工智慧
有兩個相互交織的主題:人類智慧是如何進化的,以及人工智慧會如何演變。
這兩種智慧之間的巨大差異在於,人類智慧的進化經歷了數百萬年的時間,而人工智慧在最近幾十年才發展起來。儘管對於文化演變來說,這個速度仍然是快得出奇,但是過於謹小慎微可能並不是個正確的選擇。深度學習在近期取得的突破,並不是你從新聞報導中讀到的那種一夜成功。
從基於符號、邏輯和規則的人工智慧向基於大資料和學習演算法的深度學習網路的轉變,其背後的故事通常並不為人所熟知。如果對這方面感興趣的老鐵可以看下《深度學習》這本書
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2639337/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- (張鈸院士) 後深度學習時代的人工智慧深度學習人工智慧
- 如何用雲端 GPU 為你的 Python 深度學習加速?GPUPython深度學習
- 實時深度學習深度學習
- Sunny.Xia的深度學習(四)MMOE多工學習模型實戰演練深度學習模型
- 美團“猜你喜歡”深度學習排序模型實踐深度學習排序模型
- 李巨集毅深度學習 筆記(四)深度學習筆記
- 你真的瞭解深度學習嗎?深度學習
- 流體力學深度學習建模技術研究進展深度學習
- 深度學習洪流:為何它能瞬間改變你的生活?(上)深度學習
- 深度學習(一)深度學習學習資料深度學習
- 【騰訊深度學習系列】深度學習及並行化實現概述深度學習並行
- 深度學習中的注意力機制(Attention Model)深度學習
- 中國工程院院士潘雲鶴:人工智慧2.0應與工業深度融合人工智慧
- 深度學習(四)之電影評論分類深度學習
- 讀書筆記(四):深度學習基於Keras的Python實踐筆記深度學習KerasPython
- 為Apache Spark準備的深度學習ApacheSpark深度學習
- 深度學習+深度強化學習+遷移學習【研修】深度學習強化學習遷移學習
- 深度學習、強化學習核心技術實戰深度學習強化學習
- 李沐大佬-動手學深度學習筆記-注意力機制深度學習筆記
- 美國工程院院士Glynn:基於資料的決策,模擬與庫存管理
- 深度學習及深度強化學習研修深度學習強化學習
- CICC科普欄目|神經網路淺講:從神經元到深度學習神經網路深度學習
- 解讀注意力機制原理,教你使用Python實現深度學習模型Python深度學習模型
- 深度學習學習框架深度學習框架
- IT學習力
- 《深度學習:21天實戰Caffe》深度學習
- 深度學習的TensorFlow實現深度學習
- 深度學習四從迴圈神經網路入手學習LSTM及GRU深度學習神經網路
- 中國工程院院士倪光南:開源晶片有可能成為世界主流晶片
- 深度學習深度學習
- ####深度學習深度學習
- 深度 學習
- 故障診斷為什麼要用深度學習?深度學習
- 大型計算如何為深度學習火箭助力深度學習
- 為什麼會有深度學習?如何看待?深度學習
- 8個深度學習實戰專案, 快速豐富你的簡歷深度學習
- 深度學習之PyTorch實戰(4)——遷移學習深度學習PyTorch遷移學習
- 深度學習及深度強化學習應用深度學習強化學習