翻譯 | AI科技大本營(rgznai100)
參與 | thinkdeeper
Part 1:為什麼機器學習如此重要
AI科技大本營編者按:
這篇文章在Medium上總共獲得了6900多個贊,在Medium上極受歡迎。受歡迎最大的原因是,作者能以比較淺顯的文字,將機器學習所囊括的各類原理講得清楚透徹。而這,對於以下三類人群來說,簡直是個福利包:
想要快速提升機器學習能力的技術人員;
想要初步瞭解機器學習,並願意接觸相關概念的非技術人員;
任何對機器是如何思考感興趣的人。
雖然文章中也會討論概率、統計學、程式設計、線性代數和微積分的基本概念,但在作者的深入淺出的語言描述下,即便沒有相關背景知識,也不會覺得難懂。
如果你想在3個小時內快速瞭解機器學習的概念,也不知道上哪裡找價值高的指導性文章,建議您閱讀該作者系列文章。AI科技大本營會陸續更新該系列的Part2、3、4、5部分及資源列表。
Part 1:為什麼機器學習重要。人工智慧與機器學習概述——過去,現在,將來。
https://medium.com/machine-learning-for-humans/why-machine-learning-matters-6164faf1df12
Part 2.1:監督學習。線性迴歸,損失函式,過擬合,梯度下降。
https://medium.com/machine-learning-for-humans/supervised-learning-740383a2feab
Part 2.2:監督學習II。兩種分類方法:邏輯迴歸和SVMs。
https://medium.com/machine-learning-for-humans/supervised-learning-2-5c1c23f3560d
Part 2.3:監督學習III.。非引數學習:k最近鄰,決策樹,隨機森林。並介紹交叉驗證,如何調參和模型融合。
https://medium.com/machine-learning-for-humans/supervised-learning-3-b1551b9c4930
Part 3:無監督學習。聚類:k-means,層次聚類。降維:主成份分析法(PCA),奇異值分解(SVD)。
https://medium.com/machine-learning-for-humans/unsupervised-learning-f45587588294
Part 4:神經網路。深度學習的工作原理,以及卷積神經網路(CNN),迴圈神經網路(RNNs)和實際應用。
https://medium.com/machine-learning-for-humans/neural-networks-deep-learning-cdad8aeae49b
Part 5:增強學習。介紹馬爾可夫決策過程。Q-learning,策略學習,深層增強學習。價值學習問題。
https://medium.com/machine-learning-for-humans/reinforcement-learning-6eacf258b265
附錄:最好的機器學習資源機器學習課程資源列表。
https://medium.com/machine-learning-for-humans/how-to-learn-machine-learning-24d53bb64aa1
本篇為系列的第一篇文章,作者以講故事的方式,告訴你,為什麼機器學習如此重要。
這讓人想起前不久小扎與馬斯克關於“AI是否會超越人類”的論戰,小扎說AI只是幫人提升效率,讓人能夠專注於更重要的工作;而馬斯克則在twitter上公開批小扎“理解太淺薄,沒有看到更長遠的威脅”。
本篇文章的觀點與馬斯克如出一轍,作者對未來充滿擔憂,也正是這份擔憂,他提出:
雖然預測未來有點不現實,但有一件事是肯定的:2017年是瞭解機器如何思考的最好開始時間。
在他看來,人們必須深入機器瞭解世界的內部細節,搞清楚機器到底要什麼,它們的偏見和弱點是什麼。
而要搞清楚這些問題,作者強調“得把機器當成人來研究”;正如研究心理學和神經科學,探索人類如何學習、決策、感覺等課題。從這個層面來說,這已經不單單是技術問題了,而是需要綜合邏輯、心理、哲學、語言學等各學科,才能真正摸清楚黑匣子背後的祕密。
正文:
人工智慧比本世紀的任何其他創新都來得更猛,而它也將更有力地塑造我們的未來。
在這個技術統治的世界裡,任何不瞭解它的人,會很快發現自己落..伍...了...他會對即將到來的魔法世界,呈一臉懵逼狀。
雖然人工智慧歷代的潮起潮落已經被各大資料文章說爛了,早已老生常談,但請保持點耐心,我仍想用自己的方式,將其梳理一遍。
在經歷了過去四十年的幾番AI停滯和發展週期之後,資料的爆發和算力的提升讓人工智慧終於突破了瓶頸。
2015年,Google訓練了一個對話機器人(AI),不僅可以作為技術支援與人進行交流,還可以跟人討論道德問題,表達意見和回答一般性的基於事實的問題。
Vinyals&Le,2017
同年,DeepMind開發出一個程式,僅以畫素和遊戲得分作為輸入,在49局 Atari遊戲中超越人的表現。
不久後,DeepMind再次實現自我超越,釋出一款名叫A3C的新的前沿遊戲演算法。
與此同時,AlphaGo擊敗了世界頂級圍棋選手,這是繼機器征服國際象棋後,歷經二十年時間,再次在以人類為主導的遊戲中大獲全勝。
許多圍棋大師不理解,為什麼一臺機器能掌握這個古老的中國戰略遊戲,機器怎麼可能掌握其中的精髓和複雜,在10¹⁷⁰個可能的佈局中大敗人類。要知道,宇宙中原子的數量也就 10⁸⁰。這太不可思議了。
圖為與AlphaGo進行了一場比賽失敗後,職業圍棋選手Lee Sedol在覆盤這局棋局
不過,這還沒完。
2017年3月,OpenAI用自己發明的語言開發機器人,有效地實現了自己的目標。不久之後,Facebook成功訓練了會談判甚至說謊的機器人。
2017年8月11日,在多人線上遊戲Dota 2的1v1比賽中,OpenAI擊敗世界頂尖遊戲選手人士,這又讓好一波人受到了驚嚇。
觀看全程比賽,請移步YouTube,Dendi (human) vs. OpenAI (bot)
除了這些驚天大逆襲,人工智慧也開始滲透到我們的日常生活。
比如下面兩張圖片,你只用將相機對準選單,選中的圖片就可以通過Google翻譯APP自動翻譯成英文。
如果下一次你入住某酒店,致電前臺讓送牙膏到房間。當你開啟門,眼前是一個小的家政送貨機器人,不必驚訝。
各細分領域也開始藉助人工智慧進行智慧化升級。
(小編多一句嘴:作者會在本系列的5個章節中,深入探討這些技術背後的核心機器學習概念,並教你利用工具構建類似應用程式。)
下面我給出一個知識樹的圖片,從中可以看出,機器學習主要包括監督學習,無監督學習和增強學習三個方面。
人工智慧主要是研究能感知周圍世界、制定計劃、並做出決策以實現其目標的機器人。其所需要的基礎包括數學、邏輯、哲學、概率、語言學、神經科學和決策理論。許多領域都屬於AI,如計算機視覺,機器人,機器學習和自然語言處理。
機器學習則是人工智慧的一個子領域。它的目標是讓計算機自己學習。機器學習演算法使其能夠在資料中識別模式,從而構建模型,而不是利用預定義的規則進行預測。
智力大爆炸
其實,上述討論的例子,儘管會讓人一驚,但都屬於弱人工智慧(ANI),不過它確實能高效解決特定任務。
我們一直在為強人工智慧(AGI)做一些基礎性的推進工作。AGI的定義是一種能執行人類所要求的各類複雜任務,包括在不確定情況下進行學習、規劃和決策,用跟人類一模一樣的語言方式進行交流、講笑話,指揮股票交易或自己程式設計。
會自己程式設計,這一點尤為關鍵。一旦我們創造了一個能自我改進的AI,它將會以一種迴圈遞迴的方式進行自我完善。這預示著,我們將在未來的某個時期,將進入到一個智慧爆炸的時代,
超智慧機器可以超越任何人的智力活動。由此可以推出,設計這臺超智慧機器是人類智力活動之一,超智慧機器大於人類的智力活動,那超智慧機器可以設計出更好的機器。
如此一來,將會產生智力爆炸,遠遠超過人類的智力大爆炸。
可以這麼說:第一臺超智慧機器是人類最後的一個發明。
下圖被稱為奇點。該術語借用於發生在黑洞中心的引力奇點,一個無限擁有無限密度的一維點。在這裡,我們慣常理解的物理定律已無法適用。
我們對黑洞裡面到底是如何的一番景象完全搞不清楚,因為沒有光線可以逃脫這個黑洞。
同樣,在我們解鎖AI的自我改進能力之後,我們也沒有辦法預測將會發生什麼。
正如用於人類實驗中的小白鼠,它永遠也不知道人類在對自己做什麼,它只能膚淺地理解為人類在幫他們獲得更多的乳酪。
最近,人類未來研究所發表了一份調查報告,該報告調查了AI研究人員對實現AGI時代的預測。
研究人員認為在45年後,AI有50%的勝算超過人類。當然,有人說時間更長,有人說已經沒幾年了。
這是2005年在奇點臨近一書中的圖片。如今,2017了,牆上還能有多少我們自以為是的圖片呢?
超人工智慧的出現,對人類到底是件好事還是壞事?
先不做好壞的預測,而是談一個很實際的問題:我們怎麼能用一種對人類友好的方式,來指定AI做我們想讓他做的事情呢?
要達到這個目的,我們就瞭解機器學習,不是應用機器學習,而是真正搞明白。
機器學習——避免機器逆襲的唯一通路
所以我一直篤定一件事:2017年,該是我們瞭解機器如何思考的開始時間了。
這可不是拍腦袋,藉助哲學抽象概念或其他形象比喻來理解和學習AI。而是,我們必須深入其中,瞭解機器世界的內部細節—它們到底“想要什麼“,它們潛在的偏見和弱點到底有哪些——正如我們研究心理學和神經科學,以瞭解人類如何學習、決策、行為和感知這樣。
有關AI的複雜性和高風險的問題,將在未來幾年內越來越多引發人們的注意。不少問題亟待解決:
機器學習是通用人工智慧的核心,同時也將改變每一個行業,並對我們的日常生活產生巨大的影響。這就是為什麼我們認為了解機器學習是值得的。至少在概念層面上,我寫這些系列文章比較適合入門,不會有一種一來就將人拒之千里之外的感覺。
那麼講了這麼多,到底如何閱讀這個系列文章呢?
你不一定要把整個系列全部讀完,這裡我有三個建議,具體還得取決於你的興趣和時間。
1. T型方法。從頭到尾閱讀。並在每一節做總結。這種方式會讓你能更積極主動地閱讀,並且不容易遺忘。為了深入瞭解你最感興趣的內容,我們將會在每個部分的末尾提供一些參考資料供你擴充。
參考: Feynman technique
地址:https://mattyford.com/blog/2014/1/23/the-feynman-technique-model
2. 專注方法。直接閱讀你最感興趣的部分。
3. 80/20 法則。大概瀏覽全部內容, 對主要概念做筆記即可,並理解它。
對於80/20法則,可參考:
https://www.thebalance.com/pareto-s-principle-the-80-20-rule-2275148
好的,今天我們的開篇就到此,請關注AI科技大本營微信,獲取持續更新。
關於本系列文章作者的簡介:
Vishal最近在Upstart任職,這是一個利用機器學習來定價信貸,借貸過程自動化和獲取使用者的貸款平臺。他的研究主要基於如何思考創業,應用認知科學,道德哲學和人工智慧的倫理學。
Samer是UCSD的電腦科學與工程碩士生,Conigo Labs的聯合創始人。在畢業之前,他創立了TableScribe,這是中小型企業的商業智慧工具。他花了兩年的時間為麥肯錫的財富100強企業提供諮詢服務。Samer曾經在耶魯大學學習電腦科學與倫理學,政治學和經濟學。
兩人的目標是,鞏固自己對人工智慧,機器學習的理解,以及深入瞭解它們之間的融合方式 ,並希望在此過程中創造值得分享的東西。
原文地址
https://medium.com/machine-learning-for-humans/why-machine-learning-matters-6164faf1df12