在花 100 天學習人工智慧之後,我得出這 5 個結論

AIBigbull2050發表於2019-09-12
導語:未來發生得很慢,但一下子就爆發了

本文的作者是 Jamie Beach,在自學人工智慧 100 天以後,他分享了自己對人工智慧的 5 個感悟,以下是他的全文。

在花 100 天學習人工智慧之後,我得出這 5 個結論

我根據 Max Tegmark 的 Life 3.0 的第一章——The Tale of the Omega 畫的

2019 年 1 月底,我突然意識到,我對人工智慧的理解不足。它正日益影響著我們的每一天。人工智慧保護我們的收件箱免受垃圾郵件的攻擊,它支援來自 Alexa 的天氣更新,它使亞馬遜能夠向我們推薦商品,讓 Netflix 給我們推薦電影。每次我們開啟 twitter 或 facebook,都是人類與比我們更瞭解自己的人工智慧的較量。但我是一個專業的技術人員,卻對人工智慧的真正含義知之甚少。

《連線》雜誌創辦人 Kevin Kelly 在一個名為「未來思考者(Future Thinkers)」的播客上接受採訪時,談到過 AI 相關的話題。他認為,我們的人工智慧技術還處於起步階段,如果有人花一點時間學習人工智慧和機器學習,超越只是瞭解的水平,他們會發現自己只是一小部分人中的一部分。那天下班回家後,我開始了為期 100 天的「人工智慧學習潛水」。

我將需要學習的所有東西都進行了 。由於在職,很難找到業餘時間,但我確實在 100 天內完成了近 200 個小時的工作。我讀了 9 本書,上了 2 門 Coursera 課程(已經開始學習第三門課),聽了很多播客,看了儘可能多的輔助教程。

以下是我在那段時間總結出的 5 個觀點:

1.人工智慧是舊的也是新的

人工智慧這個詞並非出自某部科幻小說。1956 年,在達特茅斯學院的一個暑期研討會上,許多聰明人聚集在一起研究如何讓機器思考。在這次聚會中產生了「人工智慧」這個概念。雖然這次會議並沒有研究出具有思維的機器人,但它帶來的思想和技術仍然是當今人工智慧的基礎。

研討會之後,人們對人工智慧的不同子領域的興趣增強。神經網路似乎很有前途,但在當時這項技術一片空白,大多數研究最終放棄了這一概念。這個時期被稱為「AI 寒冬」,它持續了幾十年。然而,近年來,算力和可用資料的指數增長,加上深度學習的最新進展,極大地提高了機器學習的有效性。AI 被 Andrew Ng 等專家稱為「新的電力(new electricity)」。

2.人工智慧等同於機器學習,但它並不是終結者

「人工智慧是用 powerpoint 完成的,機器學習是用 python 完成的(「AI is done in PowerPoint and machine learning in Python」)」

在花 100 天學習人工智慧之後,我得出這 5 個結論

終結者,在流行文化中是超智慧的縮影

人工通用智慧(Artificial General Intelligence,簡稱 AGI)是一種假想的機器,它的思維方式和人類一樣, 比如終結者就是這種機器人。超智慧是超越人類思維能力的機器(如果讀過 Nick Bostrom 的 Superintelligence,你可能會有點害怕它),但在現在,還沒有這樣的事物出現。到目前為止,AGI 只是一種幻想,它在未來,並且有點遙不可及。這並不意味著沒人在做這件事,這也不意味著像 Max Tegmark 和 Ray Kurzweil 這樣的聰明人不會廣泛地談論它並期待它。但目前人工智慧的形式幾乎就是機器學習——一個 AI 的子領域。

機器學習的基本原理如下:

第一步:把一個問題變成一個預測問題。換句話說,給定輸入引數(特徵),預測結果。你可以預測一棟房子的價格,或者是拍攝時給定的攝像位置。

第二步:定義演算法或者系統,做出決策。這裡有很多方法,如線性迴歸,神經網路,深度學習,支援向量機,遞迴神經網路,卷積神經網路,生成性對抗網路等等。每種演算法都可以用於一種特殊的預測問題。要預測房屋成本,線性迴歸模型就足夠了;預測電影劇本將使用一個遞迴神經網路(RNN);預測不存在的人的面部影像使用生成性對抗網路(GAN)。

第三步:獲取大量的訓練資料。通常情況下,資料越多,效果越好。對於房價,要獲取數千行資料,其中包含這些房屋出售的特徵和實際價格(標籤)。對於字元識別,需要獲取大量的字元圖片並相應地進行標註。

第四步:訓練模型。提供訓練資料,計算誤差,調整並重復,直到誤差最小化。梯度下降和反向傳播是這裡的重要概念。

假設誤差已經達到最小,模型就可以接受新的特徵,並預測結果。這個結果通常非常準確——比人類更精確。

3.沒有魔法,只有數學

在花 100 天學習人工智慧之後,我得出這 5 個結論

我剛在谷歌上找到的公式

在開始這 100 天之前,我知道機器學習會涉及到數學,但我並不知道會需要多少數學知識。瞭解微積分和矩陣代數對任何人來說都是非常有益的,幸運的是,你不需要是數學專業的學生就可以學會這些,而且機器學習的框架也在不斷地迭代,變得越來越易用。

一些重要的框架,包括 Google 的 Tensorflow、Microsoft 的 ML.NET 和 PyTorch 為程式、數學和演算法新增了抽象層。甚至還有額外的抽象層,比如於 Tensorflow 上面的 Keras。

此外,相關人員正透過提供機器學習模型作為一項服務,或建立自動化的程式(如 AutoML 和 Auto-Keras),使機器學習更加容易上手。

4.偏差是個大問題

「真正的安全問題是,如果我們給這些系統提供有偏差的資料,系統就會有偏差」——John Giannandrea。

機器學習中的偏差是個大問題。Amy Webb 的書「The Big Nine」中有好幾個章節都提到了這個問題。測試資料的全面性和多樣性是非常重要的,但這往往是缺乏的。

在花 100 天學習人工智慧之後,我得出這 5 個結論

1956 年以來的「人工智慧的奠基人」

Amy 使用 ImageNet 語料庫作為有固定偏差的例子,它裡面有超過 1400 萬張標記圖片,其中一半以上是在美國產生作的。當然,ImageNet 並不是唯一一個有偏差的例子。

當一個資料集中包含了「護士」的女性形象或「執行長」的男性形象時會發生什麼?當皮膚癌影像資料只使用淺膚色樣本時會發生什麼?如果這些模型真正進入我們的日常生活時,就會產生嚴重的後果。隨著 ML 模型的全民化繼續進行,我們往往在不知道用於訓練的測試資料是什麼樣的情況下,就使用預先製作的模型,這種偏差持續存在,並可能放大。

研究人員很清楚這一問題,九大公司(G-MAFIA + BAT)都有和指導原則來說明減少工程文化偏差的必要性。但這不是故意的。沒有人會故意在模型中加入偏差,即使是出於善意,偏差也是不可避免的。

因此,我們都必須瞭解機器學習的工作原理,以及它是如何影響我們的——它是如何為 Twitter 和 Facebook 提供能量的,這些能量會攪動我們自己的神經元,從而影響我們對世界的看法。

5.機會如此之多

在花 100 天學習人工智慧之後,我得出這 5 個結論

全球人工智慧衍生業務價值預測(單位:十億美元),資料來源:Gartner(2018 年 4 月)

Kevin Kelly 是對的。我們還處在人工智慧和機器學習的早期。是的,有很多應用程式已經滲透到我們的生活中,但仍然有很多很多的機會。

機器學習能夠、已經和將會徹底改變一切。在過去的 100 天裡,我讀過的許多書中有一本叫「Manna」,作者是 Marshall Brian。這是一本科幻小說,它描述了一個近乎烏托邦的社會,機器和自動化承擔了所有的工作,人類可以隨心所欲地生活。不需要 AGI,只需要機器學習。這樣的生活離我們到底還有多遠?

我預見到未來 Instagram 名人和 YouTube 博主甚至都不是真實的,但卻擁有數以千萬計的追隨者,他們釋出的內容完全由 GAN 和 RNN 生成。由機器學習驅動的新的娛樂模式將會誕生,從電影指令碼到栩栩如生的超現實的三維模型都是由機器學習模型建立的。忘了面試工作吧。當你自己的個人資料記錄可以與所有當前職位空缺的公司資料檔案相匹配時,又何必費心呢?從癌症治療到餐廳晚餐,再到實時生成的音樂,一切都可以使用 ML 個性化地產生。自動駕駛的計程車、基於 RNN 的文案服務、自動化服務協議、自動化法庭裁決、個性化生活改善策略、無人機交付、基於人工智慧的投資,這些都是無止境的、有形的,而且幾乎都是目前的熱門領域。

人工智慧和機器學習也可能在全文明水平上影響人類,幫助緩解存在的風險,如氣候變化、戰爭、疾病甚至小行星撞擊地球。

世界即將變得不同。我們可能會注意到這一點,也可能不會。人工智慧將推動這一變化,而且它已經開始在我們身上蔓延。

正如 Kevin Kelly 所說,

未來發生得很慢,但會突然爆發(the future happens slowly and then all at once)。

via:





來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2656855/,如需轉載,請註明出處,否則將追究法律責任。

相關文章