摘要:當前,資料、演算法、算力的發展突破正推動AI應用的逐步落地。
AI是什麼?
根據維基百科的定義,人工智慧是一種新的通用目的技術(GPT, General Purpose Technology),它橫跨整個人類經濟的多種用途,具有巨大技術性互補和溢位效應。
簡而言之,AI是21世紀的一種基礎技術,它會應用在我們日常生活的方方面面。
AI的歷史、現在和未來
早期,受到20世紀數學哲學的影響,誕生出兩種流派的人工智慧。
基於形式主義(認為所有數學分支都可以公理化的)和邏輯主義(一切數學都是建立在數理邏輯的基礎之上)的符號主義的人工智慧,以及基於構造主義的連線主義和行為主義人工智慧。
早期的流派都認為自己提出的理論有很大的潛力,可以解決很多問題。但在經過一系列探索後,科學愛家發現AI並沒有想象中的簡單。
之後,AI經歷了起起落落的發展階段。直到2006年,深度學習之父Geoffrey Hinton 和他的學生Ruslan Salakhutdinov在《科學》上發表了一篇文章,提出了深層網路訓練中梯度消失問題的解決方案,至此開啟了深度學習在學術界和工業界的浪潮。
2012年,Geoffry Hinton又帶著團隊參加了ImageNet ILSVRC挑戰賽,以驚人的優勢獲勝(錯誤率比第二名低了足足 10%),這次的比賽結果以及相應的論文拉開了深度學習的熱潮。
而深度學習之所以會從2006年後大放異彩,很大一部分的原因是資料、算力的發展,當時的資料集ImageNet的資料量很大,再加上使用GPU訓練深度學習網路,這兩個突破奠定了深度學習的崛起。
如今,GPU的算力也越來越強,現在的AI發展又是如何呢?
AI應用落地的三駕馬車
當前,資料、演算法、算力的發展突破正推動AI應用的逐步落地。
1、資料資源豐富
隨著物聯網基礎設施及智慧手機、可穿戴裝置的普及,我們每個人時刻都在產生大量資料。據IDC釋出《資料時代2025》的報告顯示,全球每年產生的資料將從2018年的33ZB增長到175ZB,相當於每天產生491EB的資料。
另一方面,大資料等技術,降低了資料處理和儲存的成本,資料作為人工智慧時代的“石油”,驅動著AI的發展。
2、演算法持續突破
在傳統深度學習CNN/RNN系列模型之後,強化學習、對抗網路演算法模型不斷湧現。AI演算法逐步逼近人類水平。
自然語言處理(NLP)方面,2018年Google推出的BERT開啟了NLP的元年,如今BERT在資料集上的兩個指標(GLUE基準:80.4%,MultiNLI準確度:86.7%)全面超越人類。
計算機視覺方面,影像分類的演算法很早之前就已超越了人類;動作識別目前精讀相對較低,停留在52.5%;人臉識別的某些資料集也已經超越了人類。
語音語義識別方面,中文語音識別準確率達到新高度,中文語音識別字錯率(CER)達到3.71%,與人類專業的速記員水平相當。
3、AI晶片釋放巨大算力
AI晶片市場細化,推理與訓練、雲側與端側分離,效能持續提升,突破摩爾定律瓶頸,釋放ZB級資料分析算力。
NVIDIA的Tesla V100,作為AI訓練通用晶片,效能遠超上一代P100的10+倍;
Google的TUP3.0是2.0效能的8倍左右;
華為也推出了適用於推理場景的昇騰310以及適用於模型訓練的昇騰910。
從早期的CPU、GPU到現在的TPU、ASIC,進入到細分領域後,各種AI專用晶片會層出不窮,效能不斷提升,功耗不斷降低。
未來,AI是否會超越人類?
當前,一些演算法在某些資料集上的準確率已經高於人類,很多人會問:AI是否會超越人類?
如圖,首先並不是人類社會的所有問題都是數學問題,有很多問題是不能用數學來描述,黃色圈子內是可以用數學解決的問題。
由此引出了第一個問題:世界上是否所有數學問題都有明確的答案?
答案是有些數學問題是無解的。
第二個問題:如果有明確的答案,是否可以通過有限步驟的計算得到答案?
這就是數學的可計算問題,經過驗證,並不是所有數學問題都是可以計算。
接下來是第三個問題:對於那些有可能在有限步驟計算出來的數學問題,能否有一種假想的機械(圖靈機),讓它不斷運動,最後當機器停下來的時候,那個數學問題就解決了?
結果是隻有部分問題是圖靈機能夠解決的。
回答完上面三個問題後,再回看上面那張圖,藍色圈子裡面的一個小圓是AI可以解決的問題,最後的小點才是AI已經找到解決方法的問題,只佔據非常小的一部分。
所以,我們可以說,在AI已經找到解決方法的問題上,它可能超越了人類,但是在更多的問題上,它是沒辦法超越的。
那麼在某些領域裡,AI的準確率既然高於人類,比如影像識別,它可以完全替代人類嗎?
如上圖所示,左邊是正常的原圖,中間是干擾資料,讓AI預測的是加了干擾資料的右圖。我們可以很清楚的辨別左右兩組圖完全沒有區別,但是AI演算法做不到,它會把右邊的三張圖片都判斷為鴕鳥。
再來看另一組AI犯錯的案例,上面是一些噪點和花紋的資料,但AI有99.6%的概率會將這些圖片識別成某種類別的物體。在我們普通人來看,AI有時候會犯一些非常愚蠢的錯誤。
這時候再回答“未來,AI是否會超越人類?”的問題,答案就是:AI能解決的只是人類社會中很小的一部分問題,即使它能解決,並在統計意義上得到一個還不錯的準確率,但它有時還是會犯很愚蠢的錯誤,AI的預測結果並不是完全可信的,AI不會超越人類,它應該成為人類的工具,使人類社會的生產效率進一步提高。
人工智慧入門的三大難點
最後談談高校學生,或者是普通開發者學習AI可能會碰到的一些問題,主要有以下三個難點:
一是要學習的基礎知識太多,做AI開發涉及到Python程式設計知識、Linux知識,視覺方面要學影像處理、OpenCV等,同時還要有一定的數學基礎。
二是沒有GPU機器,自己買GPU做AI訓練,成本非常高。
三是碰到問題找不到人進行交流,尤其是非計算機專業的同學學AI會比較難,因為做AI開發不像傳統的軟體開發那樣有非常多的書籍資料和社群可以交流,很多人只能在GitHub上找一些資料來解決學AI過程中的一些問題,能交流的人和圈子都會更少一點。
結語:
幸運的是,華為雲提供了一站式AI開發平臺ModelArts,可以低門檻、低成本的上手AI,並且提供ModelArts社群、《ModelArts人工智慧應用開發指南》等書籍,解決學習AI過程的以上三個難點。而且在1024程式設計師節這樣喜大普奔的日子裡,華為雲也推出了以“向雲而生”為主題的一系列趣味活動和直播,學AI的同時可以集卡牌、抽盲盒,看直播更有超豪華錦鯉大禮包。
備註:本文整理自華為雲EI影像演算法專家零一老師的直播《開發者如何抓住時代機遇學好AI》,點選可以回看。