美國頂尖學府史丹佛大學(Stanford University)AI 100中AI Index專案旨在追蹤人工智慧的活動和進展,研究人工智慧對人們生活的影響。AI Index通過專注於追蹤和觀察AI的活動和進展,並以可靠、可驗證資料為基礎,促進大眾對AI的瞭解。

AI Index在2017年年末公佈了團隊成立以來第一份報告,又於近日釋出了第二份報告,我們將通過對比兩份報告的資料變化,來探究AI行業2018年的發展趨勢,以及中國對比世界其它國家在AI領域發展方向的異同。

PDF資料參考:https://t.zsxq.com/BaYRB6q

AI學術研究論文數量

2017年:1996年以來學術論文和研究的數量猛增了9倍以上

自1996年以來,每年發表的電腦科學的學術論文和研究的數量猛增了9倍以上。學術論文和研究通常能產生新的智慧財產權和專利。整個Scopus資料庫中,含有“Artificial Intelligence”這個關鍵詞的電腦科學領域的論文有超過200,000(200237)篇。Scopus資料庫中“電腦科學”領域的論文總共有近500萬(4868421)篇。

2018年:AI領域論文總量猛增

上圖是相較於1996年,學術論文的年度出版率增長情況,該圖比較了電腦科學(CS)領域和AI領域的論文發表率增長情況。從1996年到2017年,AI領域的論文增加了7倍(8x),CS領域的論文增加了5倍(6x)

對比總結:對比2017年報告,在2018年進一步注重細分領域。重點關注計算機領域和AI領域的論文數量,此外還補充了,各地區以及相關領域的論文發表情況。其中,中美兩國的AI領域論文數量增長情況尤為矚目。

AI風險投資

2017年:自2000年以來,在美國,風險投資者(VC)每年投入AI創業公司的投資額增加了6倍。

上圖顯示了VC在美國所有融資階段對AI創業公司年度投資總額。VC每年投給初創公司的資金額,在某些關鍵領域起著重要作用。

2018年:在風投資金方面,從2013年到2017年,人工智慧領域的風投資金增長到了原來的4.5倍,而所有的風投資金只增長到了原來的2.08倍。這些資料都是年度資料,不是逐年累積的。

對比總結:整體來看,AI領域的投資熱度依然很高,2018年報告更加關注近期的投資情況。從報告上看來,最近幾年的AI領域投資佔比進一步提高,相較於其他行業,AI領域發展速度將會在資本的助推下進一步加快。

AI創業公司

2017年:AI創業公司增加了14倍。

自2000年以來,在美國,有資本支援的AI創業公司數量增加了14倍。這個數字包括VentureSource資料庫中Crunchbase列表中的任何有VC支援的公司。

2018年:從2015年1月到2018年1月,人工智慧創業公司的數量增長到了原來的2.1倍,而所有活躍的創業公司增長到了原來的1.3倍。

圖表顯示,初創公司的數量是逐年累積的。在很大程度上,創業公司整體的增長保持相對穩定,而AI創業公司的數量呈指數級增長。

對比總結:相較於之前,近兩年的AI公司數量增長幅度愈發加快,而活躍公司的數量也越來越多。進一步反應了AI市場的火熱,創業熱情也在進一步提高。

AI人才需求

2017年:自2013年以來,要求有AI技能的工作崗位增長了4.5倍。

在Indeed.com平臺上,需要AI技能的工作崗位所佔份額的計算方法是通過職業描述中的標題和關鍵字來確定是否與人工智慧相關。AI Index研究還計算了在Indeed.com平臺上,要求人工智慧技術的工作崗位份額在不同國家的增長情況。報告顯示,加拿大和英國分別佔美國AI招聘市場絕對規模的5%和27%。

2018年:報告統計ML是最大的技能要求。從2016年到2017年的增幅尤為明顯。全球對AI人才的需求在2016年驟增。深度學習(DL)的增長速度最快——從2015年到2017年,需要DL技能的職位空缺增加了35倍。

對比總結:2016年是AI人才需求量猛增的一年,此後AI行業人才需求量一直在高速發展,人才缺口的情況可能會進一步加劇,同時深度學習領域發展最為迅速,該技能人才最為搶手。

AI領域核心技能以及熱門領域

2017年:機器學習,深度學習和自然語言處理(NLP)是最重要的三項技能。除了建立AI應用程式,最受歡迎的技能還包括機器學習技術,Python,Java,C++,開源開發環境的經驗,Spark,MATLAB和Hadoop。

2018年:開源框架GitHub標星數,TensorFlow的受歡迎程度在開發者中遙遙領先、穩步增長。二名和第三名分別是scikit-learn和BVLC/caffe。TensorFlow官方力推的keras排到了第四,另外兩大熱門PyTorch和MXNet分別排到了第七和第六,尤其是PyTorch,作為一個年輕的框架,自2017年初發布以來至今,GitHub標星數至少增長了4倍。

對比總結:從最近兩年可以大致看出,各類AI程式設計框架以及程式設計技能的受歡迎程度。而最近呈現的兩大趨勢是,由大公司支援的框架越來越受歡迎,如谷歌的TensorFlow、Facebook的Pytorch,亞馬遜的mxnet等,以及TensorFlow在受歡迎程度上相對其他語言表現出越來越明顯的優勢。

AI領域各類任務成績

2017年:自2010年以來,影像標註的錯誤率從28.5%下降到2.5%以下。

此外,在視覺問答、詞語解析、語音識別、定理證明等眾多領域,報告也做了詳細闡述。報告顯示,在某些領域AI還是距離人類成績相差甚遠。以視覺問答為例,截止2017年8月,最好的AI系統準確率還不到70%,而人類水平在85%左右。

2018年:2017年是ImageNet比賽的最後一屆,2018年這項比賽就不再進行。可以看出,到2015年,機器在影像分類任務上的能力已經明顯超越了人眼。

ImageNet挑戰賽“退休”之後,CV領域的朋友們就把重點放在了微軟的COCO,挑戰語義分割和例項分割。四年來,COCO資料集上影像分割挑戰的精確度已經提升了0.2,2018年的成績比2015提升了72%。在確定句子結構這種語法分析的任務上,2003年到2018年的15年間,AI的表現(F1 Score得分)提升了將近10%。

對比總結:AI各領域的任務成績在飛速提高,在某些領域甚至已經開始反超人類。可以看到隨著AI能力的進一步提升,在不久的將來,更大範圍上,AI的普遍能力將超過人類。

機器人安裝數量

2017年:從國際上看,機器人的進口量已經從2000年的10萬臺左右增長到了2015年的25萬臺左右。

國際資料公司(IDC)預測對機器人的消費將在五年內加快,到2021年達到2307億美元,複合年增長率(CAGR)為22.8%。

2018年:2012年到2017年,中國機器人年安裝量增長了500%,其他地區,比如韓國和歐洲,分別增長了105%和122%。在安裝量較小的地區中,台灣比較突出,在2012-2017年增長最快。

對比總結:相較於2017年報告,2018年的報告進一步細分了國際市場。與之前的北美市場相比較而言,中國市場的機器人市場增長速度尤為矚目,目前已遙遙領先其它國家和地區,

2018年最新補充內容部分

2018年報告進一步細分領域論文發表情況:論文發表速度更加快速

2017年,56%的論文屬於機器學習和概率推理領域,而2010年這一數字為28%。對於大多數細分領域,在2014-2017年期間論文的發表速度要快於2010年-2014年。例如,神經網路領域(上圖紅線)論文的2010-2014年複合年增長率(CAGR)僅為3%,而該領域2014-2017年的複合年增長率為37%。

ArXiv上的AI論文:數量迅猛增長

自2010年開始,arXiv上的AI論文迅猛增長,從2010年的1073篇,到2017年釋出的13325篇。其中計算機視覺領域(CV) 是自2014年起增長最快的一個領域 (上圖藍線) 。這一趨勢表明AI研究者傾向於傳播他們的研究,無論是經過同行的認可亦或經過了頂會的檢驗,這也說明該領域競爭激烈。

高校AI教授性別:以男性為主

在收集相關資料的過程中,改善師資多樣性成了改團隊的關注點。在所研究的學校中,他們發現平均80%的AI教授都是男性,在世界各地、各大高校都是如此。

就業性別差異:AI目前還是男人的遊戲

在美國,平均而言,男性求職者佔AI求職者總數的71%,因為機器學習要求的求職者數量最多,平均而言,這主要是由機器學習求職者推動的。除了機器學習,深度學習和機器人技術相對於其他類別而言,性別差異更大。

政府部門對AI的關注:美國、英國和加拿大的議會記錄中提及“人工智慧”和“機器學習”的次數快速上升。

這三個國家的議會中,“機器學習”與“人工智慧”的提及頻率自2016年以來快速上升。相對於而言,“機器學習”在之前被提及的次數基本很少,主要是最近兩年開始快速提升。

2018年報告中國內容部分總結

各地區發表論文情況:2007年至2017年在中國發表的論文數量增加了150%。歐洲是AI論文出產大戶,2017年Scopus上的AI論文有28%來自歐洲,25%來自中國,17%來自美國。

在領域側重(RAI)上:中國的AI論文更側重於工程技術和農業科學

RAI可以看出一個區域的專業傾向,通過將其與AI全球研究活動進行比較。RAI值為1時,表明這個國家在AI中的研究活動與全球一致;高於1時,意味著該國更強調重視這個領域;低於1時,意味著更少關注。從圖中可以看出,中國的AI論文更側重於工程技術和農業科學,而美國和歐洲的AI論文則傾向於關注人文科學和醫學與健康科學。

政府、企業和醫學界主導研究情況對比:可以看到,從2007年到2017年,中國增長了400%;而企業論文在這期間增長了73%。在美國,相對較大比例的AI論文來源於企業,美國企業的AI論文比例要遠高於中國和歐洲。

FWCI是領域權重引用影響係數,可以用來衡量論文的影響力。2016年中國AI論文的被引用率比2000年高出了44%,但整體仍處於平均水平之下。而美國在這方面表現突出,美國作者AI論文的引用率要比世界平均水平高83%。歐洲則一直在平均水平線徘徊。

在AI研究者流動率上,美國、中國和歐洲這三個國家和地區中,中國低流動性(Sedentary“久坐不動”)的AI作者比例最大(76%),其次是歐洲(52%),最後是美國(37%)。調查表明,流動性高的學者發表的AI論文具有更高的引用率和影響力,也更傾向於更頻繁地釋出論文。

在2018-AAAI頂會上提交的論文中約有70%來自美國或中國。 中國提交的論文數量最多,有1242篇,美國次之,有934篇。但美國機構提交的論文獲得了29%較高的錄取率,被接受了268篇,中國被接受的論文錄取率略低為21%,被錄取了265篇。德語和義大利語的論文獲得最高錄取率(41%),但提交的篇數較少。

在非美國地區的高校AI和ML課程註冊人數變化中,清華是非美國高校中增長率最高的,是第二名多倫多大學的2倍左右,而且2017年AI和ML課程註冊人數是2010年的16倍。

自2012年以來全球訪問ROS.org最多的五大地區,中國的增長速度位居第一。2017年,來自中國的訪問次數已經相當於2012年的18倍。

ROS.org表示,來自中國的訪問量增長是結構性的,而不是在中國增加市場營銷和資源投入的結果。美國和歐洲的訪問次數位居前兩位。

AI Index 在2018年報告最後表示,人工智慧無疑會繼續變得更加複雜,得到越來越多的應用,但仍存在許多障礙,既有技術上的障礙,也有偏見和安全方面的障礙。同時,伴隨著自動化的普及,大規模失業雖然不會很快到來,但作為一個社會,我們需要準備好迎接工作性質的轉變,轉向更不穩定、薪酬更低、缺乏醫療保險等安全保障的工作。

現在來說,可靠地測量AI對社會的影響也許為時過早——這個行業才剛剛起步,但我們要為這一切做好準備,瞭解這意味著什麼,以及AI將如何影響日常生活、工作以及醫療保健、教育和執法等公共機構,這與AI研究和產品開發同等重要。只有同時投資於兩者,我們才能讓世界變得更好。