這份報告試圖從學術、工業、政策等角度全面介紹全球人工智慧的發展現狀,今年的報告更加註重全球資料。報告指出,美國的 AI 研究力量仍是全球最強,但中國的追趕速度很快。報告特別介紹了清華大學學習 AI 課程的學生數量:2017 年人工智慧+機器學習課程的入學人數比 2010 年時多 16 倍。
AI Index 2018 版介紹
我們很高興推出 AI Index 2018 年度報告。本年度的報告要實現兩個目標:更新上一年的指標以及儘可能地提供全球性的背景。前一個目標是 AI Index 至關重要的使命——為探討人工智慧設定基礎,即意味著要持續不斷地跟蹤規模和技術的進展。但後一個目標也很重要。沒有全球化的視野,不可能講好 AI 故事。2017 年的報告嚴重偏向了北美地區的活動。這只是因為我們的全球合作關係還有限,並不是因為我們有內在的偏見。今年,我們開始填補這一全球性漏洞。我們認識到,要使本報告真正完備全面,前方還有很長的路要走——會涉及到更多合作和外部參與。
儘管如此,我們仍可以斷言 AI 是全球性的。2017 年,Scopus 上 83% 的 AI 論文都來自美國之外。其中來自歐洲的佔到了最大的比例(28%)。在全世界範圍內,AI 和機器學習(ML)大學課程的入學人數都在增多,尤其值得一提的是中國的清華大學,該校 2017 年人工智慧+機器學習組合課程的入學人數比 2010 年時多 16 倍。2017 年,中國生產的工業機器人的數量也佔到了世界的最大比重——佔全球機器人總出貨量的 30%。而且不只是美國、中國和歐洲,其它地方也在推進 AI 的發展。根據我們的統計 AI 專利的方法,韓國和日本在 2014 年產出的 AI 專利分列全球第二和第三,僅次於美國。另外,南非成功舉辦了第二屆 Deep Learning Indaba 大會,這是世界最大型的機器學習教學活動之一,吸引了來自 20 多個非洲國家的超過 500 名參會者。
AI 的多樣性不僅體現在地理上。如今,Partnership on AI 已有大約 50% 的成員組織是非營利性的,包括美國公民自由聯盟、國際特赦組織、牛津大學人類未來研究所和聯合國開發計劃署。而且人們也對 AI 領域中的性別和少數族裔多樣性的重要性有了更高的認識。AI4ALL 和 Women in Machine Learning(WiML)等組織正在加大力度鼓勵和支援代表性不足的群體參與進來。
下面的指標也能體現本報告所傳達的關鍵資訊:AI 是全球性的。
報告目錄如下:
領域活力
學術
1996~2017 年間論文發表數量年增長情況
下圖展示了 1996 年~2017 年 AI、CS 及所有領域論文數量的增長情況。從圖中可以看出,AI 領域的論文增幅最大,比 1996 年增加了 7 倍多。
1998~2017 年間 Scopus 平臺 AI 各子領域論文數量年增長情況
下圖展示了 Scopus 上的 AI 論文數量(按 AI 子領域劃分,各個類別之間可能有交叉)。可以看出,機器學習和機率推理、神經網路、計算機視覺方面的論文最多,增速也最快,反映了這些領域的火熱程度。
2000 年&2017 年中國、美國、歐洲區域的活躍 AI 研究方向
下圖顯示了中國、美國、歐洲的 AI 研究相對活躍指數(RAI,一個國家/地區 AI 出版物份額與全球 AI 出版物份額的對比,1.0 表示該國家/地區在 AI 領域的研究活躍度與全球活躍度完全一致)。可以看出,2000 年中國的工程、技術研究活躍程度高於平均水平,但醫療健康、農業、社會科學、人道主義方面的研究活躍度比較低。到了 2017 年,這幾個領域活躍程度有所提高,其中最突出的是農業科學。
1998~2017 年間中國、美國和歐洲論文數量變化情況(按領域劃分)
下圖展示了中國、美國和歐洲來自政府、企業及醫療領域的論文數量變化情況。從中可以看出,中國、歐洲的 AI 論文主要來自政府,而美國的 AI 論文則主要來自企業。
1998-2016 年各地區發表論文的領域權重引用影響係數(FWCI)
美國的 AI 論文作者獲得的引用量要比全球平均水平高 83%,另一方面,中國論文的被引次數增長迅速。
各個國家和地區在 2018 AAAI 大會上的論文發表數量
70% 的 AAAI 論文來自美國、中國。
大型 AI 會議參與度
下圖顯示了 1984-2018 年間大型 AI 會議的出席人數以及 2012-2018 年各個大型會議出席人數的增長變化。從圖中可以看出,1986-1993 年左右,出席大會的人數下降得比較厲害。而從 1995 年至今,出席大型 AI 會議的人數呈波動增長,尤其是從 2013 年開始急劇增加。注:這裡對大型會議的定義是 2017 年出席人數超過 2000 的大會。
小型 AI 會議參與度
下圖展示了 1995-2018 年間出席小型 AI 會議的人數以及 2012-2018 年各個小型會議出席人數的增長變化。小型會議是指在 2017 年出席人數不足 2000 的大會。
ICLR 2018 的出席人數是 2012 年的 20 倍,這一趨勢反映了當前的人工智慧更加註重深度學習和強化學習。
業界
AI 工作機會
下圖根據所需 AI 技能展示了 2015-2017 年工作機會變化趨勢(AI 技能有交叉)。可以看出,機器學習和深度學習方面的工作機會最多,深度學習工作機會增速最快。
開源
GitHub 收藏量(star)
下圖展示了 2015-2018 年不同的 AI 和 ML 軟體包在 GitHub 上的收藏量變化。從圖中可以看到兩個近期趨勢:大公司支援的框架(如 TensorFlow (谷歌)、PyTorch (Facebook)、MXNet (亞馬遜))流行度不斷增長;與其他包相比,TensorFlow 具備更強的流行度。
技術表現
計算機視覺
1. 目標檢測:ImageNet
下圖展示了 2010 到 2018 年目標檢測模型在 ImageNet 資料集上的準確率變化。
2. 目標檢測:ImageNet 訓練時間
下圖展示了 2017 年 6 月到 2018 年 11 月訓練神經網路在 ImageNet 資料集上得到高準確率所需時間。
3. 例項目標分割:COCO
下圖展示了 2015-2018 年模型在 COCO 資料集上的效能變化。
自然語言理解
1. 解析
下圖展示了 1995-2015 年 AI 系統在確定句子句法結構的任務上的效能變化。
2. 機器翻譯
下圖展示了 2008-2018 年機器翻譯系統在英語-德語翻譯和德語-英語翻譯任務上的效能變化。
3. 問答系統:ARC
2018 年 4 月-11 月問答系統在 ARC 基準上的效能變化
4. 問答系統:GLUE
2018 年 5 月-10 月問答系統在 GLUE 基準上的效能變化
識別下方二維碼,閱讀完整版報告。
延伸閱讀:
2017 年報告(中文):http://cdn.aiindex.org/AI-Index-2017-Chinese-Translation.pdf
2018 年報告中文版將於近日釋出,敬請期待。