人工智慧因為其中推動效率提高和發掘機會方面的推動器作用,正在越來越受到各國政府和各大企業的高度重視。發展AI,人才是關鍵因素。為了分析各國在AI人才方面的儲備情況,AI初創企業element.ai的Grace Kiser and Yoan Mantha利用頂級AI會議的作者和文章引用資料,再加上LinkedIn與其他AI報告的輔助,做出了2019年的全球AI人才報告。我們摘取其中部分進行了編譯,原文標題是:Global AI Talent Report 2019

摘要

一些有力的證據表明,AI頂級人才供不應求。但是對於人才的稀缺度和集中度卻缺少精確的資訊。為此,element.ai團隊連續第二年對全球AI人才的範圍和廣度進行調查。其研究主要依賴3個資料來源。1)AI領域21個領先的科學會議的出版物,分析其作者的概況。2)分析若干LinkedIn定向搜尋的結果,看看有多少人自稱是博士並且具備相應的必須技能的。3)外部報告及其他二手來源,幫助尋找相關背景,並更好地理解迅快變化的全球AI版圖中的人才情況。

報告發現,2018年有22400人在一或多個機器學習的頂級會議上發表了論文,比2015年提升了36%,比2018年也漲了19%。同行評審的出版物數量也比2015年提高了25%,比2018年提高了16%。不過在這些會議上發表文章的研究人員當中,女性僅佔18%,顯得名額不足。報告還發現,全球的AI人才池是高度流動的,大概有1/3的研究人員的僱主所在國家與其獲得博士學位所在國家是不一樣的。報告的分析表明,在21種刊物上發表過作品的作者當中有18%(約4000人)對有著重大影響的研究(以過去2年被引用數為衡量)做出過貢獻。而擁有高影響力研究人員最多的國家依次是美國、中國、英國、澳大利亞以及加拿大。

對LinkedIn簡歷的輔助調查表明,有36524人符合自稱的AI專家資格,這比2018年的報告數字增加了66%。

此次調查的發現表明,無論是自我報告的AI專家數量,還是作者和在AI會議上發表的科學論文數量,均有了顯著的提升和擴充,這反映出該領域的活力和國際化。

介紹

對AI專家的需求空前高漲,自學習的演算法預計可讓公司更好地駕馭發展性,獲取重要但此前不可見的訊號,提供實時洞察,幫助員工更好地完成工作。

2018年的第一次全球AI人才調查確認了一個AI業界的普遍假設:即有人工智慧經驗的博士很難找。2019年的調查將學術會議的樣本從3個提高到21個。同時還細分了性別、人才流動以及影響力指數情況。同時,報告還收集了LinkedIn上面的簡歷情況來評估自我報告的AI專家趨勢。最後,報告還將發現與外部報告和來源的資料進行關聯。

女性在AI會議出版物作者中的佔比依舊不足

我們2018年跟《連線》合作分析了人才池的情況,試圖弄清楚女性在機器學習研究人員的佔比。我們的評估認為目前這個領域的性別平衡問題依然非常嚴重:2018年調查的3個領先的AI學術會議裡面,我們發現只有12%的作者是女性。

2019年的調查範圍擴大到了21個學術會議,結果發現雖佔比有所提升,但這個群體的女性名額依然不足,比例為18%左右。根據我們的調查,AI存在的這種性別不平衡體現在了產業和學術兩方面:我們的資料表明學術界 19% 的會議作者為女性,而產業界的女性作者佔比為16%。

考慮到機器學習潛在的廣泛社會影響,女性在AI開發和部署方面的參與度是個重要問題。Facebook AI研究實驗室負責人Joelle Pineau教授闡明瞭要增加本領域女性數量的理由:“相對於其他領域我們肩負著更多的科學責任,因為我們正在開發會影響很大一部分比例人口的技術。”OpenAI的CEO Sam Altman也提出了類似的觀點,稱機器學習在博士畢業生的性別方面是“目前我所知道的最扭曲的領域”,同時又是“對我們未來所生活的世界會產生最大影響的領域”。

據史丹佛大學釋出的2018年AI指數報告,女性在學習AI和機器學習課程的大學生當中的佔比也不足:學習史丹佛2017年的《AI導論》課程的 74%為男性學生,加州大學伯克利分校的比例則是73%。報讀《機器學習導論》的女性佔比甚至更低,史丹佛大學這門課程男學生佔到了 76%,而加州大學伯克利分校同樣課程的男學生佔比更是高達79%。同一份報告還發現,美國絕大部分AI職位的申請者都是男性(71%)。

此次調查的資料表明,不同國家/地區之間的性別差距各不相同。女性作者佔比高於18%的平均水平的國家/地區包括西班牙(26%)、臺灣(23%)、新加坡(23%)、中國大陸(22%)、澳大利亞(22%)、美國(20%)、瑞士(19%)。在絕對數量上,美國的女性作者數量最多,其後是中國、英國、德國、加拿大、法國、澳大利亞、印度、義大利與新加坡。

培養出頂級AI專家的國家在僱用人才方面也領先

來自美國、中國、英國、德國、加拿大的作者佔了72%

我們的會議研究人員資料讓我們得以觀察論文作者是在哪裡接受培訓的。首先,在培養AI人才方面,美國繼續領先優勢:在這份調查的會議作者樣本中,44%的作者的博士學位是在美國獲得的。而在中國受訓的作者佔到了約11%,其後是英國(6%),德國(5%)以及加拿大、法國和日本(均為4%)。

僱用資料也顯示出了類似的地理分佈特徵。我們的調查表明,美國僱主繼續吸引研究人員前往工作,樣本資料中46%的人替美國的僱主工作,中國排名第二,佔比為11%,第三的英國佔比為7%。加拿大、德國、日本各佔樣本的4%。排名前18的國家就佔到了作者總量的94%。而排名前5的國家美國、中國、英國、德國、加拿大的佔比達到了72%。

會議樣本絕大部分都是學術界的(77%),23%在產業界工作。儘管業界一些最大的私營公司仍繼續吸引人才入駐其總部,但我們也看到很多公司開始招聘專家讓他們在母國的辦公地點工作。這份報告也把這些人看成是為公司總部所在國工作。比如說,某人是在法國修得博士然後在Google的法國分公司工作,報告會把此人看成是在法國受訓為美國公司工作。所以在統計方面美國受益是最大的。

為他人做嫁衣——培養博士的國家未必總是受益

人才流動情況

左側:在哪裡獲得博士學位;右側:在哪裡工作

本次的會議資料還分析了研究人員在完成博士學業後去到了哪裡工作。總體而言,我們發現在樣本當中將近有1/3(27%)的研究人員工作的僱主所在國家跟他們接受培訓所在的國家是不一樣的。在作者數量至少在150以上的國家當中,這個比例甚至高達32%。這些人才流動的全球地圖很複雜,背後的故事當然是跟個人密切相關的。但無論如何,這一資料能讓我們對AI人才的跨境流動一探端倪。(編者注:從中國的人才流入和流出來看,我們還是淨流入的多;而美國流入流出的體量都很大)

首先,我們的資料表明,某些國家對機器學習領域的研究人員特別有吸引力。總部在美國的僱主吸引海外受訓研究人員的機率最高。中國是吸引在別國拿到博士學位的研究人員可能性第二大的國家,在吸引的研究人員數量上幾乎是美國的1/4。我們估計會有若干因素對此產生影響,其中就包括每個國家的相關職位情況。

其中人才流入大於流出的10個國家/地區是:台灣、瑞典、韓國、西班牙、美國、瑞士、中國、日本、英國、澳大利亞。而在接受海外專家方面的贏家是瑞士和瑞典,外來人才佔比分別達到了50%和49%。

不同國家人才流入流出情況對比

這一資料還可以讓我們對比每個國家/地區的人才流入流出情況。人才流入表示的是在x國/地區工作但是在y國/地區拿到博士學位的人數除以x國/地區的AI人才總數。這個指標可以用來衡量一個生態體系對人才的吸引力。

四象限:左上——錨定國;左下——生產國;右上——邀請國;右下:平臺國

另一方面,人才流出表示的是在x國/地區拿到博士學位但現在為y國/地區的僱主工作的人數,再除以x國/地區的AI人才總數。這個比例可以看出一個國家/地區留住人才的能力。

跟平均水平相比,澳大利亞、西班牙、台灣的流入情況要大於流出。這意味著這些國家/地區在挽留自己培養的人才並吸引外來人才方面相對更加成功。這些生態體系我們稱之為邀請國。相反,法國、以色列這樣的國家屬於生產國,因為跟平均水平相比,其人才流出要高於人才流入,但是差距並不大。

美國的人才流入和流出情況都相對較少。這並不能反映出其人才庫的深度:就絕對數字而言,美國依然是全球領先的人才磁石。相反,它反映的是人才庫的相對穩定性。中國、德國、印度、義大利、日本和韓國也呈現出相同的模式。這類國家我們稱之為錨定國。

最後,還有好幾個國家的人才流入和流出都高於平均水平。這些國家成功地吸引了海外培養的人才,同時期研究生流動也高於平均水平。這些生態體系我們稱之為平臺國。,其中包括了加拿大、荷蘭、新加坡、瑞士以及英國。

我們的會議資料還發現一些國家之間的人才交流引人關注。中美之間的交流尤其突出,所以整體而言誰都沒有佔太大的便宜:我們發現在我們的22400名研究人員資料集當中有約500位是在中國拿得到博士學位然後為美國僱主工作的,不過也有約500名字美國拿到博士學位的人為中國的僱主工作。美國與英國之間也有類似的現象。

重大影響研究:美國、中國、英國、澳大利亞、加拿大領先

2019年的調查還發現在頂級國際學術會議上出現的作者數量比2018年增加了19%。為了評估這些作者目前在領域內的影響力,報告分析了其 2017、2018兩年間出版物的被引用情況。其中有18%(約4000人)具有較為顯著的影響力。這些人也是致力於將理論付諸應用的團隊想要爭取的物件。

而具備高影響力的作者的國家也主要集中在幾個國家,分別是美國(1095)、中國(255)、英國(140)、澳大利亞(80)以及加拿大(45)。

不過如果分析高影響力作者在本地AI人才中的佔比的話,情況會有所改變。這指標反映的是培養本地頂級人才的能力。這方面澳大利亞排名第一,18%的作者發表了具備重大影響的文章,其後是美國、英國和中國(均為13%),瑞士(11%)、新加坡(9%)、瑞典和西班牙(8%),以及以色列、加拿大與義大利(7%)。

總體而言,最具影響力的研究更有可能出自學術界而不是產業界。但是有些國家尤其如此。中國的高影響力研究是最有可能出自學術界的(90%),緊隨其後的是義大利(86%),美國(84%),德國(83%)以及台灣(81%)。而來自產業界的佔比最高的國家是法國(30%),其後是印度和以色列(29%),西班牙(28%)以及英國(27%)。

社交網路資料表明更多人是自稱的AI專家

我們的會議研究人員資料表明在AI領域的21個頂級學術會議上發表論文的作者和論文數量均有了顯著提升。為了瞭解就業市場是否有同樣的情況,我們調查了全球使用最廣泛的職業社交網路LinkedIn。

我們的研究物件是那些具備機器學習技術能力、若干工作經驗,並且能夠在交叉學科環境下寫作的職場人士。搜尋包括了“資料科學家”、“研究科學家”、“機器學習工程師”、“機器學習研究人員”以及“資料分析師”,而且學歷必須是博士。最後檢索出36524名符合條件的人士。相比之下,2018年的資料為22064,也就是說比2018年增長了66%。

根據2018年,2019年的調查發現,LinkedIn上的AI專家主要集中在美國、英國、加拿大、法國以及德國。不過,增長率最快的國家是義大利、突尼西亞、以色列、愛沙尼亞以及阿根廷。

從LinkedIn樣本分析來看,這些專家的主修專業各不一樣。其中電腦科學是佔比最高的(28%)。而且在一些國家這個比例甚至還要大,比如法國(47%)和中國(44%)。類似地,一些國家其中一些學科的佔比也比平均水平突出。比如物理專業的平均佔比為9%,但在德國其佔比卻高達28%。另一個例子是數學和統計。平均佔比為18%,但以色列、美國這個數字就升到了27%,而俄羅斯更是高達35%。

不同國家的學科差異

電腦科學約佔1/3,但不同國家差異很大

當然,利用LinkedIn分析有一些問題需要注意。首先是LinkedIn上面的資訊都是使用者自述的。其次,LinkedIn的代表性對一些國家來說並不足。

LinkedIn自稱有44%的美國人在上面有簡歷,加拿大的佔比也有38%。但俄羅斯的佔比比卻只有5%,而中國更是隻有3%。

不過對於使用LinkedIn活躍的國家來說,LinkedIn上面的活動能夠為AI領域的人才規模和興趣改變提供洞察。就本次調查而言,我們發現機器學習專業出現了顯著的提升。這有可能是反映出一個日益重視AI技能與專業知識的市場推動了人才庫的擴張。

全球的AI人才熱點
中國

從會議作者資料看,約11%的會議作者是在中國培養的,也有相同比例的作者是為中國僱主工作。在樣本中中國佔領女性作者的12%,其中有14%發表了最有影響力的研究。2018年在頂級會議上發表論文的作者當中,有13%屬於高影響力群體。

在AI方面,中國有著若干優勢。其中包括大規模的資料,具有活力的創業環境,政府支援等。根據清華大學 2018年6約釋出的《中國人工智慧發展報告》,中國在論文總量和高被引論文數量上都排在世界第一,中國已經成為全球人工智慧專利佈局最多的國家,風險投資上,中國人工智慧領域的投融資佔到了全球的60%,成為全球最“吸金”的國家。但是,在頂級AI人才這個關鍵方面佔比較低(排名依次是美國、英國、德國、法國、義大利和中國)。而在人才總量,方面,該報告認為中國僅次於美國。但是有跡象表明中美之間的差距很快就會縮小:Allen Institute for Artificial Intelligence(艾倫人工智慧研究所)最近的一項研究發現,到2020年,中國的高影響力出版物就將超過美國。這也許就是中國的AI戰略將培養頂級人才列為優先事項的原因之一。

這項戰略的部分內容似乎是將海外工作的中國研究人員帶回中國。2008年,中國推出了“千人計劃”,旨在吸引著其他國家工作的外國和中國研究人才。在提供傑出研究崗位、獎金補貼的激勵下,千人計劃成功地吸引了成千上萬的研究人員將自己的工作帶到中國,其中絕大部分都是來自美國。與此同時,中國還建設了超過300座“創業園區”,讓海外學生和人員回國。

來自美國國家科學基金會的資料表明,相對於之前,稱學成後願意留下來的在美國獲得數學或者電腦科學博士學位的中國博士生佔比下降了。2012至2015年期間,中國學生佔到了非美國籍的赴美留學博士生的42%,其中有87%的人說打算留下來,說絕對要留下來的比例也有57%。儘管表示學成後要留在美國的中國學生的佔比仍高於世界平均水平,但相對於2004到07年期間,這兩個數字實際上是下降了,那段時間表達留下來意願的佔比為91%,說絕對會留下來的佔到了65%。這些資料表明,在美國修完數學和電腦科學博士學位的海歸正在越來越多。

像千人計劃這樣的人才招募計劃,再加上AI領域空前的投資所帶來的商業機會,正在成為部分研究人員考慮將實驗室遷往中國的激勵因素。另一個考慮因素是所謂的“竹子天花板”:亞裔的STEM畢業生得到外國公司的僱用可能很容易,但是晉升卻不能像部分同事那麼容易。2015年對Google、惠普、英特爾、LinkedIn以及Yahoo進行的一項僱用資料研究表明,儘管亞裔佔到這些公司專業勞動力的27%,但主管的佔比卻只有14%。

美國

在超過36500份LinkedIn簡歷的樣本里面,有將近一半(15747)是在美國的。其中很大一部分(約20%)目前或者之前在微軟(1077)、IBM(667)、Google(697)、Amazon(511)以及或者蘋果(393)工作。這些簡歷當中 87%都有至少6年的經驗,而且幾乎全都(97%)稱有至少3年的經驗。這個人才庫當中約有1/3都是在舊金山灣區工作。

在會議資料方面,美國幾乎在每一個指標的絕對數方面都是領先的。在美國受教育的人佔到了樣本論文作者的將近一半(44%)。受僱美國公司或大學的佔比達到了46%。在女性群體扎伊佔比甚至更高:資料集的的4085名女性當中,有1960(48%)是為美國僱主工作的。在美國機構工作的高影響力(論文被引用數排名靠前)作者佔到了60%。高影響力人才佔到了美國AI人才的13%。其中學術家佔領84%,產業界佔16%。

美國在若干指標領先並不出奇。一方面,美國在基礎AI研究上依舊領先。據李開復的說法,美國致力於在未來30到40年維持“研究領導力”和研究生教育方面的全球領先優勢。

此外,美國公司和美國政府在AI研發方面的投入很大。Facebook、蘋果、微軟、Google和Amazon這些美國巨頭均在機器學習方面加倍下注。OECD 2018年12月釋出的一份報告稱,無論是從交易額和交易數量來看,自從2011年以來,絕大部分的AI初創企業股權投資都流向美國公司。美國軍方也在積極投入AI研究:比方說DARPA在2018年11月就宣佈未來5年投入20億美元用於“創造第三波AI技術潮的新老計劃”。

結論

我們的2019 全球AI人才報告表明,過去一年,AI領域的作者數、具有重大影響的科學論文數、以及自稱的AI專家數均有了顯著提升。不過女性的名額依舊不足,但有一些國家在性別均衡方面表現得更加出色。從人才分佈的地緣情況看,美國在幾乎每一個指標的絕對數方面都是領導者。但這個領域無疑是非常國際化的,每一個本地生態體系都有獨特的優勢和戰略。專注於培養這一領域專業人士的國家正在幫助將AI人才庫的蛋糕做大,從而推動本領域向前發展。

來自:機器學習研究會訂閱號