從2010年-2021年,儘管AI論文跨國合作的步伐已經放緩,但是自2010年以來,美國和中國的人工智慧研究合作數量增加了大約4倍,比中國和英國合作總數多2.5倍。

然而,從2020年-2021年,中美合作的總數僅增長了2.1%,是自2010年以來的最小同比增長率。

此外,人工智慧論文的總數自2010年以來翻了一番以上。從2010年的20萬篇增長到2021年的近50萬篇(49601)。

就AI論文發表的型別來看, 2021 年,所有已發表的AI論文中有60%是期刊文章,17%是會議論文,13%來自儲存庫。

雖然在過去12年中期刊和儲存庫論文分別增長了3倍和26.6倍,但會議論文的數量自2019年以來有所下降。

模式識別、機器學習和計算機視覺依舊是人工智慧領域研究的熱門話題。

中國在期刊、會議和儲存庫論文總量方面依舊處於領先地位。

美國在人工智慧會議和儲存庫引用方面仍然領先,但這些領先優勢正被慢慢削弱。儘管如此,世界上大多數的大型語言模型和多模態模型(2022年54%)是由美國機構產生的。

中國霸榜AI頂會,但引用量低於美國

AI期刊論文的發表,中國始終保持領先地位,2021年為39.8%,其次是歐盟和英國(15.1%),然後是美國(10.0%)。

自2010年以來,中國人工智慧期刊論文被引頻次佔比逐步上升,歐盟、英國、美國均有所下降。中國、歐盟和英國、美國佔全球總引用量的65.7%。

那麼,世界頂會論文發表的情況又如何?

2021年,中國以26.15%的比例在全球AI頂會發表的論文數所佔份額最大,而歐盟和英國以20.29%緊隨其後,美國以17.23%位居第三。

從頂會論文引用量來看,中國雖然高產,但引用量相較於美國來說較低。美國頂會論文引用量23.9%,中國為22.02%。

從側面可以看出,中國論文發表數量最多,但質量不如美國高。

在AI論文儲存庫提交方面,美國在世界居首,23.48%。中國最低,11.87%。

中國9所機構,AI論文發表趕超MIT

2021年,發表論文總量世界前十機構中,中國佔了9所,不同機構發表的論文總數如下圖,MIT位列第十,發表論文1745。

就計算機視覺領域(CV)來看,中國的十所機構位居世界前十,它們分別是,中國科學院、上海交通大學、中國科學院大學、清華大學、浙江大學、北京航空航天大學、武漢大學、北京理工大學、哈爾濱工業大學,以及天津大學。

在自然語言處理(NLP)領域,就有所不同了。

世界前十的機構/公司有:中國科學院、卡內基梅隆大學、微軟、清華大學、卡內基梅隆大學-澳大利亞分校、谷歌、北京大學、中國科學院大學、阿里、亞馬遜。

工業界領先學術界

在2022年釋出的重要人工智慧機器學習系統中,語言系統佔最多,有23個,是多模態系統數量的6倍。

在論文產量上,工業界領先於學術界。

直到2014年,大多數重要的模型都是由學術界釋出的。從那時起,工業界便逆襲翻身。到2022年,32個重要的機器學習模型都誕生在工業界,而學術界僅有3個。

由此可見,與非營利組織和學術界相比,構建最先進的人工智慧系統越來越需要大量的資料、計算機能力和資金資源,而行業參與者固然有更多的資金資源去做這件事情。

2022年,美國產生了數量最多的重要機器學習系統,有16個,其次是英國(8個)和中國(3個)。

此外,自2002年以來,就建立的重要機器學習系統總數而言,美國已經超過了英國和歐盟、中國

再來看做出這些重要AI系統背後研究者國分佈,美國有最多的研究者,285人,是英國的2倍多,是中國的近6倍。

LLM越來越大,算力越貴

大型語言和多模態模型,有時稱為基礎模型,是當前一種新興且日益流行的AI模型型別,它在大量資料上進行訓練並適用於各種下游應用程式。

ChatGPT、DALL-E 2和MakeA-Video等大型語言和多模態模型已經展示了令人印象深刻的功能,並開始在現實世界中廣泛部署。

透過對這些模型作者的國家隸屬關係進行了分析,這些研究人員中的大多數來自美國機構(54.2%)。

史丹佛AI指數報告還列出了大型語言和多模態模型釋出的時間表。

大型語言模型正變得越來越大,也越來越昂貴。

第一個大型語言模型GPT-2於2019年釋出,有15億引數,訓練成本約50000美元。谷歌PaLM是2022年推出的大型語言模型之一,有5400億引數,成本高達800萬美元。

從引數和訓練成本來看,PalM比GPT-2大360倍,成本高出160倍。

不僅僅是 PalM,從整體上看,大型語言和多模態模型變得越來越大和昂貴。

例如,DeepMind於2022年5月推出的大型語言模型Chinchilla估計耗資210萬美元,而BLOOM的訓練大約耗資230 萬美元。

隨著時間的推移,GAN在人臉生成方面的進展,最後一個影像由Diffusion-GAN生成,這一模型在STL-10上取得了最新的SOTA。

文字來自:新智元

PDF版本將分享到199IT知識星球,掃描下面二維碼即可下載!