近日,由李飛飛聯合領導的史丹佛大學以人為本人工智慧研究所(Stanford HAI)釋出了《2024 年人工智慧指數報告》(Artificial Intelligence Index Report 2024)。這份長達 300 多頁的報告是 Stanford HAI 釋出的第 7 份 AI Index 研究,追蹤了 2023 年全球人工智慧的發展趨勢。

Stanford HAI 官方介紹道,‘這是我們迄今為止最全面的報告,而且是在人工智慧對社會的影響從未如此明顯的重要時刻釋出的。’

Stanford HAI 研究專案主任 Vanessa Parli 表示,‘我認為最令人興奮的人工智慧研究優勢是將這些大型語言模型與機器人或智慧體(agent)相結合,這標誌著機器人在現實世界中更有效地工作邁出了重要一步。’

附上《2024 年人工智慧指數報告》下載地址:

https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf

與往年不同,Stanford HAI 今年擴大了研究範圍,更廣泛地涵蓋了人工智慧的技術進步、公眾對該技術的看法等基本趨勢。新報告揭示了 2023 年人工智慧行業的 10 大主要趨勢:

1.人工智慧在某些任務上勝過人類,但並非在所有任務上

人工智慧已在多項基準測試中超越人類,包括在影像分類、視覺推理和英語理解方面。然而,它在競賽級數學、視覺常識推理和規劃等更復雜的任務上依然落後於人類。

2.產業界繼續主導人工智慧前沿研究

2023 年,產業界產生了 51 個著名的機器學習模型,而學術界只貢獻了 15 個。2023 年,產學合作還產生了 21 個著名模型,創下新高。此外,108 個新發布的基礎模型來自工業界,28 個來自學術界。

3.前沿模型變得更加昂貴

根據 AI Index 的估算,最先進的人工智慧模型的訓練成本已經達到了前所未有的水平。

例如,OpenAI 的 GPT-4 估計使用了價值 7800 萬美元的計算資源進行訓練,而 Google 的 Gemini Ultra 的計算成本則高達 1.91 億美元。

相比之下,幾年前釋出的一些最先進的模型,即原始 transformer 模型(2017 年)和 RoBERTa Large(2019 年),訓練成本分別約為 900 美元和 16 萬美元。

4.美國成為頂級人工智慧模型的主要來源國

2023 年,61 個著名的人工智慧模型源自美國的機構,超過歐盟的 21 個和中國的 15 個。

美國也仍然是人工智慧投資的首選之地。2023 年,美國在人工智慧領域的私人投資總額為 672 億美元,是中國的近 9 倍。

然而,中國依然是美國最大的競爭對手,中國的機器人安裝量居世界首位;同樣,世界上大多數人工智慧專利(61%)都來自中國。

5.嚴重缺乏對 LLM 責任的可靠和標準化評估

AI Index 的最新研究顯示,負責任的人工智慧嚴重缺乏標準化。包括 OpenAI、 Google 和 Anthropic 在內的領先開發商主要根據不同的負責任人工智慧基準測試他們的模型。這種做法使系統地比較頂級人工智慧模型的風險和侷限性的工作變得更加複雜。

6.生成式人工智慧投資激增

儘管去年人工智慧私人投資整體下降,但對生成式人工智慧的投資激增,比 2022 年(約 30 億美元)增長了近八倍,達到 252 億美元。

生成式人工智慧領域的主要參與者,包括 OpenAI、Anthropic、Hugging Face 和 Inflection,都獲得了一輪可觀的融資。

7.資料顯示,人工智慧讓打工人更有生產力,工作質量更高

2023 年,多項研究評估了人工智慧對勞動力的影響,表明人工智慧可以讓打工人更快地完成任務,並提高他們的產出質量。

這些研究還表明,人工智慧有可能縮小低技能和高技能工人之間的技能差距。還有一些研究警告說,在沒有適當監督的情況下使用人工智慧可能會起到負面作用。

8.得益於人工智慧,科學進步進一步加速

2022 年,人工智慧開始推動科學發現。然而,2023 年,與科學相關的更重要的人工智慧應用啟動——使演算法排序更高效的 AlphaDev、促進材料發現過程的 GNoME、可在一分鐘內提供極其準確的 10 天天氣預報的 GraphCast、成功對 7100 萬種可能的錯義突變中的約 89% 進行分類的 AlphaMissence。

如今,人工智慧現在可以完成人類難以完成的、但對解決一些最複雜的科學問題至關重要的粗暴計算。在醫療方面,新的研究表明,醫生可以利用人工智慧更好地診斷乳腺癌、解讀 X 射線和檢測致命的癌症。

9.美國的人工智慧法規數量急劇增加

2023 年,全球立法程式中有 2175 次提及人工智慧,幾乎是上一年的兩倍。美國人工智慧相關法規的數量在過去一年大幅增加。2023 年,與人工智慧相關的法規有 25 項,而 2016 年只有 1 項。

僅去年一年,人工智慧相關法規的總數就增長了 56.3%。其中一些法規包括生成式人工智慧材料的版權指南和網路安全風險管理框架。

10.人們對人工智慧的潛在影響有了更深刻的認識,同時也更焦慮

來自市場研究公司 Ipsos 的一項調查顯示,在過去一年中,認為人工智慧將在未來 3-5 年內極大地影響他們生活的人,比例從 60%上升到 66%。此外,52% 的人對人工智慧產品和服務表示焦慮,比 2022 年上升了 13 個百分點。

在美國,來自皮尤研究中心(Pew)的資料顯示,52% 的美國人表示對人工智慧的擔憂多於興奮,這一比例比 2022 年的 38% 有所上升。

附:來自AI Index 聯合主任 Ray Perrault 的一封信

十年前,世界上最好的人工智慧系統也無法以人類的水平對影像中的物體進行分類。人工智慧在語言理解方面舉步維艱,也無法解決數學問題。如今,人工智慧系統在標準基準上的表現經常超過人類。

2023 年,人工智慧進步加速。GPT-4、Gemini 和 Claude 3 等先進模型展示出了令人印象深刻的多模態能力:它們可以生成數十種語言的流暢文字,處理音訊,甚至可以解釋備忘錄。

隨著人工智慧的進步,它也越來越多地進入我們的生活。公司競相打造基於人工智慧的產品,普通大眾也越來越多地使用人工智慧。但是,當前的人工智慧技術仍然存在重大問題。它無法可靠地處理事實、進行復雜的推理或解釋其結論。

人工智慧面臨兩個相互關聯的未來。第一個,技術不斷改進,應用日益廣泛,對生產力和就業產生重大影響。人工智慧的用途有好有壞。第二個,人工智慧的應用受到技術侷限的制約。

無論是哪一種,政府都越來越關注。政府正在積極參與,鼓勵人工智慧的發展,比如資助大學研發和激勵私人投資。政府還致力於管理潛在的不利因素,如對就業的影響、隱私問題、錯誤資訊和智慧財產權。

在技術方面,今年的 AI Index 報告稱,2023 年全球釋出的新大型語言模型數量比上一年翻了一番。三分之二的模型是開源的,但效能最高的模型來自擁有封閉系統的行業參與者。

Gemini Ultra 成為首個在大規模多工語言理解(MMLU)基準上達到人類水平的 LLM;自去年以來,模型在該基準上的效能表現提高了 15 個百分點。此外,GPT-4 在綜合語言模型整體評估(HELM)基準上取得了令人印象深刻的 0.97 平均勝率分數。

雖然全球對人工智慧的私人投資連續第二年減少,但對生成式人工智慧的投資卻急劇上升。財富 500 強企業財報電話會議中提及人工智慧的次數比以往任何時候都多,而且新的研究表明,人工智慧明顯提高了打工人的生產率。

在政策制定方面,全球在立法程式中提及人工智慧的次數前所未有。美國監管機構在 2023 年透過的人工智慧相關法規比以往任何時候都多。儘管如此,許多人仍對人工智慧生成深度偽造等能力表示擔憂。公眾對人工智慧有了更多的認識,研究表明,他們的反應也是焦慮的。

自 學術頭條