Andrej Karpathy最新激進觀點:Transformer將超越人腦

机器之心發表於2024-09-06
還說 AI 可能會與人類融合……

前些天,OpenAI 前首席科學家 Ilya Sutskever 創立的新公司獲得 10 億美元投資的新聞刷遍了各大新聞頭條,而 OpenAI 的另一位早期成員和著名 AI 研究者 Andrej Karpathy 則正在「AI+教育」賽道耕耘,其創立的 Eureka Labs 公司正在積極打造其第一款產品。

近日,播客節目 No Priors 釋出了對這位著名 AI 研究者的專訪影片。Andrej Karpathy最新激進觀點:Transformer將超越人腦

來自:No Priors

Andrej Karpathy 曾是 OpenAI 的早期成員之一,之後加入特斯拉領導其自動駕駛的計算機視覺團隊。之後他又回到過 OpenAI,領導著一個專注提升 ChatGPT 的GPT-4 的小團隊。今年 7 月,他宣佈創立了一家名為 Eureka Labs 的 AI+教育公司。

在這個節目中,Andrej Karpathy 分享了有關研究、新公司以及對 AI 未來的期待,其中不乏頗為激進的觀點,比如他認為 Transformer 很快就將在效能上超越人類大腦、我們已經在特定的領域實現了有限的 AGI、AI 會成為人類新的大腦皮層……這些觀點已經在網上引起了不少的討論和爭議。
圖片自動駕駛是 AGI 以及 Waymo vs 特斯拉

首先,Andrej Karpathy 談到了完全自動駕駛汽車。他說自己在自動駕駛領域工作了 5 年時間,也經常將 AGI 與自動駕駛放在一起類比。他說:「我確實認為我們已經在自動駕駛領域實現了 AGI。」因為現在在舊金山等城市已經有了一些付錢就能乘坐的自動駕駛汽車。這實際上已經成為了一種服務產品。

他還分享了自己十年前乘坐 Waymo 自動駕駛的經歷:「十年前一位在那裡工作的朋友給我展示了一個 demo,它帶我在街區繞了一圈。而十年前它幾乎就已經是完美的了,但它還是用了十年時間才從 demo 變成可付費使用的產品。」

他表示,之所以用了這麼長時間,一方面是技術原因:demo 和產品之間確實存在巨大差距;另一方面則是監管方面的原因。不過要實現自動駕駛的全球化,還有很長的路要走。

至於 Waymo 和特斯拉哪家強?Karpathy 表示:「人們認為 Waymo 位元斯拉領先,但我認為特斯拉領先於 Waymo。」他表示非常看好特斯拉的自動駕駛專案。而對於這兩家公司的問題,他認為特斯拉的問題在於軟體,而 Waymo 的問題是硬體。對比之下,軟體問題其實更好解決。特斯拉的汽車已經在全世界銷售,因此當技術成熟時,特斯拉能更好地實際部署它們。Karpathy 說自己昨天才駕駛過最新的版本,體驗非常好,感覺很神奇(miraculous driving)。

他說 Waymo 目前在自動駕駛方面看起來領先,但如果以 10 年為尺度長遠來看,特斯拉更可能領先。圖片
特斯拉自動駕駛功能演示

我們知道,Waymo 和特斯拉採用了不同的技術方法論:
  • Waymo自動駕駛汽車採用了大量昂貴的鐳射雷達和各式各樣的感測器,從而為其軟體系統提供全方面的資訊支援。

  • 特斯拉則是使用相機,從而能極大地降低系統的複雜性和成本。

對此,Karpathy 表示其實特拉斯也會使用大量昂貴的感測器,但只是在訓練時這樣做——系統可以藉此完成地圖測繪等工作。然後再將其蒸餾成一個測試包,並將其部署到只使用視覺訊號的系統中。「我認為這是一個睿智的策略。我認為這種策略的效果能得到證明,因為畫素具備足夠資訊,其網路也有足夠能力。」

之後他提到了神經網路的重要性。一開始的時候,特斯拉的系統中包含大量人工編寫的 C++ 程式碼,之後神經網路的比重越來越大——先是執行影像檢測,然後進行預測,之後更是能發出轉向等指令。

他表示,特斯拉最終的自動駕駛系統(比如十年之後)就是一個端到端的神經網路。也就是說,向其輸入影片,它就直接給出命令。

人形機器人以及機器人公司特斯拉

Andrej Karpathy 在離開特斯拉之前也參與研究過特斯拉的人形機器人。他認為這是將能改變一切的研究方向。

他說:「汽車其實就是機器人。我認為特斯拉不是一家汽車公司。這有誤導性。這是一家機器人公司,大規模機器人公司,因為規模也像一個完全獨立的變數。他們不是在製造東西,而是在製造製造東西的機器。」

實際上,人形機器人 Optimus 的早期版本與特斯拉的汽車區別不大——它們有完全一樣的計算機和攝像頭。在其中執行的網路也是汽車的網路,當然其中需要做一些微調,使其適應步行空間。

圖片當伊隆·馬斯克決定做人形機器人時,各種 CAD 模型和供應鏈等等都是現成的,可以從汽車生產線直接拿過來重新配置,就像是電影《變形金剛》中那樣——從汽車變成了機器人。

至於人形機器人的第一個應用領域,Karpathy 說:「我認為 B2C 並不是一個正確的起點。」他表示特斯拉的人形機器人最好的客戶就是特斯拉自己。這能避免很多麻煩,同時還能檢驗成果。等產品孵化成熟之後,再進入 B2B 市場,為那些擁有巨大倉庫或需要處理材料的公司提供服務。最後才是面向消費者的 B2C 市場。

當被問到為什麼要做人形機器人時(因為人形可能並不是完成任務的最佳形態),他說:「我認為人們可能低估了進入任何單一平臺的固定成本和複雜性。我認為任何單一平臺都有很大的固定成本,因此我認為集中化,擁有一個可以做所有事情的單一平臺是非常有意義的。」

而人形是我們熟悉的形態,可以幫助研究者更好地判斷操作和採集資料,畢竟我們人類自身就已經證明了人形形態的有效性。另外,人類社會也是為人類設計的,人形平臺可以更好地適應這一點。當然,他並不否認這些形態未來可能發生變化。

他強調了遷移學習的重要性。不管形態如何,如果能有一個能遷移到不同形態的神經網路,從而繼承原有的智慧和能力,必定會大有用途。

Transformer 可能超越人腦

Andrej Karpathy 稱讚了 Transformer 的獨特之處:「它不僅僅是另一個神經網路,而是一個驚人的神經網路。」正是因為 Transformer,規模擴充套件律(scaling laws)才真正得以體現。

Transformer 就像是通用型訓練計算機,也就是可微分的計算機。「我認為這實際上是我們在演算法領域偶然發現的神奇事物。」當然其中也有個人的創新,包括殘差連線、注意力模組、層歸一化等等。這些東西加起來變成了 Transformer,然後我們發現它是可訓練的,也能具有規模擴充套件律。

Karpathy 表示 Transformer 還遠沒到自己的極限。現在神經網路架構已經不是阻礙我們發展的瓶頸了,新的改進都是基於 Transformer 的微小變化。現在的創新主要集中在資料集方面。

網際網路資料很多,但 Karpathy 表示這並不是適合 Transformer 的資料。不過網際網路上也確實有足夠的推理軌跡和大量知識。現在很多的研究活動都是為了將這些資料重構成類似內心獨白的格式。

使用合成資料也能大有助益。所以很有趣的一點是:現在的大模型正在幫助我們創造下一代大模型。

不過他也警告了合成資料的風險。合成資料往往多樣性和豐富度不足。為此人們想出了一些辦法,比如有人釋出了一個個性資料集,其中包含 10 億個不同背景的人物個性。在生成合成資料時,可以讓這些不同個性去探索更多空間,從而提升合成資料的熵。

接下來,Karpathy 說雖然 Transformer 和人腦應當謹慎類比,但他認為 Transformer 在很多方面已經超過了人腦。他說:「我認為它們實際上是更高效的系統。它們不如人腦工作的原因主要是資料問題。」比如在記憶力方面,Transformer 可以輕鬆記住輸入的序列,而人腦的工作記憶很小,記憶力表現差得多。雖然人腦的工作機制還沒被完全揭示,但可以說它是一種非常隨機的動態系統。「我確實認為我們可能會擁有比人腦更好的(Transformer),只是目前還沒有實現。」

AI 增強人類以及與人類的融合

AI 能提升人類的生產力和效率,但 Andrej Karpathy 認為 AI 的成就將遠不止此。他引用了賈伯斯的名言:「計算機是人類心智的腳踏車。」

他表示,計算機與人類實際上已經有一點融合了。比如我們隨身攜帶的智慧手機,現在許多人完全無法離開手機,否則甚至會感覺自己智力都下降了。另一個例子是導航軟體讓許多人失去了記憶道路的能力,甚至在自家附近也要導航。他表示翻譯軟體也正漸漸讓人們失去直接使用外語溝通的能力。

他說,自己曾看過一個小孩子在雜誌進行滑動操作的影片。我們覺得很自然的技術可能在新一代人眼中並不自然。

但如果要實現更高階的融合,還有一些 I/O 問題有待解決。實際上,NeuraLink 就正在做這方面的研究。

他說:「我不知道這種融合會是什麼樣子。可能會像是在我們的大腦皮層上再構建額外一層皮層。」不過這個皮層可能在雲端。

當然,這又會引發對生態系統的擔憂。想象一下,如果你的「新皮層」 是寡頭壟斷的封閉平臺,你肯定不會放心。好在我們也有 Llama 等開放平臺。與加密貨幣社群的「不是你的金鑰就不是你的幣」類似,Karpathy 表示,「不是你的權重就不是你的大腦」。

現在的大模型引數過剩

當被問到蒸餾小模型方面的問題,Karpathy 認為當前的模型浪費了大量容量來記憶無關緊要的事情,原因是資料集沒有經過精細化的調整(curation)。而真正用於思考的認知核心(cognitive core)可以非常小,如果它需要查詢資訊,它會知道如何使用不同的工具。

至於具體的大小,Karpathy 認為會是數十億的引數量,這可以透過對大模型執行蒸餾來獲得。這就類似於網際網路資料。網際網路資料本身可能是由 0.001% 的認知資料和 99.999% 的相似或無用資訊構成的。

當這些模型發揮作用時,它們並不會孤軍奮戰,而是會協同合作,各自處理自己擅長的任務。這就像是一家公司,他打了個比方,LLM 們會有不同的分工,有程式設計師和產品經理等。

Karpathy 的教育事業

Andrej Karpathy 離開 OpenAI 後一頭扎進了「AI+教育」領域。他說:「我一直是一名教育工作者,我熱愛學習和教學。」他談到了自己的願景。他認為 AI 領域現在很多工作的目的是取代人,但他更感興趣的是以 AI 賦能人類。

圖片

Karpathy 宣佈成立「AI+教育」公司 Eureka Labs 的推文

他說:「我正在努力打造一門單一課程。如果你想了解 AI,你只需要看這個課程。」

GitHub 連結:https://github.com/karpathy/LLM101n
(但請注意,課程還沒上線。)

他談到自己曾經在史丹佛大學教過二三十門課程,那是最早的深度學習課程,也很成功。但問題是如何將這些課程普及化,讓地球上說不同語言、有不同知識體系的 80 億人都能理解。對於這樣的任務,單一的教師不可能辦到,而 AI 卻能很好地做到這一點,實現真正的一對一教學。這時候人類教師就不必接觸學生了,只需在後端設計課程;AI 會成為教學的前端——它可以說不同的語言,針對學生的具體情況進行教學。Karpathy 認為這是目前可以做到的事情,只是目前還沒人把它做出來。

這是一個已經成熟正待摘取的果實。目前在 AI+教育這一賽道上,AI 已經在翻譯方面卓有成效,而且已經有能力實現實時現場翻譯。

他認為,AI 有望幫助實現教育的普及或者說知識的民主化。

在被問到這門課程大概什麼時候上線時,Karpathy 說大概會在今年晚些時候。但他也說現在讓他分心的事情很多,所以也可能會在明年初。

對於現在的孩子們該學習什麼,他也給出了自己的建議:數學、物理學和電腦科學等學科。他說這些有助於提高思維技能。「在這個前 AGI 時代,這些會很有用。」

參考連結:
https://www.youtube.com/watch?v=hM_h0UA7upI

相關文章