三分鐘看完關於 ChatGPT 的技術概括

Ljzn發表於2023-03-01

最近一段時間 OpenAPI 的人工智慧聊天機器人 ChatGPT 火了,在全球擁有百萬使用者,無數投資人的青睞有加,掀起自媒體一場狂歡。在ChatGPT釋出以後,其公司 OpenAI 的市值已經超過了 290 億美元。

在這裡我想簡單地聊一聊 ChatGPT 背後依賴的技術,再暢想一下它對我們這個世界可能帶來的改變。

supervised learning (監督學習)

監督式學習是一種機器學習的正規化,它表示所有的輸入樣本都有標註標籤。以往的一些機器學習應用,例如:識別圖片中的物體,語音轉文字,文字識別等等,大部分是採用了這種學習正規化。

在 ChatGPT 的訓練過程中,工作人員會與AI進行對話,以人工的方式進行標註。

reinforcement learning (強化學習)

強化學習是有別於監督學習的另一種機器學習正規化,它能夠使 AI 自主地尋找最優方案。它的特點是不再需要標註好的樣本,也不需要人工地去糾正行為。AI 會在已知與未知之間找到平衡點。一些對抗性的人工智慧應用,比如:會打Dota的AI,著名的圍棋AI alphago 等等,都是使用這種學習正規化。

在 ChatGPT 的訓練過程中,人類先給 AI 的對話回覆進行打分,之後根據這些打分生成一個評分模型,之後便可以訓練 AI 去獲得更高的評分。

訓練所用的硬體裝置

ChatGPT 的訓練過程是預先完成好的,在微軟的 Azure 雲的超級計算基礎設施上完成。

大型語言模型的降臨

大型語言模型彷彿一種外星生物降臨在地球上,引起了人們的好奇和恐懼。它在博覽群書之後,彷佛已經擁有了人類全部的智慧結晶。但也有人說,ChatGPT 不過是一個只會尋章摘句的書袋子,無法有自己的創新能力。

各種觀點都有道理,我認為大型語言模型的潛力是顯而易見的,它能勝任很大一部分的對話工作,例如:客服,櫃檯服務人員等等。我認為目前對 ChatGPT ,或者所對所有大型AI 的制約主要來自於它們無法像人類一樣接觸現實世界,因為實踐是檢驗真理的唯一標準,AI 從網際網路上獲得的內容是輸入性質的,AI 自己產生的輸出沒有得到現實世界的有效反饋。(據說 ChatGPT 已經在蒐集使用者的對話反饋,或許當反饋達到一定量級之後會產生質變)。

設想一下,假如 AI 能夠實時地觀測現實世界的最新變化,並且參與到社會活動中,例如,進行化學實驗,經營一家公司,做出股票投資,甚至管理一座城市等等。它就能夠從實踐中進行學習,再結合過往的知識,不斷修正,產生新的知識。

我期待看到第一篇由 AI 發表的論文,第一個由 AI 完全負責的基金(如果能推出一定會賣爆,畢竟投資界一貫的格言是要擺脫人性),第一家由 AI 負責決策的公司。當然,這後面必須是有具體的人類進行負責的,例如公司“法人”的概念,畢竟 AI 即便成為犯罪的藉口,也不能代替人去坐牢。

總結

科技發展是一個螺旋上升的路徑,在山重水複疑無路時,會柳暗花明,但在眾人追捧的時候又有可能陷入困境,對 AI 的發展,我們保持樂觀,也保持冷靜。

相關文章