導語 | 編寫程式碼、翻譯小說、參加考試……2022 年末,人工智慧聊天機器人 ChatGPT 風靡全網。自 2016 年 AlphaGo 擊敗圍棋世界冠軍李世石後,ChatGPT 再次掀起了人工智慧發展應用的高潮。它將會給我們帶來哪些影響?人工智慧的顛覆性應用是否即將來?ChatGPT 的未來發展潛力及前景如何?我們特邀騰訊雲 TVP、PreAngel 合夥人 李卓桓老師,以 ChaBot 領域專家視角,分享他對ChatGPT 發展的獨到見解。
作者簡介
李卓桓,騰訊雲 TVP,PreAngel 合夥人,專注人工智慧領域的聊天對話創業機會和早期專案。zixia BBS、優酷網(首席科學家)、嘰歪網創始人,水木清華 BBS 站長。清華大學本科,中歐國際工商學院 EMBA。15 年網際網路創業經驗,多家創業公司和 VC 機構顧問。創業邦、創業家、新浪網等媒體都對他作過創業特別報導。25 年程式設計經驗,曾任 ChinaRen 系統工程師。Microsoft Regional Director,Google 認證機器學習開發者專家(ML GDE, Machine Learning Google Developer Expert)。活躍在 Open Source 社群,創立釋出的 Chatbot SDK 開源專案 Wechaty 已在 GitHub 上擁有近萬 Stars 數。榮獲 2020 年中國優秀開源專案,中國開源先鋒等獎項。《Chatbot 從 0 到 1》、《簡明的 TensorFlow 2》聯合作者。
其它兩位聯合作者:
Siky Lin,畢業於史丹佛大學資料傳媒系,曾就職於矽谷多家著名風投機構與獨角獸,現任矽谷獨角獸 Moveworks 市場戰略高階經理;
ChatGPT by OpenAI: 以下全文由 ChatGPT 輔助撰寫。
一、ChatGPT:人工智慧技術的重大突破
隨著近來 ChatGPT 的爆紅,很多程式設計師都爭先恐後去領略它的超高情商和巨大威力,而 ChatGPT 輸出的答案或偶爾幽默,或時而深刻,我們甚至很難分清與它對話的究竟是人還是機器。
實際上,人工智慧(AI)在過去幾年承載了許多希望與失望。一開始很多人認為 AI 可以如電影所設想那樣在不遠的將來改變世界,甚至比人類更強從而統治主宰人類世界。然而在過去幾年我們發現,現有科技能開發出來的 AI 只能替代人類從事一些最基礎的生產活動,僅僅停留於一個三歲嬰兒般的智力。而開發這樣一個“人工智障”,我們需要花費大量的資本支援來突破極限的算力跟最頂級的科學家做最前沿的研究。這與之換來的結果卻是投資人寄予厚望的高估值科技公司在過去幾年並未能開發出大家期待的 AI 產品。
其實,推出 ChatGPT 的是矽谷一家於 2015 年初創的公司 OpenAI,它在成立後便默默研發其人工智慧技術。雖然公司花費了大量投資人的資金,同時也聚集了最頂級的科學家研發,然而外界對 OpenAI 的研發進展卻始終所知甚少。
然而,就在兩個月前,OpenAI 推出了接近通用人工智慧的產品 ChatGPT,這是一款基於聊天介面的 Chatbot,在 2022 年 12 月 2 日開放免費試用網頁版後,上線短短 5 天,使用者數量已突破百萬。這款產品的試用結果鋪天蓋地,且在社交媒體上大受歡迎,各種技術大牛和行業領軍人物紛紛分享他們的使用體驗。
(圖1,一個 ChatGPT 為部落格起標題的例子)
ChatGPT 的推出無疑標誌著人工智慧技術的重大突破,OpenAI 的研發團隊在經過多年的不懈努力和研究之後終於成功打造出一款具有高度自然語言處理能力的人工智慧產品。這款產品具有非常高的自然語言理解和生成能力,可以幫助使用者在日常對話中進行有效溝通。並且,這款產品還具有非常強大的學習能力,能夠不斷地學習和改進自己的知識體系。
在 OpenAI 釋出這款產品後,人們除了對此感到震驚、興奮外,甚至還有些恐慌。原因在於這款產品作為人工智慧技術領域中罕見的突破之一,它不僅讓我們看到了人工智慧未來發展的曙光,也讓我們窺探到了人類未來在人工智慧驅動下將如何發展。ChatGPT 的推出不僅為 OpenAI 公司帶來了巨大成功,也為人工智慧行業的發展鋪平了道路。
二、風靡全網的ChatGPT為何一夜走紅?
ChatGPT 是 OpenAI 公司開發的自然語言處理模型,它是 GPT(Generative Pre-trained Transformer)系列的最新版本,具有強大的語言理解能力和自然語言生成能力。
過去兩個月時間裡,ChatGPT 在科技領域引起巨大的反響的原因,主要在於它具有以下三個顯著特點:
- 資料量龐大:ChatGPT 模型訓練使用主要來自網際網路的文字資料庫,包括從書籍、網路文字、維基百科、文章和網際網路上的其他文章中獲得高達 570GB 的資料。更準確地說,系統輸入了 3000 億個單詞,這使得它能夠更好地理解和生成人類語言。
- 預訓練技術:ChatGPT 模型採用了預訓練技術,能夠在訓練過程中學習大量的語言知識和經驗,使得它在解決實際問題時更加準確和高效。
- 多工能力強:ChatGPT 模型能夠完成多種自然語言處理任務,如文字生成、問答、機器翻譯等,其中,它在文字生成的任務上表現最為突出。
值得一提的是,ChatGPT 還開放了免費無門檻試用,任何使用者都可以直接體驗它的威力並分享試用體驗。這相當於,OpenAI 每天都要燃燒超過三百萬美金的經費以供大家試用。當然,我們看到的結果也是十分驚人的,它既可以吟詩作賦寫廣告,又可以根據你提的需求寫程式碼。ChatGPT 展現的語言理解和生成能力,絲毫不亞於任何行業初級人員對專業領域的基礎輸出。過去,或許只有專業的 AI 研究人員才能體會其進展,但在現在,我們每一個人都能親自體驗。
其實在 ChatGPT 問世之前,美國不少科技初創公司就已經在使用 GPT 模型,成為 OpenAI 的付費使用者。在此基礎上,OpenAI 巧妙地加了一層可以聊天問答的介面讓大家可以方便簡易地使用,從而命名為 ChatGPT。GPT 作為一種學習訓練了大量資料的基礎模型,主要可以為以下幾個場景賦能:
- 文字生成:如自動生成新聞報導、自動摘要等,可以有效幫助提高文字內容的生成效率。
- 自動問答:如智慧問答系統、聊天機器人等,可以幫助公司提高客戶服務質量跟速度。
- 自動寫作:如文案創作、文章摘要、郵件自動回覆等,可以幫助使用者提高內容創作效率。
Jasper.ai 便是 ChatGPT 的場景應用典型代表,估值 15 億美金的新晉獨角獸 Jasper.ai 直接應用了 GPT 模型,並開發了市場營銷的大量應用場景,可以讓使用者用它直接撰寫廣告標語、部落格、社交媒體帖子和電子郵件等。這讓市場營銷的人員有了一個可以幫他們幹活寫作的小助手,ChatGPT 的基礎版本為每月 40 美金,比僱傭一個實習生還便宜很多。Jasper.ai 目前已經有了超過 10 萬付費使用者,並且在 2022 年實現了超過 100% 的增長。其實,Jasper 的創始人 Dave Rogenmoser 就出身於市場營銷領域,他並不是專攻人工智慧開發的專家,但仍可以借力 ChatGPT 來實現成功。同時,Jasper 也需要面臨許多競爭對手的同質化問題,如Copy.ai,WriteSonic, Peppertype, Wordtune,Simplified 等這些創初公司,它們也都在逐漸推出類似的產品。
(圖2,Jasper.ai 的產品覆蓋簡介)
我們相信在未來幾年,將會有大量基於 GPT 模型的初創公司湧現。因為 GPT 的提升讓許多公司可以極大地減少自己開發人工智慧的底層模型成本,從而可以集中人力物力研究商業應用場景,使產品的推出與迭代更新得更為迅猛。
而 ChatGPT 的出現,毋庸置疑更是把 GPT 模型具象化了,它能夠讓各行業人士直接體會到它的魅力。例如,它可以讓很多不是專業的 AI 開發人員,但對特定垂直領域有深入洞見的人,可以跳過長期艱難的技術開發,透過直接套用 GPT 模型,結合其它如軟體自動化的技術,迅速推出適應於各垂直領域的智慧小助手。這就像當年賈伯斯推出了蘋果智慧手機,雖然引發了科技圈的震動,但短時間內大家並不知道這意味著什麼。直到又過了幾年,我們看到了傳統手機廠商如諾基亞怦然倒下,同時也帶來了轟轟烈烈的移動網際網路時代,大量基於手機應用的初創公司如雨後春筍般湧出,徹底改變了我們的衣食住行。現在的我們難以想象,如果沒有智慧手機的普及,我們出行無法叫車、用餐不能點外賣,購物也難以進行電子支付將會是怎樣的生活。
同時,也有不少人開始質疑 ChatGPT 的推出是否會導致大量已有的 Chatbot 公司消亡。然而,現狀卻是 ChatGPT 把大量現有的 Chatbot 公司帶火了。專注做 Chatbot 的科技公司紛紛宣稱,ChatGPT 將加快他們的研發程式,不僅不會讓他們消亡,反而會讓他們更快地迭代產品,更好地服務客戶。
三、未來GPT模型時代下,科技公司誰與爭鋒?
實際上,OpenAI 創始人 Sam Altman 曾在某採訪中暗示, “中間層”(middle-layer) 的初創公司將會在未來脫穎而出。
假設存在底層和頂層類別的公司,首先,他認為,“底層”(bottom-layer)試圖從零開始構建自己的 LLM (Large Language Model)的公司不太可能成功。因為建造這些模型的成本太高並且沒有必要,這些模型已經可以直接獲得。在當今世界中,這類似於在 AWS 和 Azure 已經存在的情況下建造自己的資料中心。其次,頂層(top-layer)這一類公司將是短暫存在的 API 呼叫者,稱之為頂層公司。這些公司直接使用現成的 GPT 模型進行應用。簡單的直接呼叫其模型 ,沒有其他技術壁壘或者創造超級價值給消費者,這些公司將會有短暫崛起,但終將消亡。除非這些公司能夠找到成為中間層公司的方法。
那麼,“中間層” 公司是什麼,成為它需要什麼?在我看來,中間層公司有幾個關鍵成分:
- 獨特的垂直領域知識或者資料。
- 強大的機器學習基礎設施。
- 垂直領域相關的專業人才。
這種公司將能夠採用 GPT 類模型,並提高這些模型在其垂直領域的效能,比如說在醫學領域跟計算機程式設計領域。在不久的將來,這些中間層公司的應用將看到由 GPT 驅動的獨特高度差異化的用例。使用 GPT 作為基礎模型,並使用專有訓練資料或者垂直領域洞見建立新模型,這將是非常強大的。微調模型並不簡單。矽谷致力於用 Chatbot 解決企業 IT 問題的獨角獸Moveworks 創始人表示,他們已經採用 LLM 並微調它們多年,需要在人員和基礎設施上進行數年的重大研發投資才能實現。
(圖3,Moveworks 釋出的其訓練模型演變路徑)
ChatGPT 雖然看起來好像上通天文下知地理,但在特定領域,它仍然還是個小孩,特別是與專業商業場景結合和缺少公開網路資料的領域,它容易一本正經胡說八道。自從開放免費測試版以來,大家討論最多的問題就是 ChatGPT 是否會成為讓谷歌過時的智慧問答機器人,就像谷歌在過去 10 年顛覆了當年如日中天的雅虎一樣,也許谷歌在不久的將來也會被 ChatGPT 顛覆。
與谷歌不同,ChatGPT 不會在網路上抓取時事資訊,它的知識僅限於其語言模型在 2021 年之前學到的東西。如果你問 ChatGPT 任何關於未來的預測或者實時資訊,它是無法解答的。例如,你問它美國加州最好的餐廳是什麼,因為這個答案是會根據時間的變化而改變,所以 ChatGPT 會告訴你它無法回答。OpenAI 也公開承認指出當 LLM 用於特定商業場景的時,比如在商業環境中回答員工 IT 問題或在醫療環境中提供自動化的患者支援時,由於其模型只學過公開資料中的片面知識,很可能會給出一個錯誤或者片面的答案。
不過,OpenAI 才剛剛給世人展示它多年煉丹的成果。GPT-4,OpenAI 公司大型語言模型的下一個版本很可能會在 2023 年推出。根據《連線》雜誌的訊息,GPT-4 將擁有 100 萬億個引數,而 ChatGPT 目前訓練的引數為 1750 億個。從這個數字來看,GPT-4 的引數數量約為GPT-3 的五百倍。眾所周知,引數數量越多,模型就能夠學習到更多的知識和模式,從而提高它的效能,這也意味著 GPT-4 將擁有更強大的學習能力,並能夠處理更復雜的任務。
AI 從量變達到質變的時刻正在步步逼近,大量基於 Conversational AI 的應用場景將會在未來五年出現井噴,讓我們拭目以待。