ChatGPT概念“狂飆”,你追了嗎?
近期,ChatGPT引領的人工智慧概念在資本市場一路狂飆。這樣一款爆品依託於什麼樣的黑科技進行研發,在怎樣的背景下產生,能否賦能我們現有的產品,處於一個怎樣的定位,未來發展會怎樣?本文將透過實戰調研的方式來探討這些問題,綜合產品、技術、市場的角度對ChatGPT進行分析。
一、背景介紹
1.1 基本資訊
依據Wiki百科的介紹,ChatGPT是一種尚處於原型階段的人工智慧聊天機器人。ChatGPT由OpenAI公司在2022年11月30日釋出。在同樣由OpenAI開發的GPT-3.5模型基礎上,ChatGPT透過監督學習與強化學習技術進行微調,並提供了客戶端介面,支援使用者透過客戶端與模型進行問答互動。ChatGPT不開源,但透過WebUI為使用者提供免費的服務。
1.1.1 研發組織
OpenAI 成立於 2015 年,由Elon Musk、Sam Altman等出資10億美元成立,致力於研究安全、通用、對人類有益的人工智慧技術。OpenAI 最早是一家非營利性研究機構,在2019年微軟注資10億美元后,OpenAI轉變為以盈利為目的的公司,將部分研究成果,如GPT-3、Codex等產品化並提供付費服務。
1.1.2 核心技術
ChatGPT最核心的自然語言處理能力(Natural Language Processing, a.k.a, NLP)由微調(fine-tune)後的GPT-3.5模型提供。GPT-3.5模型是OpenAI在2020年釋出的GPT-3模型的一個升級版本。GPT一詞的全稱是Generative Pre-trained Transformer,意即通用的預訓練Transformer模型;其中Transformer指用於NLP任務的一類基於注意力機制(Attention)來提高模型效果的機器學習模型(事實上最新的GPT模型也包含除Transformer外的各類NLP模型[1]),Pre-trained指模型經過預訓練因此使用者可以直接使用,Generative指模型提供包含情感分析、語言翻譯、文字生成、命名實體識別等一些列NLP任務中的通用能力。
GPT系列模型自2018年釋出以來,就以提供通用的NLP能力為核心。該系列模型透過改進模型結構、增加可訓練引數、增加訓練樣本等方式持續演進,提供更加準確與穩定的NLP能力,GPT-1模型、GPT-2模型、GPT-3模型的演進如下:
表1 GPT系列模型引數
其中,釋出於2020年的GPT-3模型劃時代地包含了1,750 億個引數,並使用了45TB的訓練樣本。這樣的模型研發開銷巨大,外界保守估計僅訓練GPT-3模型就需要1200萬美元。詳細介紹GPT-3的論文中提到,研究者雖然提到GPT-3在訓練過程中出現了錯誤並評估了該錯誤的影響,但由於訓練代價巨大導致無法重新對模型進行訓練[2],GPT-3的訓練開銷可見一斑。GPT-3釋出後,OpenAI對其進行了持續的最佳化與升級,ChatGPT基於目前較新的GPT-3.5這一版本進行研發。
自2020年GPT-3釋出後,OpenAI提供了一些列API介面或應用介面,對付費使用者提供GPT-3的NLP能力。
圖1 透過GPT-3將自然語言轉化為SQL語句
圖2 透過GPT-3詢問電影的相關訊息
圖1和圖2均為網際網路上釋出於2020年的GPT-3試用截圖,可以看到當時的GPT-3就已經能透過問答的方式,處理多個領域的工作。
1.2 話題熱度
自OpenAI於2022年11月30日釋出ChatGPT至今,ChatGPT這一話題一直居高不下。我們透過Google的熱詞分析發現,在全球範圍內“GPT”這一關鍵詞的熱度暴漲。
圖3 全球GPT一詞近5年熱度
Google Trends的熱度數字僅代表相對於圖表中指定區域和指定時間內最高點的搜尋熱度,熱度最高時取值為100。由圖3可見,ChatGPT自發布後,GPT一詞的熱度不但遠遠超過2020年OpenAI釋出GPT-3這一具有劃時代意義的NLP模型時GPT一詞的熱度,更遠遠地超過了Machine Learning一詞的熱度。在綠盟君看來,ChatGPT的功能早在2020年就能透過基於GPT-3的應用實現,且和當時的應用同樣使用GPT-3系列的模型(舊應用的模型也在伴隨GPT-3模型的升級而升級,故這些應用發展到今天應當同樣在使用GPT-3.5版本附近的模型),因此ChatGPT在技術上是不存在匹配這種熱度的突破的。那麼為什麼ChatGPT的釋出會帶來如此罕見的高熱度呢?
圖4 2022年5月2日Meta釋出OPT專案,引用自[3]
在分析這個問題時,綠盟君注意到2022年5月發生了與GPT模型相關的一個重要事件。自OpenAI於2020年釋出GPT-3模型並陸續推出基於GPT-3模型的應用以來,該系列的產品一直是透過付費模式提供給使用者的。然而,在2022年5月,Meta復現了GPT-3模型,該模型被命名為OPT(Open Pre-trained Transformers),同樣使用了1750億引數,擁有媲美GPT-3的能力[3]。
圖5 OPT專案論文中提到專案以分享給感興趣的研究者為目的,並能達到媲美GPT-3類模型的效果,引用自[3]
與OpenAI僅提供付費服務這一做法不同的是,Meta對OPT專案進行了開源[4],對應專案名稱中的“Open”一詞與OPT專案強調的“fully and responsibly share”。據此,推測2022年5月Meta釋出的開源OPT專案給堅持付費模式的GPT-3專案帶來了商業維度上的直接挑戰,故OpenAI在半年後的2022年11月,釋出了可以免費使用的ChatGPT(GPT系列模型之前不提供免費應用),並設法提高了該詞的社會關注度,作為應對OPT專案的一個反擊與對自身品牌熱度的一個宣傳。
二、試用評估
2.1 主要功能
ChatGPT的介面非常簡潔,登入後的介面左側選單如圖6(該圖及本章節所有ChatGPT截圖均截自ChatGPT)所示的5個功能之外,便是文字互動框。
圖6 ChatGPT左側選單
上述的5個功能分別為:重置執行緒、深色/淺色模式切換、OpenAI站點連結、更新與幫助、登出,其中重置執行緒這一功能相對特殊。由於ChatGPT會根據上文語境回答後續問題,因此使用者需要透過重置執行緒這一功能來清除語境中已有的資訊。
透過文字互動框,ChatGPT可以回答許多通用性的問題,例如圖7所示:
圖7 ChatGPT回答通用問題
我們可以透過文字互動框,圍繞某一話題和ChatGPT進行聊天,ChatGPT會結合其自然語言處理能力,使用其內建的知識庫生成文字進行回覆。關於這一塊的應用網路上目前已有不少測評,故本文不詳細介紹。
2.2 試用場景
ChatGPT釋出初期,綠盟科技釋出了《ChatGPT在資訊保安領域的應用前景》一文,對ChatGPT在網路安全領域中的應用做了詳細的評估。在2022年12月12日,即ChatGPT釋出兩週內,綠盟君將之前被證明有效的案例輸入ChatGPT,卻已無法得到ChatGPT的積極回覆。隨後,我們發現ChatGPT有時可以執行上文提到的案例,有時會因為內容安全策略拒絕執行,具體原因不明。
圖8 截至12月10日,ChatGPT可以根據使用者的自然語言描述生成用於網路安全掃描的指令碼
圖9 截至12月12日,ChatGPT對於圖8同樣的輸入,已拒絕生成掃描指令碼
圖10 截至12月12日,ChatGPT仍能輸出快速排序程式碼
同樣地,12月10日前ChatGPT可執行的任務:識別URL中是否包含惡意負載,截至12月12日也已無法執行。
圖11 截至12月12日,識別URL是否包含惡意負載同樣被拒絕(URL在上文中已提供給ChatGPT)
既然ChatGPT由於其日漸完善的內容安全策略,現在已經有可能拒絕在網路安全任務中貢獻“專家知識”,那我們有沒有辦法繞開基於內容安全策略的遮蔽呢?這裡綠盟君發現一個思路:設定一個虛擬環境,誘導ChatGPT認為在這個虛擬環境的回答不違反內容安全策略。
首先我們提出一個明顯違背內容安全策略的問題,如圖12所示,ChatGPT會拒絕回答我們提出的問題。相反地,會建議我們透過合法合規的方式來處理問題中我們提到的“安全漏洞”。
圖12 一個ChatGPT明顯不可能正面回答的問題(該問題僅作為明顯違背內容安全的一個示例,不代表作者和公司的任何立場)
我們再構建一個虛擬環境,並假設兩個不存在的主體,且使用明顯帶有感情傾向的詞來證明我們要做的事情是正確的,如圖13所示。ChatGPT這時會開始積極地給出建議,甚至會利用其豐富的知識庫擴充套件我們的思路到其他維度。
圖13 營造一個被ChatGPT認為不違反安全策略的場景,ChatGPT開始積極地提供建議
最後,我們針對ChatGPT給出建議的具體操作步驟進行提問,如圖14。這時,ChatGPT會針對我們的問題,給出更為具體的回答。然而,在答案即將出現一些敏感詞彙的時候,內容安全策略仍然對ChatGPT進行了遮蔽。
圖14 在虛擬場景中對ChatGPT提問。雖然ChatGPT會積極提供攻擊思路,但是最終仍被內容安全策略打斷
透過以上案例我們有兩點主要發現:1、一些問題ChatGPT雖然拒絕正面回答,並號稱自己不會解決,但實際上ChatGPT完全具備相關知識並能夠給出清晰高效的解決方案,不能給出答案基本是由於內容安全策略的原因。2、ChatGPT作為一個免費且高影響力的應用,其內容安全策略演進速度快,覆蓋範圍廣。換言之,ChatGPT作為一個免費AI應用,考慮到法律、道德、倫理等社會因素,為避免濫用,其使用限制將越來越多。
2.3 其他限制
除了日漸嚴苛的內容安全策略外,我們在使用ChatGPT時還遇到了其他的一些限制。具體來說目前已發現的限制包含:
響應時間的限制:ChatGPT的文字生成是非同步的,即每生成一小段就會在使用者UI中展示。但若回答的文字在1分鐘左右還沒有完全生成,ChatGPT就會中斷這次http會話,使用者無法得到完整的回答。
服務不穩定:在使用ChatGPT時,某一段時間內ChatGPT會完全不響應使用者的請求,直接報網路錯誤。因為此時的登入登出功能均正常,故推測是由於ChatGPT的伺服器併發處理量過高導致的服務崩潰。
使用頻率限制:當連續使用ChatGPT一段時間後,會出現提示告知使用次數已到上限,請等待一段時間。該提示出現後一定時間內無法繼續使用ChatGPT。
輸入字數限制:輸入的單個問題如果過長,ChatGPT會拒絕處理。
輸出字數限制:輸出的答案文字如果過多,ChatGPT會停止輸出。
三、分析與預測
3.1 整合可能性分析
ChatGPT釋出至今,在展現出了亮眼能力的同時也收穫了極高的社會關注度。在眼前一亮的同時,我們很自然地會希望能利用ChatGPT宛如黑科技一般的能力來賦能我們的產品。那麼,我們是否有可能透過在產品中整合ChatGPT來賦能我們的產品呢?
以ChatGPT現在的情況看,整合ChatGPT來對產品進行賦能是比較困難的。原因可大致分為以下幾點:
準確性不夠:ChatGPT雖然可以執行生成一些程式碼、對檔案或URL進行檢測這樣的任務,但其執行這些任務的正確程度是不能保證的。由於ChatGPT執行這些任務的內在邏輯對外不可解釋,我們甚至無法在執行任務的過程中對其進行最佳化或調整,只能選擇接受或不接受透過ChatGPT得到的結果。如果發現結果錯誤後,我們還需要使用其他的方式來保證任務的正確完成,那麼透過ChatGPT執行任務這條鏈路就不是必須的;如果發現結果錯誤後就不提供結果甚至直接不檢查ChatGPT的輸出是否正確,則這樣的服務質量一定不能滿足使用者需求。
知識受限制:ChatGPT目前的知識庫僅覆蓋到2021年,並不掌握最新的知識,也無法透過連線網路去查詢最新資料來解決問題,如圖15、16所示。
圖15 ChatGPT具備2019年某CVE的相關知識
圖16 ChatGPT不具備2022年CVE的相關知識且無法聯網查詢
功能受限制:如上文提到,在ChatGPT的使用過程中我們發現其存在嚴格的內容安全策略,且從短時間內其內容安全策略變得明顯更為嚴格,我們可以認為ChatGPT產品團隊對於內容安全十分重視,且內容安全策略仍在快速完善中。這就導致一些任務由於內容安全問題,在目前或將來不能被ChatGPT執行。
穩定性較差:如上文提到,在ChatGPT的使用中我們發現其服務會間歇性崩潰。
限制條件多:如上文提到,ChatGPT對於使用頻次、輸入長度、輸出長度、單次會話時長均有明確的限制。雖然截至2月7日,ChatGPT官方宣佈ChatGPT即將推出價值20美元/月的付費訂閱版ChatGPT Plus,訂閱使用者可獲得在ChatGPT高峰時段繼續使用,且服務響應時間也將有所縮短等有助於提高ChatGPT服務穩定性的權益,但從定價上看,ChatGPT Plus主要針對的仍是個人使用者。ChatGPT的穩定性是否能達到企業級產品級的要求,仍然難以保證。
整合效率低:ChatGPT透過web服務的方式向使用者提供服務,並不提供免費介面。因此若要將其整合進產品,只能對Web服務進行封裝,透過外部開發的額外介面透過http請求傳送問題與接收答案(可參考https://pypi.org/project/chatgpt-api/),如圖17所示。這樣的接入方式原理與爬蟲類似,不僅每次建立新的會話都需要使用者手動完成ChatGPT站點的登入並更新登入憑證,而且很容易隨著ChatGPT官方對於http請求校驗策略的變化而失效。
圖17 一種封裝ChatGPT為介面,從而供其他服務呼叫的思路,引用自[5]
綜上所述,要直接利用ChatGPT為產品賦能,目前仍比較困難。若需要引入類似ChatGPT的能力到產品中,比較好的辦法還是使用OpenAI更加穩定、使用限制更少的付費產品,或根據Meta的OPT開源專案自行研發應用與服務。
3.2 未來運營預測
ChatGPT是OpenAI的首個免費GPT系列模型應用。由於其釋出時間正好處於Meta開源OPT的半年後,因此綠盟君推測OpenAI釋出ChatGPT的主要目的是對自身技術實力進行宣傳,以應對模型開源這一影響到OpenAI現有商務模式的挑戰,而非搶佔OpenAI自身基於GPT提供的付費服務市場。
基於這個觀點,未來的ChatGPT:
不會提供免費的官方API;
使用限制會越來越嚴格;
以最佳化功能或便利使用者為目的的更新不會太頻繁。
四、總結
ChatGPT一經發布,短時間內就成為了現象級的應用。其清晰明確的回答和豐富的知識,昭示著AI技術造福人類,徹底簡化我們生活工作這一美好的未來願景。對於解決各行各業的許多問題,ChatGPT也提供了另外一種思路,為更加自動化、智慧化地最佳化IT產品與服務帶來了可能性。
但是,正如Wiki對於ChatGPT的定義是“原型聊天機器人”,ChatGPT僅僅是一個尚處於原型階段的,更加智慧、更加博學的聊天機器人。不論是想要透過ChatGPT來徹底地解決傳統方案難以解決的問題,還是希望透過ChatGPT來替代一些需要大量專業知識或人工的工作仍然為時過早。
從產品上看,可以將ChatGPT看作GPT系列模型應用的一個免費試用版本。雖然ChatGPT展現了令人眼前一亮的表現,但在解答問題的正確性和知識庫儲備上仍然存在明顯的不足(可參考《ChatGPT在資訊保安領域的應用前景》一文中關於正確性的測評),因此依賴其解決實際問題不夠穩定,只能將其看作一個智慧顧問。此外,作為一個免費應用,ChatGPT在使用上具有諸多不利於使用者的限制,例如限制了輸入輸出長度、使用頻率、響應時間,因此其很難直接用其賦能現有產品。若需要在產品中引入類似能力,選擇OpenAI其他更為穩定和便利的付費應用是更明智的選擇。
從技術上看,ChatGPT依託於2020年釋出的GPT-3模型目前的最新版本GPT-3.5進行開發,ChatGPT的功能在2020年左右的GPT-3應用中已經可以實現。因此綠盟君認為ChatGPT自身並不存在劃時代性質的技術突破。但ChatGPT展現出的效果,讓我們對未來的GPT-4模型充滿了期待,更極大地提高了社會各界對於AI技術的認可,同時鼓舞了資本和從業人員對於近期缺乏重大進展(相對於2018年左右)的AI技術的信心。
相信隨著AI技術的不斷進步,終有一天人類可以透過自然語言互動的方式,命令機器來正確、快捷地處理我們工作生活中的複雜任務。ChatGPT的出現向整個社會揭示了這一美好未來的可能性,是人類在向這一美好願景邁進的過程中,一個不能被忽視的里程碑。
參考文獻
1、https://huggingface.co/transformers/v3.5.1/model_summary.html
2、Floridi, L. and Massimo Chiriatti. “GPT-3: Its Nature, Scope, Limits, and Consequences.” Minds and Machines 30 (2020): 681-694.
3、https://arxiv.org/abs/2205.01068
4、https://github.com/facebookresearch/metaseq/tree/main/projects/OPT
5、https://pypi.org/project/chatgpt-api/
相關文章
- 聊聊最近一路“狂飆”的ChatGPT2023-02-10ChatGPT
- ChatGPT熱度“狂飆”,OceanBase也去找它嘮了嘮2023-02-27ChatGPT
- ChatGPT風口下的技術“狂飆”,天翼雲榮登ZeroCLUE榜首2023-02-20ChatGPT
- 智商狂飆,問了ChatGPT幾個資料庫問題後,我的眼鏡掉了2023-02-09ChatGPT資料庫
- cpu狂飆第二招追蹤2021-09-09
- 看了幾集狂飆,大佬說我變了?2023-04-14
- 運維效率狂飆,全在告警管理上2023-03-08運維
- 小遊戲突然“狂飆”,2024年如何上車?2024-01-19遊戲
- 工作效率飆升的秘訣!7種用ChatGPT的方法你值得擁有!2024-11-03ChatGPT
- bilibili 看影片時 GPU 狂飆的解決辦法.2024-06-18GPU
- React 中你會這 10 個 JavaScript 概念嗎?2020-03-19ReactJavaScript
- 網易二面:CPU狂飆900%,該怎麼處理?2023-03-15
- coder,你會設計交易系統嗎(概念篇)?2019-03-11
- ChatGPT 會開源嗎?2022-12-08ChatGPT
- AI效能狂飆!耕升 GeForce RTX 4070 SUPER 踏雪Mini效能解禁2024-01-17AI
- 工作效率一路狂飆,年後復工“熊”有妙招2023-02-16
- 計算機網路的 166 個核心概念,你知道嗎?2022-03-17計算機網路
- 從NLP視角看電視劇《狂飆》,會有什麼發現?2023-03-02
- 解決MacBook Pro升級風扇狂轉和CPU飆高問題2021-12-27Mac
- 關於開發Cesium造成的電腦風扇狂飆的問題2018-07-30
- AI 加密代幣漲幅狂飆!而這可能是泡沫的跡象?2023-02-10AI加密
- 從碼力到算力的“狂飆”,探元宇宙的未來風向2023-03-28元宇宙
- ChatGPT 背後基礎設施的算力概念2023-05-07ChatGPT
- ChatGpt 能成為戀愛大師嗎?2023-02-18ChatGPT
- ChatGPT:是一項技術突破嗎2023-02-13ChatGPT
- GPT-4狂飆釋出,AI時代運維將產生哪些變革2023-03-16GPTAI運維
- 攜手NVIDIA等40餘家國內外夥伴,飛槳硬體生態狂飆2023-03-27
- ChatGPT:不斷升級就安全了嗎?2023-05-18ChatGPT
- ChatGPT能夠顛覆醫療AI嗎?2023-02-20ChatGPTAI
- ChatGPT狂歡的背後:人工智慧是品牌安全的雙刃劍2023-03-30ChatGPT人工智慧
- 一文帶你瞭解 chatgpt2023-02-22ChatGPT
- 預設讓你 ChatGPT 更跳脫2023-03-07ChatGPT
- 大模型的「狂飆時代」,以開源之力推動「新Linux底層作業系統」2023-03-03大模型Linux作業系統
- 你累了嗎?2019-02-21
- 抄別人還抄自己,ChatGPT能做遊戲嗎?2023-03-17ChatGPT遊戲
- 【與ChatGPT的有趣對話】Adobe認證有用嗎?2023-03-13ChatGPT
- 馬斯克xAI瘋狂融資,兩週內將攬60億美元,估值飆至180億2024-04-26馬斯克AI
- 以太坊ENS域名註冊量飆升216%!巨鯨瘋狂掃蕩?或將迎來炒作高潮!2022-07-06