IBM專家觀點:從ChatGPT的走紅談企業需要怎樣的AI -- 是"百事通"還是"業務助手"?

全球TMT發表於2023-02-27

北京 2023年2月27日 /美通社/ -- 根據瑞銀最近一份研究報告估計,OpenAI去年11月底推出的ChatGPT在1月份達到了1億月度活躍使用者,成為歷史上增長最快的 面向消費者的人工智慧 app。 根據Sensor Tower的資料,從上線開始算,到達到1億月活, Instagram用了大約兩年半,TikTok抖音用了大約9個月,而ChatGPT只用了兩個月。

據業內媒體反饋,ChatGPG也是當前中國企業開發者社群最關注的話題——如何將ChatGPT運用於企業? 用於哪些業務場景?怎麼用?包括金融、製造和車企在內的傳統企業也對此極為關注。一些開發者表示,他們的領導已經下命令,讓他們加快研究ChatGPT如何在業務當中發揮作用。

IBM是全球企業級AI技術與應用的領導者,第三方研究機構早在2021年就報告IBM連續三年位列全球 AI 市場份額的第一名,全球有超過4萬企業客戶正在使用IBM的人工智慧,即Watson AI。近年來,許多把"資料為先"作為企業數字化轉型重點的中國企業也加入到積極採用人工智慧技術的行列,他們與IBM的技術與行業專家一道,攜手打造了不少創新領先的AI應用場景,積累了一定的經驗。

基於客戶與合作伙伴近期對於 面向企業的人工智慧應用的高度關注與探索需求,我們特別邀請IBM中國的技術與行業專家,分享他們的見解與實施經驗,希望能夠對廣大客戶、合作伙伴和開發者社群的同行有所啟發和借鑑。首先與大家分享的是 IBM 傑出工程師、大中華區客戶成功架構師、大中華區金融行業首席架構師陳宇翔,以下是他近期的署名文章——

ChatGPT 的走紅談企業需要怎樣的 AI --  是"百事通"還是"業務助手"?

作者:陳宇翔

IBM傑出工程師、大中華區客戶成功架構師、大中華區金融行業首席架構師


從ChatGPT的走紅,談企業需要怎樣的AI -- 是“百事通”?還是“業務助手”?

ChatGPT 火爆出圈

最近幾周,AI業界最大的新聞無疑是ChatGPT橫空出世,從而引發的業界震動。市場上有大量的評論文章,有把它描述成無所不能的,大有代替人類職業之勢;也有提出擔擾,某些頂級學術雜誌和知名高校已經明確限制AI作者發表論文和科研成果。

出於好奇,筆者也試用了ChatGPT。整體感覺對於一般的開放性問題,ChatGPT生成的回答文法結構完整,語言風格自然,比之前的聊天機器人有明顯的進步。內容的準確性和完整性,往往能超過正常交流時大多數人的"第一反應",更像是經過了一番思考並整理後的結果,條理清晰,很有啟發。但對於專業性問題,尤其是需要邏輯推理的知識,ChatGPT並沒有像網上文章說的那麼出色,經常"張冠李戴"或者形式上像模像樣但內容上卻不知所云。

為什麼會這樣呢?我們可以問一問ChatGPT自己。

"ChatGPT 是由 OpenAI 公司開發的一款預訓練語言模型,旨在生成人類可讀的文字。它透過讀取大量的文字資料,學習瞭如何生成與語言相關的內容,並在輸入一段文字時生成一段有關的文字輸出 ……"

ChatGPT中的GPT的全稱是的"Generative Pre-trained Transformer -即生成性預訓練變換模型"。借用一位名叫 # 矽谷學霸 Jolin 的技術教育博主對GPT模型的淺顯解釋,她說,以ChatGPT為代表的"生成性AI"是一項技術突破,之前AI學習大多聚焦於觀測、分類和分析內容,而生成性AI則不限於分析現有資料,它可以生成新內容,可以根據需要生成新的程式碼、詩歌、文章和藝術品。ChatGPT是專注於文字內容的生成性AI。所謂"預訓練"是指該模型已經在某些有限的資料集上進行了訓練,事實上,ChatGPT已經學習了2021年6月以前人類編寫和釋出在網際網路上的海量資訊,而且是透過"監督學習"和"人類反饋強化學習"這兩種技術進行的學習。Transformer是一個非常底層的AI機器學習的演演算法架構,是一種深度神經網路。從GPT-1到今天的GPT-3.5都是採用Transformer架構,而GPT模型 ,以支援AI對更多、更大資料集的訓練和學習 [i]

也就是說,ChatGPT是透過海量(約45TB [ii])語料訓練而掌握了語法和語義結構的成熟的 大型語言模型(Large Language Model, LLM),其特色是文字生成能力很強,產生的文字風格和內容很像之前的輸入,即人類語言。由於訓練語料涉及面廣,所以ChatGPT對各行各業的資訊都有涉獵,總能略知一二,有時甚至回答得頭頭是道。對某些專業領域,比如程式設計,甚至可以產生準確的程式碼並直接執行。然而,若仔細觀察,這些程式碼往往都是解決特定的小任務,程式碼風格似曾相識。若要完成一個創新的演演算法,或者複雜問題的程式設計,ChatGPT就無能為力了。

總體而言,這類透過學習語料來生成文字的AI模型,都是在學習過去,其目標是模仿過去,生成出幾可亂真的作品,並不是真正意義下的創造未來。ChatGPT也不例外。作為助手,對思考的廣度往往有幫助,對思考的深度卻不盡然。

從聊天到業務助手

ChatGPT讓我們看到了大型語言模型的未來。然而,在企業應用中,為了創造業務價值,這類對話形式的應用(ChatBot)則更多用於對外的"客戶服務"或對內的"業務助手"方面。這就對此類模型提出更高的要求——

第一,  準確性和專業性

企業往往要求回答準確且專業,如果對答案沒有把握,回答"不知道"也好過生成一大段豐富而無用的文字。

ChatGPT是一種"開放領域系統"(Open-domain system),類似的還有Google的Bard,它們都需要海量的資訊輸入和長時間的訓練,能應付所有領域的對話,回答內容相關度高,對答自知,語法自然。

而企業級的ChatBot是一種"封閉領域系統"(Close-domain system),往往不是需要一個乖巧的"百事通",而是需要專業領域可靠的"知識助手"。它的訓練語料是有限的,包含企業內部檔案和資料、專業領域知識庫、外部該領域的相關文章等等,大量的資料都是不公開的。ChatBot能回答的問題也限定在專業領域的場景語境中。不必面面俱到,但求簡練、精準、專業。

第二,主動式對話

碰到提問模稜兩可的時候,企業應用往往要求透過主動引導式對話,甚至反問的辦法,迅速澄清意圖。然後,再給出明確的答案。這一點ChatGPT目前尚未做到,當問題模糊時,回答也模糊,提問者發現後,換一種問法,或者在對話中縮小範圍,可逐步得到想要的結果。整個過程中,ChatGPT每次都是被動回答。

第三,後臺整合能力

ChatBot往往作為企業對話的渠道入口,在提供服務時需要和企業大量的後臺系統整合。比如:在識別意圖後可以從資料庫或大資料平臺中自動收集相關資料,並進行分析和推理,得到客戶所需的明確答案;或者啟動一條指令或一個後臺流程,幫助客戶完成相關操作。

IBM Watson 服務企業級 AI 應用

OpenAI從2018年以來長期堅持研發大型語言模型,透過不斷迭代,從最初的GPT-1到目前的GPT-3,且今年會發行GPT-4。目前,在開源社群找到GPT-3模型,也為企業開展此類研究提供了範本。

ChatGPT對企業的吸引力是毋庸置疑的,多數企業都有意願擁有一個自己的ChatGPT。然而,當前ChatGPT採用最新的GPT-3.5模型,含有千億級引數,一次訓練就要花費數百萬美元 [iii]。大多數企業不具備如此大的算力,但如果為了獲得對話模型,把企業內部資料都上傳到網上,利用公有云訓練也會有安全顧慮。所以,企業主導訓練一個定製版ChatGPT,無論從財力還是合規方面都會有障礙。

IBM Watson,也就是IBM企業級的人工智慧,經過十多年的發展,從研究到實驗,至今已經發展成為一套可以在紅帽 OpenShift上任意執行的AI能力,以產品化的方式提供給使用者,幫助企業整合和分析混合環境下分散而複雜的企業資料,從而實現資料驅動的預測性決策、智慧自動化和基於企業內外適時資料和洞察的安全策略與響應。

今天IBM Watson已經應用於全球四萬多企業使用者的業務場景當中,為具有不同水平AI技能的使用者提供尖端的AI能力,無論是缺乏AI技能卻想透過AI重獲時間效率的商務及專業人士(例如人力資源、財務、網路安全管理人員等),還是具備一定AI技能並且正在大規模使用AI的資料科學家、IT專業人員等。

IBM Watson提供了許多不同的工具和服務,用於解決多種問題。它涵蓋了語言處理,解釋、回答和生成文字等多種功能,以幫助客戶解決商業問題。同時,它也提供了語音識別、影像識別等其它功能,使之成為一個非常強大和全面的人工智慧平臺。

長期以來,IBM Watson面向企業級AI應用,特別為企業定製"業務助手"類的對話式應用。基本上,Watson有語音文字轉換、意圖識別、對話流設計、文字分析、知識整理、情感分析等功能。使得Watson可以在通用的語言模型上疊加專業領域知識,並有意識地設計和引導對話方向。

Watson透過後臺的機器學習、自然語言處理、文字生成、語音識別與合成、對話系統、知識圖譜技術,可以分解文字結構,精準定位觀點、事實、論據、邏輯關係等,早在數年前,採用IBM Watson技術的 ) [iv]就曾以它的機智幽默和高情商而驚豔業界,它可以針對任何一個預設話題,比如"國家應該為每個人提供基本收入",臨時選擇正方或反方,與人類的辯論冠軍選手進行對辯。今天的ChatGPT也可以達到這個效果。應該承認,其通用語言模型和文字生成技術所呈現的體驗感受甚至可以超過Watson,令人驚豔,其開放的使用者介面更是讓大眾能夠親身體驗這種驚豔,然而Watson的專業性、可設計性、整合性則更適合企業級的業務定位。IBM把這種普適性的大型基礎模型稱為 Foundation model [v],它利用遷移學習(Transfer learning)經過少量的專業訓練,就能進入一個知識領域,並且得到新的啟發,這一點非常像人類的學習過程,有廣闊的應用前景,也是IBM今後研究的重點。

我設想,對於企業已有的Watson對話模型,也可以利用ChatGPT得到增強。可以是協同模式:當發現是專業領域的封閉式問題,可用原有Watson模型回答,當發現是開放式問題,可用ChatGPT回答。也可以透過競爭模式:一次生成多個答案,由人類做裁判,相互學習,共同提高。

總言之,ChatGPT將人機對話的體驗提高了一個檔次,利用強大的搜尋和知識整理的能力,在問題回答的廣度上往往很有啟發,但深度不足。目前只能學習(Learn)人類語言和知識,還做不到思考(Think)推理,也難以駕馭高度創新和深度思考的任務。我認為,對於企業級的應用,融合ChatGPT與IBM Watson之所長,不乏為快速高效地應用AI 提升體驗、創造價值之選。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70004007/viewspace-2937267/,如需轉載,請註明出處,否則將追究法律責任。

相關文章