中關村科金張傑:對話式AI,大規模語言模型展示出強大能力|展望2023
去年11月30日,對話式AI ChatGPT橫空出世,刷爆社交圈,火出了天際,5天內便擁有了百萬使用者,推出它的OpenAI更是水漲船高。據外媒報導,微軟有意向OpenAI投資100億美元,OpenAI估值將達290億美元。實際上,在ChatGPT背後起至關重要作用的是一種被稱為大型語言模型的人工智慧(AI)程式,它的出現一併帶火了對話式AI賽道。
中關村科金是中國對話式AI技術解決方案提供商,ITPUB&IT168日前採訪了中關村科金技術副總裁張傑,對其所關注的AI技術進行了回顧與展望。
回顧2022年對話式AI的發展趨勢,可以拆分為多模態和大規模語言模型兩個子方向來看。
多模態技術走入下沉市場
據張傑觀察,多模態技術正在逐漸走入下沉市場、垂直細分場景,如方言ASR(自動語音識別)、領域ASR、特定動作識別等。通用的模型往往不滿足商業應用,定製化的模型往往開發成本高。對於甲方而言,既不想資料外發、又不想對乙方過於依賴;對於乙方而言,定製化開發模型的方式既難以大規模推廣、又無利可圖。中關村科金針對領域化、定製化的市場需求,投入研發零程式碼的、可線上自訓練的模型最佳化工具,甲方業務人員可以自行更新迭代模型,解決雙方顧慮。
大規模語言模型商業前景巨大
大規模語言模型的熱度正旺,已經火出了技術圈。張傑談到了技術發展趨勢,他認為2023年會出現更多的大規模語言模型,它們將助推底層科技公司的模型即服務(Model as a Service,MaaS)的商業模式。另外,對於處於中間層的科技公司而言,它們將圍繞大模型所湧現出的複雜推理能力,挖掘出更多令人震撼的應用。
大模型的上層商用場景有著豐富的想象空間,在國內很多企業講數字化轉型過程中如何用AI替代簡單重複性勞動的時候,AI已經開始畫插畫、寫程式碼了,插畫師、媒體工作者、甚至是程式設計師,這些從事創造性工作的人都已經面臨AI的衝擊。AI技術在短期內,起碼會對搜尋引擎、廣告點選產生影響。未來,AI的生成能力如果再加上邏輯推理能力,可能會生成高質量的營銷文案、辦公文件、短影片等,這對於國內掙扎在ToB賽道上的科技公司而言,是個不容錯過的大機遇。中關村科金重點關注對話式AI如何在企業服務賽道上落地,例如:透過AI生成營銷文案、7*24小時線上回答客戶諮詢、模擬真實業務場景的新員工沉浸式陪練、以數字人的形態線上辦理業務。
對話式AI對於企業客戶的價值
關於對話式AI在企業級的應用,張傑指出企業客戶的需求,主要有以下幾類:
1、 業務增長需求:大部分客戶都會有此類需求,客戶關注系統對終端使用者的意向識別準確率,以及業務轉化效果。此類產品有時是外呼機器人、有時是銷售助手的形式。
2、 降本增效需求:大多出現在客服中心場景下,目標是替代坐席、降低投訴、或者是帶來二次營銷的機會。
3、 員工培訓需求:有些線下連鎖零售、勞動力密集型行業的客戶,面臨招工難、流失率高的挑戰,如何使新員工快速獲得技能、降低培訓成本是他們重點考慮的問題,要求產品低成本的構建知識庫、針對員工做個性化的覆盤分析報告。
4、 平臺建設需求:這類客戶往往是金融機構或行業龍頭企業,之前已經落地過多個AI專案,意識到要在平臺層做能力拉通,避免“建煙囪”和“重複造輪子”。
企業客戶在產品選型時一般會關注以下幾方面:
1、 產品功能與業務需求的匹配度:產品的功能不是越多越好、越靈活越好,太多功能需要客戶去配置的話,反而影響使用時的便捷性。
2、 AI模型的效能:效能體現在多個方面,客戶會根據自身的人力狀況和經營策略,在模型的準確度、覆蓋度、響應時效、算力消耗等方面做取捨。
3、 是否預置行業知識:行業內的中小微客戶,可能會希望廠商具備行業經驗,預置一些模型、話術、模板。
4、 系統的常規需求,如穩定性、可靠性、實效性、安全性等。
2023年中關村科金的技術佈局
展望2023年,中關村科金對於對話式AI將會做什麼樣的技術佈局?張傑表示,研發重點將會放在三個方面:預訓練對話語言模型、會話分析和話術流程挖掘。同時,關注AI技術的工程化、產品化問題。
1、 預訓練對話語言模型:大規模語言模型展示出了強大的能力,例如思維鏈(Chain of Thought),這些能力可能只存在於大模型中,而不存在於百億引數以下的小模型中。在不遠的未來,更大引數量級的多模態語言模型可能會帶來複雜推理能力的大量湧現。技術層面的量變,可能會引發應用層的質變,今年張傑團隊將仔細研究這些能力在企服場景下能提供什麼、會改變什麼,尤其是領域知識如何低成本地注入到大模型裡,使其具備可控的領域知識的問答和推理能力。
2、 會話分析:領域知識關注事實知識,會話分析關注行為意圖。中關村科金仍將沿用基於真實資料的統計分析的方法,挖掘出對話中常見的行為模式,用於話輪設計。ChatGPT未來可能在內容營銷、文章寫作、繪畫生成等方面產生巨大的商業價值,但其背後是語言模型,是語料上的條件機率,因此可能會出現生成文字不可控、多輪之間不可解釋的情況,即大家常說的“一本正經的胡說八道”。企服場景下的對話任務所面臨的問題不一樣,不是在一個語料上學出一個條件機率的問題,而是要找出處於頭部的小機率的最佳實踐。
3、 話術流程挖掘:在流程挖掘子領域,國外有些初創公司發展的很好,尤其是結合RPA,應用生產流程或審批流程的最佳化上,有很好的落地。但國內仍處於起步階段。中關村科金研究的流程挖掘與之不同,主要處理對話語料,將對話序列做事件切分,然後從事件序列中找到話術流程的最佳實踐、或者做流程一致性校驗。
關於AI工程化,張傑指出,AI技術除了要做的足夠智慧,還要做的足夠簡單,讓下游系統甚至業務人員容易使用才行,否則也會難以發揮應有的價值。中關村科金在AI工程化方面會重點投入在三個方面:
1、零程式碼:面向不懂演算法但有一定IT基礎的人員,如專案交付人員或運維人員,他們經過簡單培訓後就可以根據特定語料定製化模型。
2、 自更新:模型可以線上環境不斷積累語料,持續地自我更新,適應線上語料特徵遷移的情況。
3、 可感受:AI技術帶來的增量價值要讓客戶直觀的感受到。首先,要“前後可比較”,有嚴謹的方法、明確的業務目標,使其具備可比較性。然後,要“流程可閉環”,AI技術帶來的效果往往不是一蹴而就、一勞永逸的,需要不斷迭代,讓業務結果反饋到產品中,形成正迴圈。
總之,AI工程化的目的就是,不僅降低業務場景中的重複性勞動,還能降低模型開發與運維本身的成本。AI工具越簡單,使用範圍才能越廣。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69925873/viewspace-2933529/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 大模型時代,中關村科金的蛻變大模型中關村
- 中關村科金髮布“三級引擎戰略”,加速大模型應用落地中關村大模型
- 大語言模型湧現欺騙能力模型
- 大語言模型中的MoE模型
- 大語言模型模型
- 語言大模型大模型
- Springboot --- 使用國內的 AI 大模型 對話Spring BootAI大模型
- 大模型不只是語言能力,還是對廣闊世界的理解大模型
- CosyVoice: 多語言大規模語音生成模型的全棧解決方案模型全棧
- 市場規模超 60 億美元,語音如何改變對話式 AI?AI
- 基於多模態大模型的人機對話大模型
- 阿里靈傑: 整合阿里整體大資料+AI能力對外開放阿里大資料AI
- 大語言模型的應用探索—AI Agent初探!模型AI
- 大語言模型能用作世界模擬器嗎?模型
- OpenAI推出ChatGPT對話式AI模型OpenAIChatGPT模型
- LLM大語言模型演算法特訓,帶你轉型AI大語言模型演算法工程師模型演算法AI工程師
- 百度釋出全球首個大規模隱變數對話模型PLATO變數模型
- 微調大語言模型模型
- 用「圖靈測試」檢驗AI尤其是大語言模型,真的科學嗎?圖靈AI模型
- 如何讓語言模型充分利用GPU:針對大規模並行裝置的N-gram模型GPU並行
- 大模型對AI研究有害?大模型AI
- 音影片+AI,中關村科金助力某銀行探索發展新路徑 | 案例研究AI中關村
- 賽事報名 | 2023 中關村科學城科創大賽正式啟動 一圖瞭解如何報名中關村
- 如何評估大語言模型模型
- LLaMA-Factory微調多模態大語言模型教程模型
- 好飯不怕晚,Google基於人工智慧AI大語言對話模型Bard測試和API呼叫(Python3.10)Go人工智慧AI模型APIPython
- 源1.0大模型登頂中文語言能力評測基準CUGE榜首大模型
- 搭建人工智慧多模態大語言模型的通用方法人工智慧模型
- 讓預訓練語言模型讀懂數字:超對稱技術釋出 10 億引數 BigBang Transformer [乾元]金融大規模預訓練語言模型模型ORM
- 什麼是大語言模型(LLM)?模型
- 01-大語言模型發展模型
- 新型大語言模型的預訓練與後訓練正規化,谷歌的Gemma 2語言模型模型谷歌Gemma
- 新型大語言模型的預訓練與後訓練正規化,Meta的Llama 3.1語言模型模型
- GPT大語言模型Alpaca-lora本地化部署實踐【大語言模型實踐一】GPT模型
- Trends in Plant Science | 植物生物學中的大語言模型模型
- 沒想到!AlphaZero式樹搜尋也能用來增強大語言模型推理與訓練模型
- 關於大數(C語言)C語言
- 匹配大寫金額正規表示式