讓計算機理解人與人之間的對話,是一件看似簡單,實際難度很大的事情。在6月9日的迴圈智慧整體產品釋出會上,CEO陳麒聰舉了一個銀行理財顧問與客戶對話的例子:
理財顧問:今年52啊,那您再幹個7,8年左右到60歲就可能要面臨退休嘛是不是? 客戶:我55歲就退休了。
我們的任務是根據這段對話,提取客戶的“畫像標籤”:判斷客戶是否退休了。
人工來判斷的話,需要結合上下文的內容,才能得出結論:雖然對話的雙方是在講“退休”這個主題,但客戶的狀態是還沒退休,因此不能打上“客戶已退休”的畫像標籤。
對機器而言,很難應付這種“不按常理出牌”的人與人對話場景。但偏偏在現實中,人與人溝通對話的內容會大量涉及到類似的場景。究其原因,主要是因為人與人對話有很強的隨意性,不僅同一件事情的表述方式有無數種,而且經常會出現重複、停頓、省略、虛擬語氣等現象,需要結合上下文的情境才能正確判斷語義。
因此,過去幾年,可以識別上下文語義的AI深度學習技術被廣泛採用——透過人工標註數百或數千條“正負例”樣本資料,即可生產一個分類器模型——每個分類器模型都可以用來識別一條語義。但是,每個會話語義分析的任務,通常需要幾十甚至上百個分類器模型才能實現,標註樣本資料和手工調優的過程,導致生產週期很長,成本很高。
因此,NLP技術的產業化、規模化應用,受到了極大的限制。全行業都亟需一場技術變革……
基於超大規模預訓練模型的技術變革
2021年4月,迴圈智慧聯合華為雲釋出了全球首個千億引數的中文語言預訓練大模型——“盤古”,釋出時盤古大模型打破了權威評測榜單CLUE的總榜、分類任務和閱讀理解三項記錄。但“刷榜”從來不是盤古大模型的真正目標,經過一年多的研發和進化,迴圈智慧把零樣本技術推向落地,建成了零樣本NLP平臺。
盤古零樣本NLP平臺搭載了,經過極致最佳化的15億引數可落地模型,效能顯著超越原版的千億模型。在金融、地產、汽車等行業的200多個真實場景,盤古零樣本平臺的效能得到廣泛驗證。藉助強大的工程化支援,盤古零樣本平臺大幅降低了部署成本,提升了應用效率:使用一個普通的2080Ti GPU分析1萬小時的錄音內容,平均僅需16分鐘。
這是一場蓄勢已久的技術革命,零樣本學習是全新的NLP生產正規化,在大部分場景下無需標註樣本,只需要人類提供指令(Prompt)即可完成建模,大幅度地降低生產門檻;在少部分場景下,僅需透過少量樣本(通常10-50條資料)進行微調,即可完成建模。
更重要的是,在新的NLP生產正規化下,不需要AI專家的深度參與,普通員工經過培訓後也可以藉助對話式的互動介面,快速生產語義模型(如影片所示)。
從模型效果的角度看,透過盤古零樣本平臺生產的NLP模型,跟原來的標註幾百條樣本得到的模型,可以做到效果相當;從生產週期的角度看,大部分NLP模型生產可以從傳統方法的幾天降至幾分鐘,少部分需要微調的模型也僅需要一兩個小時即可完成生產,生產效率提升10到1000倍。
NLP模型 生產方式 | 傳統 分類器 | 新一代 大模型 零樣本平臺 |
---|---|---|
單個模型標註樣本量需求 | 幾百到幾千條樣本 | 大部分場景:0樣本 少部分場景:10-50條樣本進行微調 |
模型生產用時 | 2-4天 | 3分鐘-1小時 |
模型生產流程 | → 資料標註 → 資料質檢 → 調參訓練 → 模型測試 → 部署上線 | → 建立模型 → 模型測試 → 上線使用 |
盤古零樣本NLP平臺 vs 傳統分類器技術
零樣本技術在企業會話分析場景的應用
在銀行、保險、證券、汽車、房地產以及B2B企業軟體等行業,高附加值產品的營銷推介、銷售、服務環節均離不開企業員工與客戶溝通互動的過程。無論是線上的電話或微信互動,還是線下的面對面交流,溝通建立了企業與客戶之間價值傳遞的橋樑。
有了盤古零樣本NLP平臺,企業可以根據業務的需求,快速生產大量的語義模型,將原本“非結構化”的溝通對話內容,變成計算機可以分析處理的“結構化”資料,準確和快速地分析不斷產生的員工與客戶溝通內容:
■ 全面掌握業務策略的真實執行情況和進展,精細化地管理銷售過程;
■ 準確判斷溝通中所講到的話題和流程節點,提供實時的AI銷售助手;
■ 自動提取客戶在溝通中表達出的“動態”畫像標籤資訊,加深對客戶的瞭解;
■ 自動化提取對話中的關鍵資訊,自動生成工單,減輕員工手動處理的流程負擔;
■ 準確識別“銷售誤導”等違規行為,提升業務的合規性……
盤古NLP大模型的更多能力即將解鎖
盤古零樣本NLP平臺是迴圈智慧推出的零門檻AI開發平臺,支援資料管理、資料標註、模型訓練、模型部署等一站式NLP模型開發。
目前盤古零樣本NLP平臺已上線“文字分類”等任務。接下來,盤古平臺還將陸續上線多種型別的NLP任務,包括文字匹配、文字摘要、命名實體識別(NER)、事件抽取、情感識別和通用模型等,幫助企業規模化地利用先進的自然語言處理技術賦能業務,將自然語言處理技術的價值最大化。