首先,為學術研究而生的大規模預訓練模型,往往以人工收集構造的相對通用化的資料集作為基準,以較理想化的設定來進行實驗(比如類別均衡的多分類問題),這些都跟模型最終的實際落地應用有明顯出入。因此,我們必須從開始打造它的第一天起,就考慮大模型將來怎麼在企業級應用中落地。其次,以單純學術研究為目標的大模型,到了重新整理榜單最好成績這一步,就拿了研究專案的高光時刻,並不需要參與後面漫漫無期的落地應用過程。但對我們而言,只能高興一天時間。還是同一批人,不是把孩子生出來就行了,還要負責養大,培養孩子做出最大的貢獻。餘承東釋出由迴圈智慧和華為雲聯合開發的盤古NLP模型迴圈智慧(Recurrent AI)聯合創始人楊植麟是“大模型”的佈道者,也是深入業務前線的公司產品負責人,因此非常關注前沿AI技術的落地策略。他認為,“超大規模模型是價值最大化的基礎,但重新整理CLUE榜單成績只是模型能力的初步驗證,盤古NLP大模型更大的價值是帶來AI落地的效率革命和應用場景擴充套件。”
三大技術創新,專攻大模型落地難題
在盤古NLP大模型研發過程中,迴圈智慧的 NLP Moonshot 團隊拆解了GPT-3等大模型很難在商業場景中得到應用的三大原因:1)大模型在應對複雜商用場景的小樣本學習能力弱;2)難以結合微調擴充套件業務場景;3)難以融入不同領域的知識。然後,一一進行擊破。第一,盤古NLP大模型在小樣本學習任務上超越GPT-3,解決後者難應對複雜商用場景的少樣本學習問題。比如在企業客戶的心聲分析和員工執行力分析應用場景中,使用盤古NLP大模型生產語義標籤時,實測得到目標結果所需的樣本量僅為GPT-3模型的十分之一,即AI生產效率可提升十倍。第二,盤古團隊在預訓練階段加入了基於 prompt 的任務,大幅降低微調難度,解決以往大模型難為不同行業場景進行微調的問題。在下游資料充足時,微調難度的降低使得模型可以隨著資料變多而持續最佳化;在下游資料稀缺時,微調難度的降低使得模型的少樣本學習效果得到顯著提升。比如,在企業藉助溝通內容判斷客戶購買意向,以找出更多目標客戶從而提升轉化率的場景中,實測盤古NLP大模型相比GPT-3可提升 27% 的成單轉化率。第三,除了能像GPT-3等僅基於端到端生成的方式以外,盤古NLP大模型還可以透過少樣本學習對意圖進行識別,轉化為知識庫和資料庫查詢,解決以往大模型難融入行業知識和資料的問題。比如在金融服務場景中,盤古NLP大模型能更好地為實時溝通輔助系統提供底層能力,幫助服務人員更快掌握專業知識和溝通經,更快提升業務水平。三種企業應用,增強“人”的能力
在高附加值的產品銷售與服務過程中,如保險、房產、教育、財富管理等行業,企業需要藉助人與人之間的溝透過程,讓銷售人員與客戶建立更緊密的聯結,提供更專業的服務。但由於銷售人員的素質和能力提升緩慢,同時企業缺乏對目標客戶的瞭解,導致客戶體驗不佳,業績也難獲增長。“企業的員工在與消費者溝通交流時,代表的是企業自身形象。因此,提升員工的業務水平和表現,是企業重塑消費者體驗的重要環節。”迴圈智慧CEO陳麒聰表示。
基於盤古NLP大模型等核心技術,企業可以獲得更強的人員產能提升、精準銷售和新一代合規質檢解決方案,從而更快地提升銷售人員能力、更快地找到目標客戶以及降低合規風險。
人員產能提升 Expert↑:藉助深入業務流程的優秀實踐挖掘、溝通實時輔助和執行監督報表產品組合,幫助企業將優秀銷售人員的實踐經驗傳遞給每一名普通銷售。在與客戶溝通中實時輔助銷售人員,提升他們的表現,將他們為企業創造的價值最大化。精準銷售 Target↑:迴圈智慧開創了基於溝通對話資料與成單結果的意向預測模型,透過演算法模型,可篩選存量線索中的高意向線索,或篩選對某產品更感興趣的客戶名單,幫助銷售人員更精準地找到目標客戶,提升銷售和服務效率。新一代合規質檢 Compliance↑:不同於基於“關鍵詞+正則”的傳統方案,迴圈智慧提供高準確率和召回率的AI語義質檢方案,配合獨家的“違規率排序”功能,可助力質檢員多找出數倍違規對話,幫助企業大幅降低合規風險,提升服務質量。超大規模語言模型是前沿NLP技術與落地應用的交匯點,隨著下一步通用API的開放,企業可以解鎖更多應用場景。