智慧質檢升級換代：為什麼“關鍵詞”不夠用了？

迴圈智慧發表於2020-02-24

原文網址 : https://www.jiqizhixin.com/articles/2020-02-24-7

市面上有很多面向銷售和客服人員的語音質檢系統、文字質檢系統，絕大部分產品實際使用的是基於“關鍵詞+正規表示式”的機器質檢系統。

這種方法的主要優點是部署和上手使用都比較快，主要缺點是存在非常嚴重的漏檢情況。就像一個漏孔很大的篩子一樣，難以滿足企業對質檢的需求越來越精細、對質檢效率要求越來越高的發展趨勢。

因此，在“關鍵詞+正規表示式”之外，我們開始越來越多地為客戶提供基於“語義點+機器學習”方案，並且在實際使用中為很多質檢項帶來 2~10 倍的效果提升。也就是說，能夠多發現 2~10 倍的問題。對於企業而言，這就意味著他們可以更快、更全面地提升服務質量或者實現合規升級。

下一代機器質檢：從關鍵詞到語義點

語音和文字質檢的主要任務是找出不合格、不合規的地方，即減分項，通常也被稱為“負向質檢”（另有一種任務是找出做得好的地方，即加分項，通常也被稱為“正向質檢”）。企業使用傳統基於“關鍵詞+正規表示式”的產品做質檢，所遇到的最主要問題是“找不全”，通常會漏掉很多不合格、不合規之處，導致質檢效率大打折扣。

看一個實際對比的例子。某網際網路公司的基礎質檢項“服務態度問題”，在我們的實際應用中：使用傳統“關鍵詞”方案，一天的資料中能找出 13 條，100% 是正確的；使用新的“語義點”方案，能找出 134 條，其中 72% 是對的。所以從最終正確的條數來看，新的“語義點”方案多找出了 8 倍的問題。 智慧質檢升級換代：為什麼“關鍵詞”不夠用了？

再看一個實際的例子。“恐嚇威脅”是貸後資產管理領域的基礎質檢項，即催收員不允許在電話裡“恐嚇威脅”債務人。在我們的實際應用中：使用傳統“關鍵詞”方案，四天的資料中能找出 316 條，其中 55% 是正確的；使用“語義點”方案，能找出 2203 條，其中 72% 是對的。從最終正確的條數來看，174條對比1596條，新的“語義點”方案能多找出 9 倍的風險。智慧質檢升級換代：為什麼“關鍵詞”不夠用了？

原因其實很簡單。如果使用基於“關鍵詞+正規表示式”的方案，方法是用關鍵詞的組合來涵蓋每個質檢項的不同表達方式——但是你可以寫10個關鍵詞，100個關鍵詞，卻永遠不可能窮盡，因為語言的表達方式是非常多樣的、千變萬化的，必須通過整個句子的上下文語義才能做出更準確的判斷。

上下文語義質檢的技術原理

語義點+機器學習的方案，目標是訓練一個機器學習演算法模型，使之能夠判斷關鍵詞未覆蓋的句子是否命中了質檢項。

我們以另一個貸後資產管理領域常見的質檢項“暴露客戶隱私”為例。從標註到訓練模型，再到最後上線使用，新的“語義點”方案大致可以分為三個步驟。

第一步，使用我們的“標註工廠”產品，通過人工的方式，將是“暴露客戶隱私”的句子標記為“正例”，將不是“暴露客戶隱私”的句子標記為反例。

智慧質檢升級換代：為什麼“關鍵詞”不夠用了？ 第二步，將一定規模的經過標註的正例和反例都“喂”給訓練器，讓訓練器學習到一個演算法模型，這個演算法就能用來判斷新句子是不是涉嫌暴露客戶隱私。

第三步，在質檢產品中，系統就可以標記出所有命中“暴露客戶隱私”語義點質檢項的句子，複檢員可以快速定位到該質檢項所處的位置，迅速進行核實。此外，複檢員每一次複檢的操作，都相當於對演算法模型進行了一次反饋，會幫助演算法模型變得更準。

智慧質檢升級換代：為什麼“關鍵詞”不夠用了？最終，我們發現通過“語義點”方案能比關鍵詞的方案多找出數倍的不合格、不合規之處，達到召回率（找的全）、準確率（找的準）均在 80% 以上的效果。

上下文語義質檢的底層邏輯

從底層邏輯上看，基於“關鍵詞”的方案是字元級別的，並不關心句子的語義，而基於“語義點”的方案是句子級別的，非常關心句子上下文的邏輯和語義。兩者並不在同一個維度。可以想見，未來關鍵詞方案越來越難當大任，而語義點的方案會逐步成為主流。

智慧質檢升級換代：為什麼“關鍵詞”不夠用了？不過，語義點方案也有一個顯著的缺點“部署成本高”。為了訓練一個語義點的質檢項，需要人工標註大量句子，然後訓練和除錯演算法模型。因此，大家並不會立即就把所有質檢項切換到“語義點”方案，而是優先把那些最常見的質檢項切換到“語義點”方案。

總結迴圈智慧在教育、金融、網際網路服務等不同行業數十家客戶的服務經驗，我們發現質檢項與違規數的關係也存在“二八法則”——20%的質檢項貢獻了80%的違規數，所以將最常見質檢項升級到“語義點”方案，即可為整個業務帶來顯著的效果提升。

同時，我們也應該瞭解到，隨著自然語言處理領域新技術的突破，從字元級“關鍵詞”方案，向句子級“語義點”方案轉換的速度正在加快。過去兩年，自然語言處理領域迎來了繁榮時期。Google 發表於 2018 年的 BERT 模型，為行業帶來了全新的技術思路，具有里程碑意義。2019年6月，作為 BERT 模型的一種重要的改進方案，XLNet 模型在 20 個標準任務集上超過 BERT，並且在 18 個標準任務集上取得 state of the art 成果，包括機器問答、自然語言推斷、情感分析和文件排序等。

智慧質檢升級換代：為什麼“關鍵詞”不夠用了？

XLNet 模型由迴圈智慧聯合創始人楊植麟博士（第一作者），與谷歌大腦、卡內基梅隆大學共同推出。該模型具備編碼超長序列的能力——簡單理解就是可以更好地理解長句子。2019年末，XLNet 被人工智慧領域的頂級學術會議 NeurIPS 2019 接收為 Oral 報告論文（佔比 0.5%）。同時，XLNet 也入選了權威的中國人工智慧學會《2019人工智慧發展報告》，被稱為 BERT 之後重要的進展之一。

迴圈智慧（Recurrent AI）正是基於原創的、世界前沿的 XLNet 模型，在智慧質檢產品中的加速向“語義點”方案轉換，取得遠超傳統方案的效果。過去一年，我們的智慧質檢系統獲得多家金融、教育、網際網路服務領域贏得多家標杆客戶的商業訂單，包括眾安保險、玖富、CBC、華道、你我貸、人人貸、新東方線上、獵聘等。

為什麼普通AI不夠用？定製AI Agents工具是關鍵！
2024-10-15
AI
什麼是長尾關鍵詞？如何找到長尾關鍵詞？
2020-10-17
什麼是關鍵詞策略？網站關鍵詞佈局重要嗎？
2020-07-28
網站
關鍵詞感知檢索
2024-11-14
2023雲棲大會關鍵詞：開放、大模型、MaaS、產業智慧升級
2023-10-31
大模型產業
AI繪畫怎麼寫關鍵詞？AI繪畫高畫質桌布關鍵詞分享
2022-11-28
AI
為什麼整站優化的關鍵詞排名更平穩
2021-12-15
優化
為什麼Edge AI是2019人工智慧行業最重要的關鍵詞之一？
2019-11-28
AI人工智慧行業
為什麼要轉行Java開發？十個理由夠不夠
2021-11-19
Java
關鍵詞加粗和插入關鍵詞
2020-06-01
高效的關鍵詞替換和敏感詞過濾工具
2020-08-19
質量雲時代，WeTest品牌全面升級
2022-06-15
電腦記憶體不夠用了怎麼辦電腦記憶體不夠用的方法
2022-05-04
記憶體
為什麼SSB與PRACH occasion能夠關聯？
2022-04-19
為什麼SAP ECC系統需要升級？升級路徑有哪些？
2022-10-10
是什麼決定了關鍵詞的競爭力？又該如何提升關鍵詞競爭力？LEE
2022-03-19
自媒體關鍵詞佈局怎麼做，快速提升文章質量？
2022-04-26
我為什麼要升級到Ionic3
2019-02-16
擴容新生代為什麼能夠提高GC的效率
2022-01-26
GC
資訊時代，為什麼還讀紙質書
2022-04-22
為什麼特斯拉永遠不會做換電？
2022-03-03
SAP:什麼熱什麼不熱為什麼你會關心?（轉）
2019-07-19
為什麼我們需要volatile關鍵字？
2019-05-25
robot 關鍵詞
2018-05-04
關鍵詞提取
2024-04-05
Java jvm級別native關鍵詞、JNI詳解
2020-12-18
JavaJVM
水電費都掙不夠，為什麼阿里還要和小米在智慧音響上死磕？
2018-03-22
阿里
匹配關鍵詞和敏感詞
2020-07-05
Mysql 如何實現全文檢索，關鍵詞跑分
2020-08-25
MySql
強制換行快捷鍵ctrl加什麼 wordexcel換行快捷鍵是什麼
2022-03-30
Excel
為什麼win鍵不管用了_win10的win鍵不能用的解決方法
2020-01-03
Win10
讀懂這三個關鍵詞，就明白迅雷鏈為什麼受開發者歡迎
2018-11-16
什麼是IPv6？企業為什麼要升級IPv6？
2022-06-01
為什麼async/await關鍵字是如此重要
2018-09-13
AI
網站關鍵詞堆砌後，處理關鍵詞堆砌方法
2020-10-18
網站
替換快捷鍵ctrl加什麼 word查詢和替換快捷鍵是什麼
2022-03-11
為什麼不變性至關重要 - Janos Pasztor
2019-01-09
政府網站為什麼要做IPv6升級改造？
2023-01-10
網站

智慧質檢升級換代：為什麼“關鍵詞”不夠用了？

下一代機器質檢：從關鍵詞到語義點

上下文語義質檢的技術原理

上下文語義質檢的底層邏輯

相關文章