螞蟻智慧內容合規稽核產品探秘

螞蟻技術發表於2023-01-14

隨著網際網路服務的不斷深化,產品營銷的形式從傳統文字、長圖文,增加到短影片、直播等新媒介形態,展現形式愈加豐富的同時,也為營銷宣傳內容合規稽核帶來了諸多難題。

  • 如何解決與日俱增的稽核量與合規稽核人員有限之間的矛盾?
  • 如何提升稽核效率,滿足業務部門快速釋出需求?
  • 對於音影片、直播,如何對這些新媒介形式實現高效高質量的稽核?

基於上述挑戰,螞蟻數科推出了全棧式智慧內容合規稽核平臺產品。該產品基於AI智慧技術及專業內容稽核規則沉澱,向金融、網際網路、政企、傳媒等行業客戶提供一站式智慧內容合規稽核解決方案,可助力機構有效降低營銷合規風險。

值得一提的是,螞蟻集團基於內部解語花平臺與博時基金共建的基金內容合規智慧稽核系統是國內的領先實踐,榮獲了第八屆證券期貨科學技術獎優秀獎和2021年度深圳市金融創新獎三等獎。該稽核系統具備高度自主智慧財產權,處於國內外領先水平。

一、產品能力

合規專家人力有限,越來越無力支撐海量內容的人工稽核,且人工風險排查存在排查標準不統一,風險挖掘不深入,評審結果無沉澱等一系列問題。

螞蟻智慧稽核產品基於人工智慧技術及專家經驗的解讀和沉澱,提供了一站式的營銷合規風險管控解決方案,將監管要求進行數字化轉譯,透過程式化手段實現快速的機審策略配置;同時提供了統一稽核服務接入,支援文字、圖片、語音、影片、直播、檔案等全媒體格式的營銷宣傳內容識別,結構化內容特徵,進行規則推理,完成風險決策和處置。

多媒體內容識別
支援全媒體格式處理,適用於企業級推銷產品或服務的文字、圖片、音訊、影片、直播或其他內容展示形式,以實現針對使用者可感知的應用頁面、營銷宣傳、金融產品資訊、銷售行為過程等內容的全媒體格式的智慧稽核。

智慧內容稽核
合規專家會將自己的稽核經驗總結成規則或違規風險點,基於特定稽核場景,融合各類演算法模型構建複雜且精準的策略體系,打造感知引擎-認知引擎-決策引擎為核心的多媒介金融風險精細化稽核引擎,達成以機器稽核代替人工稽核的目標。

二、技術內幕

1.多媒體內容識別
在內容稽核的過程中,針對不同的內容往往需要採用不同的處理方式來達到稽核的目的。日常遇到的內容包括營銷廣告、產品頁面文案、啟動屏、IM、電銷、直播、超連結、氛圍圖、彈窗、資訊流、PUSH、簡訊、郵件等各種面向消費者的資訊展示形式,這些內容大多以各種素材類似一張圖片/一段音訊/一段影片等方式承載。內容處理中心服務於稽核前的內容預處理環節,即從這些素材中提取出需要稽核的資訊,進行內容轉換、抽取、壓縮等。

1.1基礎能力建設:

  • 檔案處理:提供檔案內容抽取、檔案型別轉換、檔案生成圖片等多種檔案處理功能。
  • 圖片處理:提供圖片壓縮、智慧切割、影像增強、降噪處理等多種影像處理能力。
  • 音影片處理:提供音影片轉碼,影片抽幀,音訊檔案提取,語音ASR、增強、降噪等多種能力。

1.2 複雜處理流程編排: 為了應對靈活多變的內容處理流程,內容處理中心支援自定義內容處理流程編排,針對不同場景透過自定義指令碼的方式實現內容處理節點的靈活編排。譬如為了滿足複雜監管要求,當影片中語音涉及產品業績介紹時,影片頁面應當播放業績展示板,透過自定義指令碼的方式實現影片抽音訊後,識別其中關鍵內容,再抽取對應時間圖片,進行聯合送審。

2.智慧內容稽核及規則編排
為識別更復雜且隱蔽的金融風險問題,提升合規風險識別的準確率和召回率,我們建設了感知&認知&決策三層漏斗式處理引擎。同時建立統一演算法能力接入平臺,實現原子演算法能力業務無感插拔。最後在呼叫節點的輸入輸出之間加入了工程能力介入,如灰度圖等,以增強演算法模型的識別能力。

與天生具備自然屬性的概念不同,監管合規概念是由社會活動的演進而出現,再由相關監管部門進行定義與規範的,專家會將自己的稽核經驗總結成規則或違規風險點,機審則需要對這些規則進行演算法實現,規則生產配置的過程其實就是將一項項專家經驗轉換成機審能力的過程。在這個過程中,規則數量大,需要覆蓋的場景多,為每條規則研發一個指令碼工作量大,後期維護成本高昂。同時在研發規則指令碼時,發現很多規則是有相似的處理邏輯的,且具備一定順序性,由此提煉原子能力,設計出一套規則的編排方案,快速實現業務規則,同時在規則發生調整時可快速切換組合方式,同時可以基於簡單的配置化,做到業務的快速接入和使用。

3.模型迭代最佳化
稽核中演算法模型的最佳化迭代更新依賴大量的標註樣本。在內容合規領域,沒有成熟、直接可用的樣本集,強依賴合規專家經驗的持續輸入,然而合規專家打標的人力成本和時間成本都非常高昂,因此如何降低打標成本是內容合規領域的重中之重。圍繞著這個問題,我們採用了小樣本學習、主動學習、噪聲學習等技術,在打標環節篩選高質量的樣本,節省專家時間的同時使演算法模型達到業務要求的精度,提高人在迴路體系的效率。

以小樣本學習為例,我們使用大規模預訓練語言模型,使用NLP的prompt(模板填充)模式,結合半監督學習,充分利用未打標樣本,能夠在樣本量減少一半的情況下,模型效果保持不變。在特定任務中,樣本量能減少到原先的1/5。在這套框架下,“人”、“資料”、“模型”三者是互相提升的,資料在整個迴路裡從未標註變成強標註,人從對稽核規則有初步理解變成稽核方面的專家,模型從無監督到強監督。

三、落地案例

博時基金-螞蟻智慧稽核樣板間 丨透過AI技術,實現基金產品銷售素材智慧化稽核服務

螞蟻智慧稽核產品一直以來致力於為使用者提供智慧內容合規稽核能力,與行業共建合規規則庫,持續最佳化更新。在基金產品宣傳材料方面,博時基金引入了螞蟻集團智慧合規稽核服務,構建博時基金內容管理與智慧稽核平臺。 智慧稽核能力提升了合規稽核效率,降低合規風險,大幅最佳化了業務-合規稽核流程。內容管理平臺提供營銷素材儲存、管理、複用、共享服務,助力不同素材需求方快速獲取稽核透過的定稿素材,提升營銷品宣效率。

博時基金與螞蟻共建的智慧稽核系統還具備以下兩大特點:

技術創新點:基於深度神經網路框架,運用大規模預訓練、多模態識別、人在迴路演算法等技術構建了國內領先的金融合規模型叢集,將合規專家經驗轉化為智慧稽核能力,解決了複雜語境下的準確率和稽核效率問題。

業務創新點:圍繞內容生命週期,部署全流程的合規管理應用場景,並創造性實現了人機結合應用介面,創新實現影片直播類智慧合規稽核,從“0到1”的突破。

目前螞蟻集團智慧合規內容稽核產品已開始向基金、保險、銀行等金融機構推廣落地。

圖片

四、未來展望

目前,智慧稽核產品已經廣泛應用在包括螞蟻保、螞蟻基金、網商銀行、博時基金等多家機構,持續幫助機構定位與洞察合規業務風險,提升業務協同效率。同時螞蟻智慧稽核產品現已向金融機構提供商業化服務,期待與更多機構共建行業合規規則庫,開展合規領域大模型的構建和應用實踐,進一步提升智慧化水平。

後續我們會持續分享螞蟻集團智慧合規內容稽核能力演進過程中的落地與思考,歡迎大家提出任何意見與建議。

如有興趣,可以聯絡:gengliu.gl@antgroup.com

相關文章