基於中銀智慧風控平臺的應用探索

danny_2018發表於2023-11-14

引 言

業界普遍認為,大模型概念正式提出起源於預訓練模型應用,從2017年Transformer演算法被提出,到2022年ChatGPT的出現,歷經了模型引數量快速提升、學習資料量大量積累,再到引入基於人類反饋的強化學習等階段,未來仍將會快速迭代與發展。

中銀金融科技有限公司 總裁 唐嘯

隨著AI技術的發展,銀行智慧風控系統也在不斷髮展和演變。面對海量複雜的資料,如何建立智慧、精準、合規的風險評估和預警機制,是銀行風控體系建設需要解決的關鍵問題。基於“大資料+大算力+強演算法”相結合的大模型技術,為構建新一代智慧風控系統提供了新的有效手段。

本文重點討論大模型技術在銀行業的應用價值與挑戰,對於當下大模型在銀行業的應用路徑進行了分析。以風控領域為例,資料層和應用層是目前大模型在風控領域較為可行的應用場景,大模型的應用對於風險報告質量提升、風險預警監控的加強及風險圖譜的分析最佳化都具有顯著作用。本文也建議在應用場景選擇、技術應用及配套建設等幾個方面做出重點考量,以推動大模型技術在銀行業的落地應用。

大模型技術在銀行業的

應用價值和場景選擇

近一年來,大模型相關話題熱度在全球持續走高,並以驚人的技術迭代和應用演進速度帶動了各行業企業的競相佈局。而作為最早應用大模型技術的領域之一,金融業也正積極試水大模型在行業內各領域和場景下的應用。今年3月,彭博針對金融業推出大型語言模型BloombergGPT,引發市場對金融領域大模型的關注。在國內,5月百度度小滿開源國內首個千億引數金融大模型“軒轅”,6月恆生電子釋出金融行業大模型LightGPT,並宣佈將於9月底正式開放試用介面。然而,雖然銀行業應用場景豐富,從基礎大模型走向銀行核心業務場景的規模化應用仍面臨重大挑戰。

1.銀行業應用場景豐富

大模型在銀行業的應用,從價值創造邏輯上可分為兩大類。

一是代替人執行重複性任務。生成式AI可以替代人開展大量重複性較高、簡單基礎的任務,如處理文字的要素提取、識別異常項、生成基礎資料分析等。這能夠釋放運營類人力資源或缺乏流程操作經驗的初級序列人員,實現降本增效。

二是協助人提高複雜決策的效率。利用大模型的創造能力,AI可以成為助手,有效放大關鍵崗位員工的產能,尤其是投資顧問、產品經理、開發人員、信貸審批經理等角色。在關鍵的業務流程中,大模型可以有效整合關鍵資訊及素材,助力相關專業崗位的人員,更快做出精準有效的判斷,更快速地產出高質量程式碼或文案等交付物。

2.商業化落地存在風險和挑戰

當前,銀行業大模型的商業化落地面臨著諸多挑戰。

一是資料安全和洩露風險。大模型的研發和應用過程中可能存在資料洩露和安全風險,尤其是當銀行機構依賴於對第三方底層大模型公網API的呼叫時,資料安全問題更為突出。如何保證在利用大資料的同時,確保資料的安全,是銀行業應用大模型必須考慮的問題。

二是資料時效性問題。金融大模型的訓練依賴於已有的資料,這種依賴性會導致模型訓練和預測存在明顯的滯後性。這種滯後性可能使大模型無法及時反映外部環境的動態變化,影響決策的穩定性和準確性。

三是決策穩定性問題。即使有了高質量的訓練資料,因為模型結構、解碼演算法、暴露偏差等原因,大模型仍可能出現幻覺現象,無法做到每一份決策都穩定、精確。這一問題與銀行業場景強調安全和審慎的特點產生了衝突。

四是個人隱私保護問題。在金融領域,大模型的訓練和應用需要用到大量的個人資訊。然而,目前尚無法律明確個人資訊使用邊界,這就導致使用包含個人資訊的資料訓練金融大模型存在合規風險。

五是計算模型的缺陷。大模型缺乏透明度、可解釋性和一致性。大語言模型的複雜結構使得模型難以解釋和說明其是如何作出決策的。雖然模型能為其決策提供高質量的事後解釋,但仍然難以利用這類解釋來驗證模型作出決定的過程,這就導致我們無法識別模型中存在的偏見和錯誤。目前,大模型缺少檢驗生成內容與訓練資料是否一致或自洽的方法,因而導致其缺乏一致性。

3.場景落地需審慎分步進行

在應用探索初期,各家銀行通常優選少量場景先行試水、循序漸進。在選擇場景時,要平衡考量收益潛力、風險、實施難度。同時,最早落地的試點場景,還需考慮其能否在組織準備度診斷、方法構建、信心構建等角度形成示範效應。以下幾個問題,是場景定位時通常需要面對的權衡選擇。

一是大模型的角色定位。即使是同一個業務場景,取決於AI的角色定位不同,其收益潛力和實施難度也不盡相同。目前來看,雖然大模型有潛力出色完成決策類場景的任務,但這並不意味著就是當下優先順序最高的場景。機器往往難以對目前銀行業複雜的決策場景進行穩定的、透明的、可解釋的輸出,即存在決策穩定性問題和計算模型缺陷問題。相反對於基礎性、重複性的工作,例如只對事實性資訊進行自動抓取和歸納,或判斷某一資訊的好壞型別,大模型的價值釋放潛力短期來看可能更為顯著。

二是對客還是對內。在對成本收益進行考慮時,不僅要考慮直接的運營人力節約的收益,還要考慮因資料洩露、隱私保護等潛在問題可能導致的額外間接成本。由於銀行業在開展對個人客戶的銷售時,往往較其他行業面對更嚴格的行為監管和內控要求,直接對客的場景首先試水大模型應用,實際挑戰更大。

三是是否要替代目前已在應用的傳統AI。研究表明,傳統AI模型在不少場景仍具有很強的能力,其與大模型在相當長一段時間內會共存。從單一任務來看,傳統機器學習模型較為擅長的是需要較強解釋性、需要進行量化預測結果的任務。而大模型擅長的是產出業務內容、答疑解惑式場景的任務。因此未來,大模型和傳統的單任務模型之間,更可能是強強結合、同時使用的關係。

因此從一般的智慧風控系統架構(資料來源、資料平臺、執行層、計算層、應用層)來看,結合大模型在銀行業的價值和風險,資料層和應用層更適合作為大模型在風控領域的先行場景。在資料層利用大模型的NLP、影像語義識別等能力,進行非結構化資料要素提取、風險指標提煉和基礎資料分析等低難度、重複性、基礎性工作,體現其“替代人”的作用。在應用層利用大模型的資訊挖掘、文字生成等能力,生成信貸調查基礎版報告,協助信貸審批人員進行貸款審查,體現其“輔助人”的作用。

大模型技術在銀行智慧風控領域的

應用初探

為了矢志踐行服務國家發展大局之路,堅持科技創新,中銀金融科技有限公司作為中國銀行的金融科技子公司,已啟動大模型在銀行業及智慧風控領域的研究和探索。

中銀智慧風控平臺承載了中國銀行數十載信貸風險管理經驗與成果積累,平臺在產品構建、資料處理、技術運用方面均為自主創新設計。平臺由“永珍”風險360全景檢視、“天網”風險圖譜多維分析、“洞鑑”風險預警監控平臺、“神策”風險決策引擎、“妙算”風險模型工廠、“運籌”機構全面風險管理大盤6大應用產品組成,並透過多年建設積累,形成中行特色的企業級風險知識庫及風險模型成品庫。貫穿信貸全流程,覆蓋科技金融、綠色金融、普惠金融等多個金融業務場景,為提前識別風險、處置風險提供有力支撐。大模型技術將為中銀智慧風控進一步的數字化升級和創新提供新的有效手段。

當前三種較為可行的應用場景包括如下。

1.風險報告生成

中銀智慧風控平臺目前可實現貸前調查報告及授信審查報告自動化。在授信流程中智慧化自動生成貸前調查報告及授信審查報告,減輕一線人員資訊收集及撰寫報告工作量,減少因人員能力差異或資料收集困難造成的客戶風險未識別、低估問題。同時平臺每日可生成使用者關注客戶的風險掃描日報,並透過移動端推送日報結果,快速高效知曉最新風險動態。

利用大模型技術與RPA技術相結合,透過嵌入外部資訊模組,學習客戶歷史資料及文字資料,分析財務資料及風險資料,可實現關鍵要素提取、資料自動化稽核、風險點提示等風控領域的業務操作,自動生成標準化貸前調查報告和信貸授信發起報表。信貸人員僅需要在此基礎上作少量修改,就能形成一份完整準確的報告,有利於降低稽核的風險,提升稽核的效率和質量。

2.風險預警監控

在資料層面,中銀智慧風控平臺已整合了內部信貸、會計、資產負債表、審計等系統資料,實現行內資料的全面呼叫和挖掘,打通內部資料孤島,外部引入工商、司法、網際網路輿情、投融資、宏觀等資料資訊,實現外部資料彙總。同時平臺已建立了全面的風險預警監控體系,可依託智慧風控體系提供各類分析應用和風險預警。利用大模型技術,可以進一步挖掘風險特徵和資訊,提高風險預警的準確性和及時性。

大模型對於風險預警監控的最佳化可以體現在兩方面。一是結構化資訊提取能力的提升。大模型的應用可以大幅加強文字資訊中的結構化資料提取。例如,相比常規深度模型,大模型從文字中識別出包括公司、政府、社會組織等在內的機構名稱的準確率和召回率更為理想,有助於風控系統進一步挖掘機構的風險資訊,提升風險預警的準確性。二是輿情風險識別能力的加強。例如對於從新聞資訊等非結構化資料中進行風險分類的任務,人工識別的做法效率較低,使用常規深度模型進行識別的準確率較低,而使用大模型能使準確率和效率獲得較大幅度的提升。

3.風險圖譜分析

中銀智慧風控平臺風險圖譜分析產品,提供了包括單一客戶維度的綜合圖譜、股權圖譜,以及客戶群維度的集團關係等的圖譜視覺化展現、實體間路徑探查、分析及深層次隱性關聯關係挖掘服務。基於大模型的語言理解能力,風險圖譜的關係識別與風險推理能力可以得到進一步的增強。

知識圖譜是一種表示和組織領域知識的結構化資料模型,它由實體、屬性和關係組成。知識圖譜技術當前面臨語料資料標註效率低、知識抽取質量難以保證、語義理解和自然語言處理難度大等瓶頸,而透過藉助大模型的結構化資訊提取能力,知識圖譜面臨的這些瓶頸可以得到改善和補足。例如,從風險輿情非結構化文字中進行因果關係的三元組提取、事件論元抽取,都可以透過大模型,輔以LangChain等LLM互動工具進行實現。此外,基於大模型,還可以從圖結構資訊、節點屬性和模型特徵中提取關鍵資訊,生成智慧風險報告,並透過基於特徵的聯動圖譜視覺化展示,使得風險分析更加智慧化和直觀化。

銀行業大模型應用落地的建議

雖然大模型在銀行業的落地應用具有多重挑戰,但我們仍對銀行業推進大模型應用落地充滿信心。一方面,銀行業具有豐富的應用場景,另一方面,銀行業更具備了由點及面推進大模型應用的三大條件,即紮實的數字化基礎、完備的技術能力和多元豐富的資料。總結來看,在推進技術落地過程中有三點需予以重點關注。

1.應用場景需由點及面

在探索初期需平衡收益和風險,優先選擇非直接對客場景。例如將大模型應用限制在問題域相對明確的場景,或將大模型作為生產率提升的工具助手,透過有效的人機協同,提升邏輯可解釋性。同時需建立嚴格的並行驗證測試機制,強化決策行動的人工稽核把關。銀行業務場景不同於ChatGPT等商用對話類大模型提供的消費級對話場景,一旦大模型出現推理錯誤和產生幻覺,輕則影響客戶體驗,重則影響金融系統安全,需要採取審慎態度。

2.技術層面需多管齊下

以強化學習和持續學習技術、魯棒性決策、組合式AI系統技術等關鍵技術為抓手,讓AI生成的內容更專業、實事求是。大量研究表明,透過調整預訓練任務、使用強化和持續學習等方式,可以對原始的大規模預訓練模型做進一步最佳化,達到更好的效果;魯棒性決策則是實現關鍵決策的持續穩定和合規可信的核心環節;組合式AI系統技術可以有效結合各種垂直領域的判別式模型的可用性和專業性,助其真正發揮大模型的泛化能力優勢。

3.配套建設需全面升級

規模化應用需關注技術之外的整體IT能力提升和組織及業務的轉型。大模型在銀行核心業務的規模化應用是一個體系性工程。除了模型和算力的部署,當大量運用AI時,需要有操作行為規範,引導員工進行合適的資訊輸入並對機器輸出進行合理的判斷和使用。圍繞質量管理、風險監控、責任認定等,也需構建匹配的管理機制。銀行還要構建負責任AI體系,在精調和應用開發時,盡力確保公平性、可靠性、透明度或可解釋性、隱私安全、可問責等目標。

來自 “ 金融電子化 ”, 原文作者:中銀金融 唐嘯;原文連結:https://mp.weixin.qq.com/s/q2Nyh7wkNlmg2srL6LVzkg,如有侵權,請聯絡管理員刪除。

相關文章