邦盛科技王雷:AI風控的「能力邊界」
本文作者: | 2020-06-18 10:13 |
沒有一條真理,可以解決人生所有的難題;也沒有一項技術,可以幫助一家企業所向披靡。
金融科技行業,縱使是一個簡單的專案,也需融合演算法、專家經驗、工程部署、介面打通等一系列環節,才能完成一套解決方案,遠不止一項單點技術就可以“打包票”。
在這個過於信仰技術的時代,知道技術能做什麼固然重要,知道它不能做什麼也許更重要。
為此,雷鋒網《AI金融評論》策劃了「AI能否解決金融剛需問題」系列選題,借同一個話題,對不同背景的受訪者、產品和客群各異的企業們進行採訪,期望在不同的商業和技術認知下捕捉觀點碰撞的火花。
在前三篇採訪中,我們採訪了冰鑑科技CEO顧凌雲、慧安金科CEO黃鈴、品鈦執行副總裁李惠科。
本系列的第四篇文章,由邦盛科技執行副總裁王雷講述他從事「AI金融風控」多年旅程中經歷的有趣故事。
以下為王雷的親身經歷:
“頭疼”的難題
一直以來,銀行對「信用卡套現」的行為都十分頭疼。
信用卡,本質上是一種貸款。銀行希望貸款用於消費,而不是炒股、炒房甚至賭#博。但是,現實生活中,很多人並沒有合規地使用這筆錢,從而衍生出了「套現組織」。
對於銀行來說,信用卡里的錢如果不是用於消費,而是用於投資、賭#博,一是增大了這筆錢不能返還的風險,二是違背了國家的貸款政策。
所以銀行會透過一些技術手段,對套現行為進行識別、監測。
邦盛科技之前就接到一個大型銀行的訂單,他們本身有一個在風控領域積累了很長時間和經驗的優秀團隊,但是還是希望在這個基礎上更上一層樓,於是找到我們,希望透過金融科技公司的AI能力,引入解決問題的新思路。
當時,這家銀行已經能很好地識別出哪些個體的行為屬於騙貸,但是對於那些變化多端、組織嚴密的“專業”騙貸團伙,還是有些束手無策。
在專案初始階段,客戶對我們的期望很高,認為我們一定能 透過更先進的技術和方法,透過對個體騙貸行為的分析,找到某種聯絡,識別出詐騙團伙。
那會兒,其實許多機構還沒能達到這樣的水準,即使是行業裡最好的金融機構投入了大量精力,也沒能十分精準的識別出這些詐騙組織。而我們又處於創業初期,經驗匱乏,當時並沒有信心能完成這個任務。
當然,有沒有信心和做不做,是兩碼事。我們決定接受這個挑戰。
一口氣“抓”了幾千個犯罪團伙
樣本,是智慧風控想要發揮作用的重要前提。
想要透過AI識別出詐騙團伙,追本溯源,還是得從高質量的樣本入手。
而樣本的質量高低,很大程度上依賴於專家的經驗。在風控領域,專家的經驗是比AI能力更稀缺、更重要的資源。比如薅羊毛是怎麼薅的、什麼樣的行為是薅羊毛,專家會透過多年積累的經驗和規則去識別哪些行為是“薅羊毛”、哪些行為屬於盜卡、哪些是洗錢、哪些屬於申請欺詐等等。
我們團隊中的優秀專家對這家銀行的樣本進行了分析,發現它們的樣本質量不是非常好。
於是專家們透過在風控領域多年的經驗,對樣本進行了加工,獲得了一些我們認為比較好的樣本。在此基礎之上,我們使用了機器學習建模平臺和關聯圖譜平臺,把可疑的個人和團伙都甄別出來。
那次,我們團隊幾個人在兩個多月的時間裡,揪出了大幾千個「信用卡套現團伙」,幾千個賬戶,並查出幾十萬張有問題的信用卡。
經過那段時間的不斷探索後,我們對整個行業的理解有一種豁然開朗的感覺。
之前,我們在沒有開始做“識別套現團伙”的工作時,認為這是一件很難的事。但下一次在做其他的事情,我覺得是可以解決的,而且思路非常清晰。
其實,那次專案因為涉及到的銀行體量非常大,我們面臨的風險和壓力也非常大。
但是我們頂住了壓力,積累了許多欺詐團伙的特徵和畫像,並對模型進行進一步的最佳化。
後來這家銀行透過我們提供的線索進行了調查,確定了這些人的確屬於套現團伙,並降低了他們的信用卡額度,並對部分信用卡進行鎖卡處理,效果非常好。
也是因為這次經歷,我對AI在「風控領域」的應用價值,有了更直觀的認識,使得我對AI在風控場景下的應用,更加有信心。
如今,邦盛科技為這家國有大行做了一個更大的專案,一個包含申請反欺詐、電子渠道交易反欺詐等全方位、全行級的反欺詐系統。
而“識別套現團伙”成為了整個大型專案中的一個組成部分,繼續為這家銀行提供服務。
抓住銀行的心
思之所想、解其所憂,才能抓住一個人的心。
同理,想要獲得銀行大單,首先要認識它,然後解決它做夢都想解決的問題。
在和銀行客戶打交道時,不一定所有時間、所有產品,它都會覺得滿意。這時,我們需要對專案的效果進行量化,沉浸到它的角度思考問題,讓它信任你。
因此,我們會時時刻刻追蹤AI產品的效果,並制定一系列可以看得見、摸得著的指標,讓它對我們工作的效果有一個清晰的認識,建立信任感。
比如攔截非法金額數目、對客戶的干擾率程度、風險等級,我們會把這些有關風控的資料或者結果記錄下來,作為統計最終模型好與壞的一個標準。
我們一般建議客戶,三個月或者是六個月調整或者最佳化一次模型。頻繁的調整,不是銀行的風格。
對於銀行等金融機構來講,“穩定”壓倒一切,其次才是改善。所以,他們對新技術的應用也是比較謹慎的。
銀行不會輕易改變自己現有的風控方法,因為改變意味著不確定的風險。只有觀察到技術和效果真的十分穩定,他們才會採用新的技術系統。
AI在信貸領域主要防控兩種風險,一種是欺詐風險,另一種是我們常見的信用風險,比如我們年輕人十分熟悉的“芝麻信用”和“微信支付分”。
一筆貸款的發放,銀行得先判斷它是否是有欺詐的風險,然後再判斷它信用風險的高低。
首先,金融機構最擔心的事兒是被騙子欺詐,把貸款放給了騙子。
當透過反欺詐技術將騙子拒之門外後,銀行還要擔心普通人能否正常還錢。普通人也有可能因為做生意經營不善、丟了工作或者社會環境的改變等因素,還不上錢,所以要判斷他們的信用風險。
在評估信用風險上,「評分卡模型」是可解釋性非常好、也很穩定的一個模型,現階段也使用的非常多,各家銀行都是比較習慣使用這種傳統的方式。所以,我們在這一領域,需要我們金融科技公司技術能力的場景並不多。
而在反欺詐領域,越來越多的金融機構開始接受機器學習模型。因為欺詐行為更具有隱蔽性,欺詐風險比信用風險更難以控制。
而且業內一般需要六個月來訓練控制風險的模型,上線模型至少又得三個月,加起來就是九個月。在這段時間裡,整個市場的欺詐形式是會發生很大變化的,欺詐團伙發現金融機構會欺詐行為進行防控後,他們還會變換手法。
針對這樣的情形,邦盛科技專門在模型訓練中設立了一個環節——特徵工程。在這個環節中,我們儘量呈現出更多的特徵,我們將幾千到上萬個特徵輸入到一個模型中,使它覆蓋更多的可能性,雖然不能徹底解決問題,但透過這樣的演算法調優,欺詐行為的成本會越來越高。
此外,銀行需要考慮自己所用的技術,是否符合監管政策的要求。
機器學習這類技術,最大的一個問題是不透明、不可解釋。它使用的是非線性的演算法,當模型說貸款可以放,但是它推理的過程是不可逆、也不可用文字解釋的,這樣在使用過程中就會受到一些限制。
模型本身是一個演算法的配合,我們也在嘗試透過一些技術方式,來增強模型的解釋性。
AI不是萬能的
邦盛科技從創業初始,到如今與中國農業銀行、中國建設銀行、招商銀行等多家大型銀行合作,對行業的理解也是經歷了一個從無到有的過程。
但是AI也存在很多不能解決的問題。
剛剛提到AI風控效果的好壞取決於樣本。在欺詐等場景中,樣本天然比較充足,而信用卡盜刷、賬戶盜用等場景下,因為銀行的防控力度比較強,發生的案件數量較少,能積累到的樣本也就較少,使得智慧風控的效果也是參差不齊。
現在,機器學習和AI應用在金融的各個領域都在嘗試,但是每個銀行對樣本積累的重視程度也不一樣,所以有的做的比較好,有的做的一般。
目前我們對樣本的依賴程度過高,所以業內很多公司也都在嘗試無監督或者半監督的技術方式。
有監督就是有樣本,無監督就是無樣本,半監督就是樣本質量不夠高。
有監督的樣本,是團隊從業務中一點點積累下來,透過規則體系和專家經驗,輸入到模型,然後模型跑起來。
採用無監督的方式,一般是因為團隊沒有積累樣本,又沒有這個領域的專家,於是依靠純粹的演算法,透過聚合量、聚類等數理關係,找出高風險的金融交易,提取這些異常的樣本後讓專家判斷。無監督的流程是先透過模型得出結果,讓人來判斷,然後模型再根據人的判斷的結果去最佳化。
在實踐中, 我們不管用哪種技術方法,我們都會建議客戶採用綜合的解決方案,而不是單一的AI產品,這套解決方案包含著專家經驗、規則體系、模型體系、圖譜體系、大資料計算等,這些元素必須結合在一起才能形成解決問題的合力。
社會上大部分的問題本身,都是一個很複雜的東西,它需要系統化的思路方法和技術才能解決,我們不能單一地認為依賴於某一個高新技術就能解決所有問題。
我們每年會招很多新人進來,也會接觸到很多新入行的創業者,我整體的感覺是,大家有點過於迷信技術,迷信高階的演算法。
任何一個技術的應用,都有前提條件,比如資料環境、樣本質量。每一次對AI模型的調整,少則三個月,多則幾年,運營的成本也非常高。
如果環境條件不允許,技術就很難達到大家期望的狀態。
所以對於很多這些新入行的優秀人才,我建議先對這個領域有一個比較深刻的業務理解,看看沒有能力給技術創造出一個好的環境出來。
沒有對業務足夠深刻的理解,不能把沒有達到期望的資料轉化成高質量的樣本,模型很難運轉起來。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2699398/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 阿里如何用 AI 提升風控能力?本週三晚直播揭曉阿里AI
- 借AI之勢,打破創意與想象的邊界AI
- 技術的邊界
- 《超越邊界》
- 二分查詢左邊界,右邊界,>=,>,<=,<
- 盛邦安全助力民政部搭建監控預警與態勢感知平臺
- 微服務邊界微服務
- NeurIPS 2024 (Oral) | 如何量化與提升思維鏈的推理能力邊界?
- 大資料徵信如何提升金融機構風控能力大資料
- css的邊界和補白CSS
- 【AutoCAD .NET】如何在無邊界Hatch上選擇邊界點?
- 關於運營邊界的思考
- React 錯誤邊界元件React元件
- 跨越邊界: Lisp 之美Lisp
- 【二分】【邊界判定】
- 【計算講談社】第七講|AI 的價值探索:如何擴充商業邊界?AI
- 乾貨丨AI助力金融風控的趨勢與挑戰AI
- 如何透過Graph+AI的方法打造高精度風控模型AI模型
- 無邊界網路的劃分建立
- 寫網路爬蟲的法律邊界爬蟲
- “有容乃大”的Cisco“無邊界網路”
- 能力更新|升級營銷簡訊和安全風控能力,快手小程式 SDK 內測招募中
- 邊界佈局管理器
- 邊界值分析法例項
- 色情/性感如何區分,怎樣的風控能力能防止“平臺兩行淚”?
- 風控沙龍 | 圖分析方法在業務風控中的應用
- 衝破邊界:遊戲為現實的切片遊戲
- 突破邊界,華為儲存的破壁之旅
- 劃分微服務邊界的5個特徵微服務特徵
- React 框架16版中的錯誤邊界React框架
- 金融界的科技“內卷”風來襲,看EBC金融平臺如何輕鬆破局
- 電商風控支付的思路
- 如何築造資料安全邊界
- 教授下海,學生遭殃:不可阻擋的AI工業化已讓學界創新能力下降AI
- Python修改柱狀圖邊緣柱子與圖邊界的距離Python
- 亞馬遜雲科技展示資料構建三大核心能力,助力企業生成式AI能力落地亞馬遜AI
- 打破邊界,邊緣計算有何應用場景?
- 喜訊!達觀資料中標德邦證券AI專案,助力科技投行AI