如何看待AI和保險的“水土不服”(上篇)

AIBigbull2050發表於2020-06-02
本文作者: 2020-05-31 23:05
導語:難以落地的原因來自於“傲慢與偏見”。

23時55分,降旗、升旗儀式開始,中葡雙方護旗手入場。23時58分,在葡萄牙國歌聲中,葡萄牙國旗和澳門市政廳旗開始緩緩降下。

1999年,上海弄堂裡,張醫生正和家人端坐在彩電前,見證這一歷史時刻的到來。滴、滴、滴、滴,腰間的BB機顯示一條訊息“暴露了,快走”。

隨著最後一名嫌疑犯張醫生被抓獲,上海市醫保部門的第一次聯合打擊騙保案正式告破,五名醫保“蛀蟲”全部落網。

在充滿龐氏騙局的時代,他們沒有想到自己的暴露,竟然源於當時尚在萌芽中的技術“行為識別”,也就是今天的人工智慧。

作為當年那次行為識別的研發人員之一,好人生科技首席健康經濟學家湯子歐博士,略帶自豪的表示:“和今天的算力相比,我們那時候完全是小米加步 槍,只能按照邏輯在資料庫裡一遍一遍刷資料,當時我們開玩笑說,要是把電腦弄壞了,可能就賠了,因為刷出來的資料價值可能還沒有那臺電腦高。”

入行26年的湯子歐博士,2000年就已經在出國培訓中接觸保險人工智慧風控,之後又成為首位華人北美健康險管理師,壽險管理師,國際健康風險管理協會(IHRMA)理事,並創立了中國首家獨立資質的商業健康保險公司。

他向雷鋒網表示,AI保險風控熱度看似很高,但是里程碑根本沒有到來,應用都停留在淺層。雖然產品給大家的感覺是不明覺厲、但扒開發現,無非實現只是小區門口識別車牌這類的需求。

究其原因,並非是保險行業根本不需要深層次的需求,而是一批學術型的創業者,唯技術論,堅持“資料為王”,不願意接受行業過去積累的知識,產品效果不好之後就開始抱怨,找各種資料不足、算力欠缺、預算太低的藉口。

以下是專訪的完整內容,雷鋒網做了不改變原意的編輯。

雷鋒網:AI已經在保險風控、醫保稽核等場景中應用,是否已經有了明顯的效果、應用不好的原因是什麼?

湯子歐:AI要結合行業特點才能發揮作用,目前來看,AI在保險行業的應用,還沒有發揮出明顯的作用。

其實AI在保險行業應該是大有可為的,比如做單證收展。保險行業每天有大量的投保單、理賠單需要人來處理,這種情況下,利用AI做這些單證的收展可以極大提升稽核的效率和質量。

另外,利用AI可以發現大規模資料的異常值,人們常說,事出反常必有妖。保險行業每一分每一秒都在產生大量新資料,這些新資料的稽核,依靠人力總會出錯。

對於資料,人工智慧會比人更敏感,例如從統計學角度的找均值、方差,一旦發現高度聚集性的正態分佈,就需要關注找原因,以及反標籤的資料,例如男性發生了婦科用藥。

但現在的情況是,AI大資料風控根本沒發揮有效的應用。

原因在於,最開始的那些技術大牛、一直追捧技術、卻沒有有效利用行業多年積累的經驗、也沒有和行業的需求結合在一起,這是很悲哀的現象。

雖然設計出的產品給大家的感覺是不明覺厲、但是扒開發現,無非實現只是小區門口識別車牌這類的需求。

最終造成這類AI創業企業遲遲無法上市、盈利又困難、對整個市場估值都產生負面影響,最後跌的很慘。

舉一個例子形容,那些學術派創業者,面對保險公司的需求,直接就表示:“只要你把資料給我,我什麼都能給你解決”。

但保險公司聽到這句話的反應,肯定直接一愣。因為這是站在技術的角度看問題,“透過資料發掘、發現普遍規律。”

但是從保險精算的角度,首先 保 險 資料隱私安全非常重要、另外這些健康險資料往往存在大量的噪音,直接拿資料找規律,得出的規則肯定不靠譜。

經過幾百年的發展,保險精算已經積累大量規則性邏輯,AI只有和這些基礎結合才更適合保險行業。

但學術派人工智慧創業者,非要直接不信這些知識,堅持“資料為王”,這也是目前雙方談不攏的主要原因,深度學習的學者不願意瞭解精算知識,也不願意深入。

最終造成依靠資料開發的風控產品,大大偏離市場的預期,未來這種矛盾可能會長期存在。

雷鋒網:以好人生的經驗來看,保險公司對於評判AI風控產品的好與壞,有怎樣的標準。

湯子歐:經驗是人類的知識,大資料探勘結果是計算機的知識,對於AI產品,最終還是服務人類,最重要的評判標準是體驗。

作為服務人類生產生活的產品,AI首先應該對人的生活發揮具體的效用,這個達不到,其他都是空話。

好人生對人工智慧的應用,具體的場景包括風控核保、理賠、風控和創新。對於保險公司的作用,有一個代表性案例。

一家保險公司,直接將十幾萬例資料丟給我們,要求在兩天時間內計算出可以節約多少成本。

要求和評判標準非常明確,但這麼簡單的需求,那些演算法很強、建模能力很強的學術型創業公司也不一定可以完成。

這些資料好人生的風控模型兩小時就可以完全跑完,並可以識別出10%的異常情況,再對這10%的資料進行分析,更改引數再跑一次,從中得到5%的確定資料,最終統計效率在95%以上。

統計出來的這5%資料,可以依靠精算的經驗,分門別類的報告就可以完成目標。所以直接有用才最關鍵,把精力全花在演算法上,往往就是鏡花水月。

雷鋒網:保險AI產品主要的服務物件就是保險公司,從保險公司的角度,對於AI的訴求是什麼?不同部門又有怎樣的差異?

湯子歐:從客戶角度來說,保險公司評價產品的優與差,不同的部門評價方法往往不同。

第一、銷售部門,對於人工智慧的訴求是識別什麼樣的人,會買他的產品,所以主要基於行為識別。

好人生對於這個需求,也開發了相應的行為識別產品,透過既往的健康行為和醫療行為,判斷其購買傾向。

但使用者最終買不買保險,買哪個產品,並不是理性的,而是感性的。使用者買保險的時候很少有人會意識到自己真正需要什麼,往往是根據自己的基礎認知和當下感受就買單,最終並沒有經過需求適應性評估。

第二、兩核部門,即核賠和核保。兩者的考核指標不完全相同,核保部門目標是不能放壞人進來太多;核賠部門目標是不能讓壞人得逞的太多。

所以就現在就產生兩個需求:

第一,回顧性風控,要求對過去兩年的資料,進行批次稽核管理。

第二,線上實時風控,現場決定出好人還是壞人。

前兩年健康險公司創業野蠻生長時代,有些公司為了獲得使用者量,就曾大量放水,不管是誰,一律透過,但是很快就發現賠付率過高,然後股價很快就掉下來,開始重視實時風控。

綜合來看,兩核部門的初步要求都是真實核驗,即使線上快速完成,也必須要有核賠演算法在背後做支撐。

但目標雖然一樣,具體實現又有較大差別。

核保是基於既往資料和行為時間序列進行分析,並和標準值比較,最終確定差距大小。

核賠是對不同供方需方資料,進行大規模比對,其中需要識別的資料既有需方,也有供方,也就是醫療行為和就醫行為,所以比風控更加複雜。

第三、產品精算部,這個需求只有深入到保險公司內部,才能瞭解。因為保險精算的需求在於,透過AI發現普遍性風險規律,也被稱為保障標的。

保障標的主要有三個特點:被普遍關心和認可;風險不可人控;風險可被預測。

這個過程一定需要人工智慧在背後做算力支撐。20年前,自己做精算師的時候,完全依靠手工,速度非常慢。

現在透過人工智慧做支撐,保障標的的創新速度在逐漸加快,迭代週期逐漸縮短,甚至透過人工智慧可以把過去聯想不到的風險事件內在關聯逐一發現。

面對保險公司內部訴求的不同,AI產品只有貼合市場導向,才能實現價值。

雷鋒網 (公眾號:雷鋒網):好人生過去有哪些實際案例可以證明,AI風控對於保險公司有明顯的作用?

湯子歐:過去有一個大型保險公司的團險案例,它有一張服務幾十萬人規模企業的團險訂單,這種巨量客戶,雖然保費很可觀,但他實際非常痛苦,原因在於虧損十分嚴重。

每年都在虧,但又不能丟,這麼大的規模,一旦釋放到市場,足夠可以養活一家小型保險公司,而且這種雞肋型的團單案例,市場上也並不少見。

對這個案例,不能執行回顧型的兩年不可抗辯,好人生當時採用的邏輯是在理賠過程中,實時進行風控。每一單都切入智慧理賠的模組,模組中內嵌風控演算法,並作API介面輸出和輸入,在安全屋經過核算之後,再進行理賠終決,很快輸出結果,這種快是實時的。

專案進行一個週期之後,我們統計發現,從所有理賠中篩查出8~9%的索賠異常,而且經過人工核實,其中98%基本正確。

給這種雞肋型團險業務解決很大的問題,因為其最終和僱主談判過程中,利潤也僅僅在2~3%之間,或虧或賺都在這個區間之內,節省8~9%,利潤就全出來了,實現轉虧為盈。

雷鋒網:保險風控是AI落地的重要方向,但有專家認為,很多時候智慧風控根本用不到複雜的機器學習模型,一個簡單的決策樹或基礎的統計模型就能解決,您怎麼看?

湯子歐:這首先是一個比較普遍的現象,無論保險、銀行,還是其它應用人工智慧行業。

這些應用目前都僅停留在淺層,所以才有專家說,相對簡單的決策樹就可以解決問題。

無法進入的深層或者不需要複雜模型的原因,首先是因為行業過去長期粗放式的發展,導致大量簡單錯誤資料混在裡面,所謂的噪聲;其次專業性問題,是否具有幾十年的從業經歷,看到那些行業深層次的需求。

反向來看“保險行業是否不需要複雜的算力和因素?”其實是需要的。

從市場平均利潤率角度,矮子當中拔將軍,今天我的產品在行業領先一釐米,就開始沾沾自喜,但明天忽然發現大家都漲了一釐米,就要面臨價格戰了。

所以為了避免價格戰,一定要做長期的技術儲備。

今天的模型確實夠用,因為99%的人,還沒有認識到危機,保險公司面對人工智慧的到來,甚至也是兩眼一抹黑。但這種情況不會持續,更不會發生利用簡單模型就可以躺在那一直賺錢的情況。

我認為現在AI對保險行業的能量只發揮了百分之十幾,行百里者半九十,越往後就越能發現,新的需求和知識,這個知識一旦你知道別人不知道,產品的競爭力就越強。

但越往後,往往越難,難點在於潛在規律的發現週期不確定,可能是兩個月、也可能是兩年。

以金融危機為例,現在都知道因為金融創新問題,每十年會發生一次。但保險科技的需求週期,還沒有被發現。

而且人類是善於忘記的,三年以上,自己最初做這件事的原因可能都會忘記,然後就進入意想、癲狂之中,爆雷可能就是早晚的事,就看誰在爆雷之前接盤,最終吃下苦果。

像金融危機這麼嚴重都需要十年以上的資料才能發現。一家風控公司,AI只是手段,可能今天適用,明天又有另一種新的方法,資料和經驗的有效整合才是最核心的要素。

雷鋒網:既然資料才是最核心的要素,現在行業在資料利用上存在怎樣的問題?

湯子歐:現在資料利用最大的問題在於只注重“量”,忽略了時間序列。

一些人工智慧公司為了積累量,就在橫斷面上搜集大量資料,在和保險公司、政府醫保合作中,一下子可能獲得幾百萬例資料,但都是兩年之內的,之後就宣稱有龐大的資料量。

這種資料積累我是不看好的,因為橫斷面資料訓練的模型,只能反饋這個時間點的靜態規律,過兩年可能就完全不靈。

統計學角度上,基於時間序列的分析非常重要,這和人的特點有很大關係。黑格爾說:歷史給人的唯一教訓,就是人們從未在歷史中吸取過任何教訓,

人本身就具有健忘、盲目從眾、容易被麻醉和帶偏的特點,所以人的真實行為需要依靠時間序列進行觀察,不能只從橫斷面看靜態。

雷鋒網:如果說現在人工智慧的應用只是停留在淺層,那如果向更深的角度發展,遇到像資料噪音過多等問題、應該怎樣解決。

湯子歐:健康險風控不是一招鮮吃遍天, 大體上可以分為管理式醫療、慢病管理,健康促進這三類,三類的風控點完全不同。

管理式醫療側重是管供方,慢病管理供方需方兩頭管,健康促進主要是管需方,這裡面的底層認知面非常廣。

目前AI做的都只是簡單行為識別、糾錯,現在這些能力達到的平均數在8~9%,估計未來可能會實現15~20%,就到達技術的邊界,即使是加上未來的技術,也在30%以內。

真正要提升,方向就要拓寬,藉助其他技術門類,解決傳統的灰色地帶問題,例如濫用,這些其他技術門類就是行業過去已有的知識,所謂的經驗。

1999年,自己參加世界銀行學院培訓裡面一節課就講到:現在沒有辦法對人類的行為進行高效的識別,但可以進行定向分析,彌補算力的不足。

這個觀點同樣適合現在,我們不能對海量的資料在各個角度、各個維度都精算一遍,因變數就可能變成自變數,最終資料的排列組合非常巨大,即使是現在的算力也無法滿足。

所以如果要深入,就要依靠行業的既有知識和大資料的應用高效結合,這種結合誰做得好,誰就會實現領先。

雷鋒網:很多風險控制,更多是靠人的經驗判斷。您認為人工和智慧,哪個更重要?

湯子歐:在相當長一段時間內,人的經驗肯定比智慧重要,我舉一個例子,做保險科技的企業,是否知道保險公司具有醫院報銷目錄,而且可以透過醫院認證,更深入來說,是否知道這個目錄和醫保不同,一些特殊藥品存在不同理賠範圍,同一種診斷,理賠可能包含手術,也可能不包含。

這些知識一定需要多年的經驗積累,不僅是保險,其他行業也是一樣,人的經驗會佔據主導地位,開始由行業專家主導人工智慧在各個行業的發展,實現遍地開花。

因為人工智慧僅僅是一種工具,基於行業認知的有效利用非常重要。

所以我建議人工智慧的演算法學者,應該留在大學校園裡面,不要出來創業,沒什麼意思,最終會發現真正落地到行業,很難變現。

對知識領域認知的深度,也就是模型訓練中的監督字典,所謂的金標準,AI在所有行業的應用都需要以這個為基礎原點,智慧首先需要靠譜的東西,這個東西就是人的經驗。無監督學習在有深度領域知識的行業很難成功。

雷鋒網:對於醫保風控中長期存在的 資料標準化 問題,正在 推行的DRG技術能否做到改變,最終這這種技術對 醫保控費可以達到是什麼樣的 效果。 

湯子歐:這是供方風控範疇的內容。我本人對於DRG 的應用是持負面態度的,不要說三年能否抗過去,我覺得一兩年就會爆。

2000年,還在上海醫保基金的時候,我們就已經嘗試過DRG 的方法,最終放棄選擇了global budget(總額預算制)和多維因素分析。而且這些方法和原理,我後來帶到了好人生,也包括現在的大資料風控,關鍵是和DRG在方法上有區別。

好人生參與的醫保基金稽核專案,都是基於這些大資料理論,不管以後稱為DIP還是大資料風控等其他名稱,作為DRG的替代方案,也已經在準備逐漸推行。

DRG 和DIP(總額預算制)相比有什麼不同?首先DRG最大的問題就來源於出生時的背景條件,最開始是被美國人創造的。

它的研發背景不是大量線上資料的時代,依靠一張一張統計表,按照統計學角度,一步步按照一級指標、二級指標迭代出來,所以是基於統計資料,按指標產生的體系。

DRG的稱呼就是分析診斷相關疾病組的分類付費方式,把相關疾病聚集在一起,進行分類付費,策略就是剛性一刀切,方法學上稱為白名單制,入組制。這種剛性一刀切的入組制,在醫保應用中一定會出現,嚴重的溢位效應。

按照健康險精算邏輯,去不去看病,80%由需方決定,看病以後,發生的醫療費用多少80%是由供方決定。

所以應用DRG,就會出現一部分溢位費用,出現在其他診斷類目之下。最終發現DRG裡面是大晴天,形勢一片大好,外面全是重災區,醫保基金總盤子和過去一樣,照樣爆。

醫保局採用這個策略,也是被迫的無奈之舉,其實最終的訴求還是把控醫保的總盤,只要不爆就完成目標,進一步控費就是更好的表現。

所以,目標直接應該朝向總盤子,繞了一圈上線DRG,總盤子根本沒管,所以DRG之內效果非常好,不管的地方就拼命用。

總額預算制的目標就是直接指向總盤,現在的技術已經能夠達到,實時進行大資料分析,算力也不受限制。

好人生的大資料風控引擎每個月都會輸出一個全量資料、多維分析,簡單化處理的話,可以找出前3%,所謂槍打出頭鳥,幹掉風險最大的。

按照這種邏輯,前3%縮回去以後,後面的情況也會逐漸發生變化,逐漸整個趨勢會向均數靠近。

這種方法很智慧,也比較適合我們的國情,實行剛性一刀切人家可能直接造反了,因為能量本身就比你大,一下得罪太多供方,就走不通了。






來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2695564/,如需轉載,請註明出處,否則將追究法律責任。

相關文章