「人工智慧要落地應用,在於業務影響力,因此在業務流程上,與人工智慧既要深度結合,又要定製化。」平安科技人工智慧高階產品總監、平安深度學習平臺負責人王健宗博士在 9 月 7 日由中國工程院資訊與電子工程學部主辦、浪潮集團承辦的 AICC 中國人工智慧大會上表示。
平安科技最初是中國平安集團的資訊管理部,2008 年獨立為子公司,服務於集團的 IT 系統。2016 年初,中國平安提出 3.0 時代戰略,相對 1.0 時代只銷售平安內部產品的自營模式,2.0 時代不只銷售平安產品,還銷售其他金融機構的產品和服務的平臺模式,3.0 時代則是把公司現有技術、系統等核心能力向其他金融機構輸出,共建生態圈。
在這樣的戰略指導下,平安科技也從服務於集團的 IT 公司成為人工智慧領域的引領企業,聚焦於大資料、AI、金融科技、雲以及區塊鏈等新技術的研究和落地,負責開發並運營集團的關鍵平臺和服務,支援集團的保險、銀行、投資和網際網路業務發展。
據王健宗介紹,平安科技從 2011 年下半年開始佈局大資料。由於計算機硬體,高效能運算的發展,以及演算法的革新,特別是深度學習演算法的突破,平安科技經過四五年的資料積累,自然也就從資料智慧走向了人工智慧。
在人工智慧領域,平安科技很早就將人臉識別技術應用於平安普惠的放貸流程中,如今,平安科技的人臉識別已在包括平安證券及平安銀行在內的 17 個子公司使用。此外,平安科技還在研究多模態識別、虹膜識別、眼紋識別、靜脈識別以及步態識別,使這些識別技術共同作用於各個應用場景。
而在技術研究和儲備方面,平安科技已擁有超過 18 項前沿新技術,包括聲紋識別、圖片定損、微表情、影象和語音識別及語義理解。其中,平安聲紋是平安科技深度學習團隊自主研發的聲紋識別引擎,專注於因聲識人,能實現智慧身份認證,目前已應用在平安銀行信用卡電話核查身份,平安產線理賠反欺詐以及 App 登入等 20 多個場景中。
專注於人工智慧在金融和醫療領域的應用
於 1988 年誕生在深圳蛇口的中國平安,是中國第一家股份制保險企業,歷經 30 年,至今已發展成為保險、銀行、投資三大主營業務為一體的多元化集團。而在中國平安內部,2016 年初制定的 1-2-2-N 戰略表明,聚焦於大金融資產和大醫療健康。由此,平安科技的人工智慧業務也主要圍繞金融和醫療進行。
人工智慧應用於實際的場景,資料非常重要,平安科技花費將近一年時間打通各機構和業務子公司,將資料整合到一個平臺,進行資料的清洗、整合和分析。在此基礎上,進行資料探勘。王健宗介紹,在資料探勘方面,平安科技並非一步到位,而是從基於業務規則和業務經驗到基於商業智慧(BI),再到機器學習、深度學習,並吸取 AlphaGo 的經驗,分成數個步驟進行。
在業務規則和業務經驗階段,如果是資訊資料不吻合,可以幫助業務部門及時應對。商務智慧階段則是尋找資料之間的關聯性,對使用者按照資料特徵進行分類處理,這適用於特徵明顯的客戶群體。但是,有相當一部分特徵不明顯但與業務目標緊密相關的長尾使用者,這時,應用商業智慧的方式就不再適合。他們需要個性化的方法來提供服務,王健宗介紹,平安科技搭建的深度學習叢集,通過影象識別、語音分析、文字理解等人工智慧技術對資料進行挖掘。
「從底層資料的獲取、採集、整合,到使用者畫像、產品畫像,再到渠道畫像的上層實現,接著是商務智慧結構化分析、非結構化分析、預測、異常的監控、深度學習能力,同時支撐的八大應用,這些應用服務於金融領域各個相關的方面。」王健宗表示。
而它們都集中在平安科技的腦智慧引擎,腦智慧引擎主要分為四層。作為感知層的第一層主要進行資料接入、採集和整合。作為索引層的第二層,主要刻畫使用者畫像、產品畫像和渠道畫像,這層主要是模型的建立。第三層中樞層聚集了商務智慧、預測推薦、異常監控、深度智慧等演算法能力。第四層作為執行層,是平安科技核心業務的解決方案和應用場景實現層,包括風險控制、欺詐識別、運營優化、精準營銷、智慧監控、商務智慧、智慧金融、智慧客服。
以風險控制為例。在金融的風控方面,傳統的貸款流程比較落後,平安科技依託平安的腦智慧引擎,構建多樣的數萬維的因子,比如企業相關的經營資料、財務資訊、稅務資訊、財報資訊,再結合外部的相關行業指數、輿情分析、企業的關係網路,甚至董事長的投資情況等,最終形成企業的風險概況,同時再加上動態趨勢,比如通過市場情況綜合判斷抵押品的價值,在這些基礎上,做出估值模型,通過模型確定是否放款。
「從模型的資料獲取,到訊號的生成、篩選,最後自動更新,然後進行相關的反饋。」王健宗介紹,平安科技通過對所有子公司和相關合作夥伴的資料收集,並通過內部和外部的資料整合,形成了一個非常清晰明確的體系和不同的模型。
「以企業為個體,把企業的相關資訊進行蒐集,蒐集以後進行模型的迭代,晚上搜集完資料,早上就可以有預警訊號出來,比如反欺詐,我們通過一些規則的觀念分析以及一些社交網路社會計算的能力,同時也能發現一些欺詐的案件,做好風控。」王健宗說。
在醫療領域,看病難,看病耗時長,看病的服務能力差,王健宗認為這些都可以通過 AI 醫生來解決。平安科技正在進行的一個重要產品是智慧讀片,通過醫療影像自動的識別、理解、分類,能夠快速的定位患者的疾病,最後給出診斷意見。
在人工智慧讀取影像領域,由於全國各級醫院使用的大型裝置有各種型號,比如 CT 裝置就近百種,這就造成很多公司資料來源單一,產品不能在醫院之間通用,而平安科技在 AI 訓練的時候採用了各級醫院的不同資料,使系統可以讓大多數醫院使用。目前,平安科技的肺結節檢測系統在臨床的準確度已經達到 90%,正在研究糖網、胃癌、宮頸癌等疾病。
平安科技還與政府合作,進行疾病監控的預測,涉及病種包括流感、腫瘤、慢病、高血壓、糖尿病等。2017 年上半年,由平安科技研發推出的人工智慧+大資料流感預測模型,能夠預測流感趨勢,精準預測個人和群體的疾病發病風險,幫助政府及時監控疫情,從而指導民眾預防疾病,降低國家疾病與防控工作的成本。
如何解決金融和醫療領域的資料稀疏
平安科技深耕金融和醫療的同時,他們發現金融領域和醫療領域的資料量有一個很大的特點,儘管資料很豐富,但是相對社交資料,金融資料和醫療資料相對低頻,因而資料維度比較稀疏。
如何把這些低頻的資料轉化為有用的資訊,王健宗介紹,從技術上來看,需要在資料基礎層進行資料壓縮,因為資料多了之後,很多是無用資料,資料壓縮之後,就能減少資料的儲存量和傳輸量。另一方面,提升資料的提取能力,比如利用深度學習或者一些壓縮感知演算法,能夠快速提取相關資料的關鍵特徵,在減少資料尺寸(size)的情況下又不損失資料的含義,王健宗認為,比如模型壓縮方面的研究,都是未來的趨勢。
使用深度神經網路做模型,層數越多,計算資源越大。現在有一個研究方向是如何用很小的計算資源,比如 100M 的記憶體,在深度神經網路的模型同樣達到 300 層、400 層。而目前,大部分深度學習是使用雲服務的能力,另一個研究方向是使裝置小型化,包括用手機去做運算,立即出現結果,是否本地化,能否快速的迭代計算,知識的快速獲取,王健宗認為這都是以後的趨勢。然而,這對演算法本身的模型要求更高,模型計算量,在同等的情況下模型本身的尺寸小,花費的計算的資源也可以足夠減少,同時也能極度壓縮計算的時間。
「理論上像超算,把我們所有的最大的資料灌進去,計算幾天幾夜,最後出來東西肯定好。但是很多應用場景沒有這個時間給你,有時候稍縱即逝的一些東西,所以我覺得這肯定是以後的趨勢。」王健宗表示。
「傳到後端伺服器有很多不可控的因素,比如本身的網路頻寬如何,手機流量是否夠用,伺服器運算後返回,都需要時間。」因此,平安科技將模型前置。據王健宗介紹,平安科技在這方面的研究比較深入,平安科技的很多 App,比如定車損的 App、好車主 App,使用者拍張照片進行自動圖象的定損,平安科技可以把模型移植到前端,有些運算則可以在手機上快速完成。