專訪宜信AI中臺團隊負責人王東:智慧金融時代,大資料和AI如何為業務賦能

宜信技術學院發表於2019-07-23

前言:宜信技術人物專訪是宜信技術學院推出的系列性專題,我們邀請軟體研發行業的優秀技術人,分享自己在軟體研發領域的實踐經驗和前瞻性觀點。

第一期專訪我們邀請到宜信科技中心AI中臺負責人王東老師,從大資料和AI賦能金融業務的角度,分享了中臺、大資料、AI等軟體研發趨勢為業務賦能的經驗與思路。

王東老師從技術視角到業務視角,在中臺的落地契機、AI與大資料關係、AI和大資料技術的落地等方面提出了自己的看法。


記者:很多人將金融行業的發展劃分為三個階段:資訊金融時代,主要指銀行卡的出現,銀行開始做集中的資料管理;網際網路金融時代,網際網路的發展,使得使用者可以透過PC和APP辦理金融業務,這一階段金融機構透過資料平臺管理和使用資料;智慧金融時代,也就是現在,金融機構透過大資料和AI技術讓金融服務智慧化。

作為有多年金融行業經驗的大資料專家,您認為在這3個階段裡,資料為金融服務賦能的方式出現了哪些變化?分別有哪些典型的產品化表現?

王東:按照DIKW體系, 這三個階段對應的是資料電子化、資料資訊化、資料知識化和資料智慧化的過程。

  • 資訊金融時代,金融機構都在進行金融基礎設施建設,資料被集中化管理,金融機構從手工勞動和紙質單據中解放出來,提高效率,本質上這是電子化、資訊化的一個過程,金融機構的資料進行結構化和梳理,並被分析和使用。這個階段資料倉儲和資料集市的理論體系誕生並得到完善,基於數倉理論體系的軟體工具釋出,資料的BI分析(使用ETL、建立資料倉儲、OLAP分析和視覺化報表)在金融機構中最先開始落地併產生價值,基於資料的早期信用卡風控模型開始建立並投入使用。

  • 網際網路金融時代,是資料爆炸的時代,雲端計算和大資料技術興起,金融機構面臨業務變化快、大資料量、高併發量等各種不同需求的衝擊,前端業務系統進行大規模改造以適應大資料的衝擊。資料層面上,企業的資料量已經變得非常龐大,業務變化也非常快,傳統的報表迭代速度慢,需要排期,無法滿足金融機構的資料分析需求。大資料理論和大資料分散式平臺蓬勃發展,基於大資料平臺的相關技術讓敏捷式報表的概念逐漸成為可能,資料實時化、自助化深入人心。BI的流程已經大幅縮短,在金融機構的決策中被廣泛使用。大資料技術、機器學習等技術在金融領域的引用,催生了大資料風控技術、反欺詐分析、精準營銷和個性化推薦、銷售渠道最佳化&產品服務最佳化、輿情分析等智慧應用。

  • 智慧金融時代,是資料知識化和智慧化的高階階段,大資料和AI能力重塑和改造金融服務,創造業務,降低成本,提高效率。金融機構業務部門的資料分析需求進一步增加,商業智慧分析產品被業務專家廣泛使用在輔助分析、協助決策、智慧助理等各個領域。BI分析更加自動化,增強型分析(是資料準備和洞察過程自動化、使用自然語言或語音互動、根據AI分析給出決策建議、利用機器學習和AI管理資料)逐步成為可能。基於大資料和AI提供的各項能力,客服機器人、外呼機器人、智慧投顧、智慧投研、客戶流失預測、績優銷售預測、千人千面的金融產品等變為現實。

記者:智慧金融時代,AI技術在金融服務的落地場景也越來越多。您能否以宜信的某一個AI產品為例,簡單介紹AI在金融服務業務場景中的落地實踐。

王東:這裡,我就介紹一下我們智慧聊天機器人平臺吧。該平臺是結合自然語言處理、搜尋引擎、會話領域場景的一站式人機對話解決方案,只需簡單匯入自己的業務問答資料知識,系統的智慧模型就會快速學習並生成相應的機器人,建立出定製化的業務諮詢專家。

智慧聊天機器人平臺包含QA聊天機器人、任務機器人、閒聊機器人、人工後臺、文件管理、模型管理、會話管理、統計報表等諸多功能。平臺支援多租戶,對算力、資料和資源進行隔離。對接公司LDAP、SMP、SSO等認證系統,支援功能角色和資料角色,對業務系統無侵入,可以內嵌到公司PC端業務系統中或手機APP中。

以CSC場景為例:CSC的一線同事在日常工作中,每天都會產生大量業務問題需要諮詢。此前這些問題透過蜜蜂等IM軟體在工作群內進行詢問,由CSC客服管理部相關同事支援。但由於問題數量大、涉及業務線多,這些業務諮詢往往不能得到迅速解決,影響業務的順利開展。另一方面,透過人工進行業務問題支援的工作還存在著響應緩慢、效率不高、成本高昂等問題。最終從客戶角度來看,業務問題的無法解決或解決流程不規範,將嚴重影響客戶體驗和品牌認知。

使用了智慧問答機器人後, 門店客服可以透過智慧機器人快速得到一致性答案,透過搜尋引擎快速檢索到業務文件相關資料,當遇到機器人無法解答問題,可以將問題轉入人工後臺。讓大部分常見問題由機器人代勞,少部分複雜的問題轉後臺人工處理,透過智慧機器人+人工後臺的方式,共同提供完整的快捷的一體化使用者體驗。

由於智慧聊天機器人平臺是按照平臺化方式來建設的,因此很容易推廣到公司其他需要智慧聊天的場景中,除了CSC客服問答機器人以外,目前已經在公司車貸客服問答、催收業務諮詢、財富智慧問答、指尖金融家APP和信審業務諮詢等領域中上線和使用,成為客服管理重要的日常工具,實現了運營管理智慧化從0到1的過程,幫助運營人員減輕壓力,提升運營效率。

金融領域正掀起一場智慧化的變革,智慧聊天機器人在這場變革中將扮演重要角色。眾多分析師認為,聊天機器人的商業化應用,其真正潛力正是在金融領域。除了對企業內部業務的智慧化支援,更加令人興奮的是聊天機器人與金融的結合將徹底顛覆個人金融服務的形式,相信在不遠的將來,智慧金融機器人將在客服、諮詢、支付等各種場景下提供更加科學而自然、理性兼具人性的服務,這也是我們平臺的最終發展目標。


記者:智慧化的AI產品可以解決複雜多樣的業務問題,但面對眾多的需求,需要進行優先順序排列,您和團隊是如何判斷業務問題優先順序的呢?

王東:就能力分層來說,我們認為智慧化AI產品可以分為三層:

  • 最底層——AI平臺層:提供線上訓練、線上標註、特徵工程、自助訓練、演算法庫、訓練環境等AI基礎設施。服務的物件是AI科學家和資料科學家,為他們提供平臺和工具支撐。

  • 中間層——AI服務層:提供語言合成、詞法分析、相似度比較、觀點抽取、卡證類識別等通用AI服務,以及與業務方合作的智慧服務專案。服務的物件是我們各個業務系統,為各個業務系統提供AI能力支援,助力業務發展。

  • 最上層——AI產品層:提供類似智慧聊天機器人平臺這樣的端到端解決方案。服務的物件是我們的一線業務同事、甚至可能是我們的客戶。

從技術難度來說,最挑戰的是最底層-AI平臺層,打造一套自己的線上訓練平臺一直是很多AI科學家和資料科學家所期待的,但打造一套非常好用的線上訓練平臺並不容易,需要投入大量人力和時間,維護成本也很高,需要增加最新演算法庫等,對使用的使用者要求也比較高,一般都是演算法工程師和科學家。我們的業務方對這個一般沒有什麼感知。

從業務影響力和優先順序來說,最上層和中間層的優先順序會更高一些,這兩層主要是為公司一線業務系統服務,會直接或間接觸達到一線業務同事或客戶,直接產生商業價值和降低成本。

作為AI中臺來說,在有限的人力情況下,我們會更優先支援最上層和中間層的AI服務,例如:聊天機器人平臺、語音合成、主題提取、卡證類識別等通用類AI服務以及與業務方合作的智慧服務專案。而對於最底層AI平臺,我們也會在日常工作中,透過積累和沉澱可以複用的工具集,逐步形成相應平臺能力。

記者:據悉,宜信的智慧聊天機器人平臺是基於AI中臺研發的,那麼AI中臺為智慧聊天機器人平臺的研發提供了哪些優勢呢?相比AI中臺建設之前,有哪些地方得到了改善?

王東:從AI中臺的使命來說,AI中臺承擔一些跨領域的、平臺級的服務研發和推廣,避免煙囪式的開發,強調開發合作、通用性和可複用性。智慧聊天機器人平臺就是這樣一款產品,它具有平臺的通用性,可以內嵌到公司各個業務系統中,以自然語言的方式提供問題諮詢、任務執行、業務解答等支援,最終達到節省人力,降本增效的目標。

智慧聊天機器人在AI中臺開發是有諸多好處的:

  • 從人員方面來說,智慧聊天機器人涉及到自然語言處理、語音轉換等技術,這需要在NLP和語音識別等專業領域深耕的AI科學家來支援。一方面機器人平臺可以藉助AI中臺的AI科學家透過更好的演算法讓聊天機器人更加智慧,更加多樣化,另外一方面機器人平臺也為AI中臺的專業AI人員找到了合適的用武之地和實踐場景。

  • 從平臺層面來說,智慧聊天機器人所需要的模型服務是可以向下沉澱的,通用化後成為AI中臺的AIHub模型服務平臺。 這樣聊天機器人平臺不必關心模型管理,只需要關注自己聊天機器人領域的事情,例如模型服務、模型編排、模型監控預警等這些模型通用能力的事情交給AI中臺的AIHub模型服務平臺來解決。實現產品模組邊界清晰,並提高複用性和專業度,減少重複建設。

記者:宜信技術學院組織了2次直播分享,主題分別是資料中臺和AI中臺,您在這兩個專案都扮演了重要的角色,現在也越來越多的人提到資料中臺需要向AI中臺演進,您對此怎麼看?宜信的資料中臺和AI中臺之間是什麼樣的關係?二者之間是如何支援協作的?

王東:資料中臺除了提供資料平臺本身的兩大能力(資料儲存和資料計算)以外,還提供了更高階的能力,就是把資料變成一種基礎服務提供給業務方,業務方可以以自助的方式在資料中臺上獲取資料,進行資料處理、資料探索、資料探勘、分析鑽取、多維分析、自助化報表、資料分享等,以快速的實現自己的商業價值。

隨著業務的發展,越來越多的智慧化資料需求被提出,這些智慧化需求涉及到模型訓練、資料標註、特徵工程、模型部署、效能監控等,需要使用機器學習、深度學習等演算法支援。資料中臺的主要目標還是服務資料,對於智慧化和模型並不能很好地支援,因此AI中臺應運而生。

我們把智慧服務的需求抽象出來,形成一個獨立的AI中臺層。AI中臺是一個用來構建智慧服務的基礎設施平臺,對公司所需的模型提供了分佈分層的構建能力和全生命週期管理的服務,鼓勵各個業務領域基礎性、場景性、通用性的AI能力沉澱到平臺中,加強模型複用、組合創新、規模化,最終實現降本增效和快速響應業務方。

資料中臺和AI中臺兩者是相互依存,承前啟後的關係。

  • 資料中臺和AI中臺兩者都對外提供服務,只是側重點不同:資料中臺提供各種資料服務(BI報表應用、資料探索等),AI中臺提供各種智慧服務(模型預測、智慧推薦等);

  • AI中臺依託資料中臺提供的資料能力和工具集,加速AI相關服務的開發和複用,來應對前臺智慧業務需求。有了資料中臺清洗好的資料,搭建智慧專案事半功倍;

  • 資料中臺也需要使用AI中臺的智慧化能力使得資料使用更加平民化和智慧化。例如增強型BI分析:通用自然語言互動方式,降低BI使用門檻;透過AI分析給出參與建議,幫助普通使用者在沒有資料專家的情況下有效訪問資料;增強型資料管理:利用機器學習來管理資料,包括資料質量、後設資料管理;主資料管理等。

記者:從去年開始,似乎每個公司都在談中臺,但其實很多人對中臺的具體價值還不是很理解,從宜信的資料中臺和AI中臺這兩個專案來看,中臺在賦能業務方面有哪些優勢?請您舉幾個例子具體介紹。

王東:在“以使用者為中心”的思想指導下,企業需要快速響應、挖掘、引領⽤戶的需求,藉助平臺化的力量可以事半功倍。後臺並不為前臺而生,要麼不好用,要麼變更速度跟不上前臺的節奏。就算是新建的後臺系統,因為其後臺管理的屬性(考慮到企業安全、審計、合規、法律等限制)導致不能適應前臺快速開發的需求。前臺和後臺就像是兩個不同轉速的⻮輪,前臺要快速響應,後臺則要求越穩定越好。

因此中臺應運而生,中臺存在的目的就是更好地服務前臺,進而更好地響應服務。在宜信,資料中臺和AI中臺也同樣是為了更好更快地服務前臺而存在:

  • 以資料中臺為例:業務領域組資料團隊需要緊急製作一批報表,不希望排期,部分報表需要T+0時效性。資料來源是異構資料庫,對資料時效性要求很高,需要對資料處理後並展示報表。使用資料中臺,業務方不需要關心資料的異構性,無論是實時資料還是批次資料,只需要懂SQL,業務方都可以在資料中臺上申請資料,自助地寫SQL進行處理資料清洗、資料處理,最後,透過配置和寫SQL生成自己需要報表,不用等排期,完全自助快速完成。

  • 以AI中臺為例:AI中臺的智慧聊天機器人平臺,對接第一個業務方是從零開始,從研發平臺、模型研發、資料對接、到使用上線第一期,花了6個月的時間,第二個業務方享受到平臺的優勢,直接匯入資料,進行驗證和對接後,4個月實現上線第一期,之後的業務方更快2個月上線,最近的一個業務方達到3周就上線的速度,體現了平臺的複用性帶來的便捷和快速響應業務方需求的能力。

中臺將前臺業務中相對穩定的能力固化和沉澱下來,並共享給有需要的其他業務方使用,從而實現快速響應業務需求、降低成本和支援業務方進行規模化創新。

記者:以您的經驗來看,什麼樣的企業需要建設資料或者AI中臺?或者說企業在什麼時候應該要建設中臺,是否有什麼明顯的訊號?比如說企業到了什麼樣的階段或者遇到什麼樣的問題。

王東:企業啟動自己的資料中臺和AI中臺建設,是與企業當時的業務發展階段相關的。

很多企業在早期業務發展過程中,為了解決一些當時的業務問題,快速上線了很多功能,要麼垂直的、個性化的業務邏輯與基礎系統耦合太深,橫向系統之間、上下游系統之間交叉邏輯錯綜複雜。要麼缺乏統一規劃,建設了許多高度相似的系統,大量重複建設,但又不通用,使用者體驗不統一。 這樣導致在新業務、新市場的擴充過程中,系統沒法直接複用,甚至沒法快速迭代。

我們稱為 “重複造輪子”和“煙囪式架構”,本質上是企業在早期高速發展過程當中,為了快速解決當時的業務問題,而欠下了許多技術債務。這些歷史技術債務積重難返,當企業進入成熟期之後,發現這些問題的存在,嚴重影響了企業的執行效率和運營成本。大多數提出中臺戰略或是建設大中臺的企業,都面臨過類似的困境。

中臺化建設作為一種產品設計思想或者系統架構思想,對於任何一家即將或者正在面臨業務高速增長的企業來說,都值得借鑑,對目前業務當中大量可複用的功能和場景進行梳理,為業務的高速增長做好準備,同時也起到了降本增效的目的。

這個過程很像是在飛行過程中修發動機。一方面,知道飛機發動機已經存在一些問題,需要修理; 另外一方面,還在飛行過程中,飛機還要飛,還要支援業務發展,不可能將發動機停了。這個過程是有一定難度,還要搶時間,為下一次業務發展做好準備。

透過機制化、產品化等方式,將企業內部具有通用性的資料、功能、產品進行統一規劃和開發,從而更好地幫助前臺業務部門更多地關注業務,提高業務運營效率,進而提升企業競爭力,是企業中臺化建設的目標。

記者:前面您也講到,智慧聊天機器人平臺的研發要基於資料中臺所提供的資料探勘和處理能力,可以說AI產品的研發和應用離不開大資料技術的支撐。那您認為大資料技術與AI應用落地之間是一種什麼樣的關係?

王東:縱觀這次人工智慧的浪潮,可以說是演算法、大資料等技術和硬體多方面的因素促成的。一方面演算法層面有了進一步突破,更重要的是大資料相關技術的成熟,使得資料的獲取變得容易,大資料計算變得可能,以前許多不可能完成的事情,現在可以透過大資料的算力來進行學習和訓練。再結合現在GPU、AI晶片以及感測器等硬體技術,使得需要大規模計算的深度學習訓練可以完成,這些都直接導致了AI應用的快速落地和到處開花。

以網際網路AI應用為例,網際網路巨頭是使用大資料標註並落地AI應用的最早受益者。AI應用最早應用在搜尋引擎(Google、百度)、廣告系統(Ebay)、電子商務網站(阿里)等,它們都是大資料的產生方和使用方,然後是在擁有大資料流的社交平臺(Facebook,騰訊),到現在使用大資料技術在垂直細分領域做個性化推薦平臺(頭條、快手)。一方面大家在使用這些網際網路平臺,另外一方面大家也在進行免費的大資料標註。

以商業AI應用為例,商業機構透過啟用已有的大資料,並結合AI演算法創造商業價值。醫療機構透過已有病歷實現疾病診斷/鑑別、個性化治療/行為矯正、臨床決策支援系統、流行病爆發預測等, 金融機構透過已有交易資料,進行大資料風控、個性化營銷、智慧投顧、智慧投研等。這些都是大資料與AI緊密結合的產物。

以實體世界AI應用為例,透過獲取實體世界的資料,實現智慧化,帶來新的應用、新的商機。透過大資料、AI與汽車行業結合,誕生了自動駕駛、路徑規劃、實時路況、危險預警等應用;大資料與商業零售結合,收集海量顧客資訊,結合AI技術,用於精準營銷、店鋪選址、庫存規劃、個性化服務等。大資料、AI技術與智慧城市、智慧安監、環境治理、教育等諸多領域結合後,都帶來了大量新的應用和商業機會。

因此,無論是傳統的資料探勘、還是機器學習、深度學習,所有的模型都離不開大量的資料,可以說大資料技術是AI應用的養料和土壤,大資料技術催生了AI應用的落地。

記者:最後一個問題我們來聊聊AI的應用前景吧。您覺得現在AI技術是否已經成熟到可以大規模落地應用了?以金融行業舉例的話,您認為要真正實現AI技術在金融服務中的全面落地,現在還缺少什麼?比如技術方面、資料資源方面等。

王東:最近對AI應用討論得挺多,有以下幾種觀點:

  • “速勝論”:理由是基於深度學習技術的爆發式進步,由AlphaGo完勝人類職業圍棋頂尖水平為導火索,在影像領域(影像識別、人臉識別、影片識別等)、語音領域(語言識別、語言合成、智慧翻譯等)取得了巨大的成功,火熱的人工智慧帶來了很多機會,資本的大量湧入,市場上湧現了一大批 AI 初創公司,同時媒體的大肆宣揚,比如說「人類要被機器人取代」「機器開始威脅人類」等等,導致一部分人對AI技術已經能夠大規模普及和落地充滿信心。

  • “投降主義論”:隨著進一步研究發現,許多問題並沒有解決。例如開放領域的聊天機器人不夠聰明,整體有待加強。主要原因在於自然語言理解的發展程式並沒有我們想象中快,深度學習也似乎沒有解決這個問題,可以與人類對話交流的機器人好像從未出現過。有外媒甚至評論道:“我不確定能不能說聊天機器人死了,因為我不知道它是否活過。”除了上述的一些成功領域,深度學習也並沒有解決其他所有領域的問題。

瞭解到人工智慧歷史的同行都知道,其實人工智慧至今經歷了三次大的熱潮。每次都經歷了開始是“人類要毀滅了”,後來是“騙子”的過程。

實際上,在一個特定領域的優秀表現,並不能代表 AI 技術無所不能。同樣的,在通用領域不能解決的問題,不代表特定領域不能解決。

我更加相信“持久戰論”,羅馬從來都不是一天能夠建成的,技術的突破也必然會經歷一定時間的積累。AI技術在金融服務中的落地,我比較贊同宜信CTO向江旭先生提的觀點“大膽擁抱,小心實踐”。

首先需要選擇金融領域的業務痛點,並透過AI技術來解決這些痛點,把非常炫酷的AI技術落實到實際業務需求中,而不是為炫酷而炫酷。就目前而言,我們的AI中臺會選擇在智慧機器人和知識圖譜構建上發力。智慧聊天機器人能為公司內外提供專業領域的知識解答,知識圖譜能為各業務方提供智慧問答、智慧搜尋、精準營銷等。最重要的是,我們希望按照平臺化的方式去建設它們,希望建設知識圖譜的方法論、工具和平臺可複用。

目前在落地過程中,除了搭建AI中臺相關平臺以外,花費時間最多的是與資料相關的過程,無論是模型訓練,還是知識圖譜構建,很多時間用在獲取資料和探索資料。

對於普通的模型訓練,需要多個維度的資料,AI科學家需要對這些資料進行觀察和探索,一般這些資料都是結構化資料,這個問題會隨著資料中臺的成長,資料彙集越來越多後,得到逐步的解決。資料中臺提供自助化探索資料的能力,能夠大幅減少獲取資料和探索資料的時間和成本。

對於圖譜構建和自然語言處理,我們很多的金融資料儲存為非結構化的資料和語料,例如pdf文件、表格資料、掃描圖片等,一方面要求資料中臺或資料平臺能夠提供非結構化資料的獲取能力,另一方面也要求AI中臺提供對這種非結構化資料進行線上標註、線上提取的平臺級能力。

嘉賓介紹:

王東:宜信科技中心AI中臺團隊負責人

北京大學軟體工程專業碩士,宜信科技中心AI中臺團隊負責人,目前負責宜信AI中臺平臺的建設工作。研究領域方向包括開放AI平臺建設、智慧聊天機器人、實時資料歸集和處理、大資料平臺研發和推廣等。擁有10年以上金融和網際網路企業基礎系統和資料類研發經驗。宜信敏捷大資料棧DBus開源專案負責人,CUBRID-cluster開源專案發起人。曾任韓國最大搜尋引擎公司——Naver資深工程師,多年負責CUBRID-cluster分散式資料庫引擎和CUBRID資料庫引擎研發工作。

來源:宜信技術學院


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69918724/viewspace-2651440/,如需轉載,請註明出處,否則將追究法律責任。

相關文章