機器學習在金融領域的四大優勢和五大應用

藤子發表於2017-07-31

沒有人的生活可以脫離金融而獨立存在,雖然隨著科技的發展,人們變得越來越聰明,但金融是生活的基本必需品,因為每個人都需要錢來吃飯、旅行和買東西。目前已經形成了一個人與機器協同合作的金融市場,而人們正發明越來越多的方法來拖欠貸款、從其它賬戶偷錢、製造虛假信用評級等。今天,從審批貸款到資產管理,再到風險評估,機器學習在金融生態系統的許多階段都起著不可或缺的作用。然而,只有少數懂技術的專業人士真正明白機器學習是如何在人們的日常財務生活中發揮作用的。

機器學習是什麼?


機器學習是設計與應用演算法的科學,構建演算法可從資料中進行學習和預測。機器學習的應用在今天已很普遍,你可能每天不知不覺中使用了幾十次。機器學習也提供了大量的用例,比如自動駕駛汽車、產品推薦引擎、預測分析、語音識別等等。資料科學家使用機器學習的主要目的是減少人類工作量,將人類在閱讀、理解、分析大資料上的時間花費減少到幾秒鐘。

實施機器學習最常用的兩種方法是監督學習和無監督學習。監督學習演算法使用帶標籤的例子進行訓練,輸入資料對應的輸出結果是預先可知的。而在無監督學習中,學習演算法沒有任何標籤可使用,只能自己發現輸入資料中的結構。


金融業中的機器學習特色?

與機器相比,大腦容量對思維有一定的限制作用。人類最多隻能同時集中處理 3-4 件事情,而機器的處理能力是人類的幾千倍。除了速度,在金融領域的其他方面,機器也將比人類表現得更好。

可靠性:在處理財務問題時,建立個體信用評級系統是十分必要的。銀行、投資公司、股票市場每天都要進行多達數十億美元的交易。因此,我們必須信任處理此事的公司或個人。由於人性中可能存在的偏見和自私,有些人往往會在金錢交易過程中進行詐騙。為了解決這類問題,嵌入了機器學習的機器在處理請求時可以做到零腐敗。

速度:我們都知道在股票市場進行股票交易非常困難。人們通常在歷史資料、圖表和公式中進行大量的分析,以預測股票的未來,還有些人僅僅是隨機下注。所有這些行為聽起來都十分忙亂且耗時。機器學習演算法能夠對成千上萬個資料集進行精確的深入分析,並可以在短時間內給出簡潔準確的預測,有助於減輕人們在大資料整理和分析方面的麻煩。

安全:此前,勒索軟體 WannaCry 攻擊了世界各地的計算機,這表明,我們仍然易受黑客和網路安全方面的威脅。機器學習則通過將資料分為三個以上的類別,建立模型,以此預測欺詐或異常情況。而手工審查成本高、耗時長、誤報率高,並不適用於金融業。

精度:人們沒有能力或不喜歡做重複單調的任務,這種重複勞動往往會產生許多錯誤,而機器可以在無限時地執行重複任務。機器學習演算法會做資料分析的苦活,並在人類需要的情況下推薦新策略,還能夠比人類更有效地檢測到微妙的或非直覺的模式,從而識別出欺詐交易。此外,無監督機器學習模型可以不間斷地分析和處理新資料,然後自動更新自身模型以反映最新趨勢。

如何在信用評分中應用機器學習?

即使銀行極度謹慎並認真核實公司信譽,但跨國公司拖欠銀行債務,在金融領域似乎依然是一個普遍的現象。一些金融機構利用評分模型來降低信貸評估、發放和監督中的信貸風險。基於經典統計理論的信用評分模型得到了廣泛應用。然而,當涉及到大量的資料輸入時,這些模型的彈性表現較差。因此,經典統計分析中的一些假設就不能成立,這反過來又影響了預測的準確性。

根據客戶的國籍、職業、薪酬、經驗、行業、信用記錄等資訊來確定客戶的信用風險評分,甚至是在向客戶提供任何服務之前就進行此類評定,這對銀行來說至關重要,這是銀行在提供信貸或其它金融產品之前一個重要的關鍵績效指標(KPI)。

引入一個可以立即為客戶服務的中央整合的金融風險機制是目前面臨的主要挑戰。即使是現在,由於無法預測客戶的風險評分,銀行也無法立即通過貸款審批。機器學習則可以加快放貸過程,且能避免耗時而必要的盡調程式。迴歸演算法可以確定客戶的信用評分,這些演算法使用統計過程來估計變數之間的關係,在預測和預報方面得到了廣泛的應用,在機器學習領域的應用也得到了迅速的發展。這種方法的第一步是定義客戶歷史信用記錄的可用性,然後選擇目標人群,並確定基準來界定滿意/不滿意的表現。這部分將作為迴歸演算法啟動操作的基本資料集。下一步則是選擇樣本,選擇標準如下:

1. 確定公司系統中的可用變數

2. 定義利息期和樣本大小

3. 驗證資料的一致性和完整性

所選的可能的零散資訊也被稱為人口統計學變數:性別、年齡、職業、公司、教育、婚姻狀況等,一般推薦登記時長為 12-18 個月的客戶樣本。這段時間足以檢查延遲付款和違約的情況,且能鞏固優質客戶的支付行為模型。

通過變數選擇、變數屬性分組以及建立虛擬變數,則可以進行初步分析。使用列聯表來計算與獨立變數級別相關的相對風險(RR)指數,最後計算各個單一變數級別的優質客戶與劣質客戶之比。比例越大,該變數對未來業績的預測作用就越大。而RR 通常介於 0 到 2 之間,0 代表極劣,2 代表極優。但是,分析過程不會使用類別為中性(Neutral)的樣本,因為其優/劣程度相差不大。

模型的建立包括對多元統計技術的選擇。之後確定要使用的軟體、選擇獨立變數並檢驗技術假設,一旦資料減少到聚類級別,則可以使用判別分析、邏輯迴歸和神經網路,判別分析和邏輯迴歸則採用不同方法的統計技術。除此之外,還要對所選軟體進行有關實施與易用性分析的檢查。

最後,為了評估效能好壞,需要找出兩個樣本的 KS 檢驗。需要找出兩個叢集之間的差異,比如由各自的預測結果所界定的優/劣付款人,確定每個預測中的優/劣付款人分佈之間的差異,而 KS 測試的值是該模組中差異最大的一個。由於從模型得到的最終結果通常介於 0-1,當結果小於 0.5 時,客戶會被定義為劣質付款人;反之則為優良付款人。

機器學習的其它優點

欺詐檢測:使用機器學習進行欺詐檢測時,先收集歷史資料並將資料分割成三個不同的部分,然後用訓練集對機器學習模型進行訓練,以預測欺詐概率。最後建立模型,預測資料集中的欺詐或異常情況。與傳統檢測相比,這種欺詐檢測方法所用的時間更少。由於目前機器學習的應用量還很小,仍然處於成長期,所以它會在幾年內進一步發展,從而檢測出複雜的欺詐行為。

股票市場預測:買賣股票而成為億萬富翁是常有的事,但是,如果不瞭解股票運作方式和當前趨勢,要想擊敗市場則非常困難。隨著機器學習的使用,股票預測變得相當簡單。這些機器學習演算法會利用公司的歷史資料,如資產負債表、損益表等,對它們進行分析,並找出關係到公司未來發展的有意義的跡象。此外,該演算法還可以搜尋有關該公司的新聞,並通過世界各地的訊息源來了解市場對公司的看法。此外,通過自然語言處理技術,它可以通過瀏覽新聞頻道和社交媒體的視訊庫來搜尋更多有關該公司的資料。這項技術還在發展中,雖然目前還不夠準確,但可以肯定的是,在不久的將來,它將能夠作出非常準確的股市預測。

財資部(Treasury)– 客戶關係管理(CRM),現貨交易(Spot Transactions):客戶關係管理(CRM)在小額銀行業務中佔有十分突出的地位,但在銀行內部的財資空間卻沒什麼作用。因為財資部有自己的產品群,如外匯、期權、掉期交易(Swaps)、遠期交易(Forwards)以及更為重要的現貨交易(Spots)。線上交易需要結合這些產品的複雜程度、客戶風險、市場與經濟行為以及信用記錄資訊,這對銀行來說幾乎是一個遙遠的夢想。

聊天機器人 - 私人財務助理:聊天機器人可以擔當財務顧問,成為個人財務指南,跟蹤開支,提供從財產投資到新車消費方面的建議。財務機器人還可以把複雜的金融術語轉換成通俗易懂的語言,更易於溝通。一家名為Kasisto 的公司的聊天機器人就能處理各種客戶請求,如客戶通知、轉賬、支票存款、查詢、常見問題解答與搜尋、內容分發渠道、客戶支援、優惠提醒等。通過長期記錄使用者的可扣除費用,還能提供潛在節流賬單。

機器學習是一項比較新的技術,鑑於資料敏感性、基礎設施需求、業務模型靈活性等原因,機器學習的應用有其自身缺點,但它有助於解決很多問題,且優點大於缺點,因而受到了眾多學者和行業專家的分析,可以肯定的是,該領域在未來必定會出現更多創新的應用。

對世界各國來說,金融都很重要,機器學習技術比人類操作更為安全,能保護其免受威脅、改善其運營,是金融業的最佳選擇,也有助於各國更快實現發展和繁榮。機器學習在金融領域的四大優勢和五大應用

文章來源:https://www.marutitech.com/machine-learning-finance/

相關文章