從 Kensho 看大工業金融的發展路徑(下)

文因互聯發表於2018-08-22

在下半部分的文章中,鮑捷博士將細緻闡述一種反常識的新思路——智慧金融的切入點,一定不是股票交易,離交易越遠越能落地。

他認為,Kensho 不會取代任何交易員、投資人或分析師,想坐在Kensho這類智慧系統上躺著賺錢是不切實際的。

智慧金融系統目前真正的價值,不是直接幫投資人掙更多錢,也不是省錢,而是透過人工智慧建立起金融機構的大規模自動化系統,讓監管、銀行、投資機構等決策行為減少對個人經驗的依賴,從而減少人員流動對機構的衝擊,建立新型的協作系統。

智慧金融當下在中國真正的合理路徑是:由零件的標準化導向“大工業金融”,本質是金融資訊處理過程的(部分)標準件化。把金融資訊和資料資產化,才是智慧金融系統最大的價值所在。

作者介紹

鮑捷博士,文因互聯 CEO。擁有20年學術界和工業界的相關經驗。美國Iowa State University人工智慧博士,RPI博士後,MIT訪問研究員,W3C OWL(Web本體語言)工作組成員,前三星美國研發中心研究員,三星問答系統SVoice第二代系統核心設計師。主要研究領域涵蓋人工智慧的諸多分支,包括機器學習神經網路資料探勘自然語言處理、形式推理、語義網本體工程等,發表了70多篇領域內相關論文。是中文資訊學會語言與知識計算專委會委員,中國計算機協會會刊編委,W3C顧問會員會代表。2010年以來關注金融智慧化的研究和應用,成果有XBRL語義模型,基於知識圖譜的基本面分析、金融問答引擎、財務報告自動化提取、自動化監管等。

智慧金融的路徑:由零件的標準化導向大工業金融

標準化會帶來意想不到的新應用

智慧金融的新路徑,我認為應該是透過零件的打造,逐步走向所謂大工業的金融。

就目前這幾年時間,比較合理的目標和路徑,是把資訊處理過程中一部分的過程標準件化。自動化、標準化、工業化,這三塊是相互影響的。

我們把工業化話題展開一點說,因為資訊工業影響金融工業,不是今天才發生的,在很早很早就發生了。我前兩天在讀《美國金融業史》,裡面講了一個電報的案子。美國在早年的時候,有很多交易所,這些交易所的那些交易的規則全是不一樣的,後來電報發生之後,改變了這一切。所有的交易所都死了,只留下了一個,紐約的交易所。因為資訊的傳播速度的上升,就使得各種資訊披露也好、交易規則也好,都標準化了,把這種分裂的市場變成一個統一的市場,所以其他的市場都沒有了。

往後看,比如說電話、網際網路,它們每一次都帶來了類似的變化。比如說個人消費信貸,在沒有電話之前是一個情況,到二戰之後,人們透過電話,改造電話線,有了信用卡網路,完全啟用了一個新的市場。所以目前狀況也是類似的,如果狹義地看標準化本身,第一個階段可以看到的,可能就是我們做某件事情的效率提升了。

當電話進入金融機構的時候,大家可能想到的是,電話幫我跟其他人發生了實時的雙向語音通話。這個是改進了一點效率,但並不一定能激動。但是當大家發現電話上面加那麼一點東西,突然可以催生出個人信貸新形式的時候,這就有意思了。所以很多底層平臺的標準化會帶來讓人完全意想不到的新應用。大部分情況下,人們沒有辦法預言這是什麼。但首先我們要提供這種標準化,提供這種通用工具。

從金融資料農業到金融資料工業

我把現在的金融資訊服務業分成四大類:農業、礦業、手工業、大工業。我們要努力去創造的新生事物——大工業。

資訊農業是什麼?就是從金融的“自然資源”裡面刨資料。這種情況在最早的時候,大家都是用人工來做的。我以前跟華泰聯合的一位前輩聊的時候,他說在十幾年前,他們開始做這件事情的時候,是每天看中國證券報的。從紙質報紙中,把資料扒出來,然後看併購標的的情況。後來進步了,有了各種各樣金融終端。但這些事情,依然還沒有改變這件事情的農業本質。基本上模式都是一樣的,就是在人力成本比較低的地方,找一幫小弟小妹們,通常大概是幾百個人,人肉地把這個數字給摘出來。我把這個稱為農業。

農業其實是一個很好的產業,如果農業能夠經營得體,利潤率50%是沒有問題的。但是農業面臨的最主要的困難,就是它很難去大規模地擴大。比如說很多資訊農業,他們在主機板時代是做得很好的,但是他們在新三板時代,他們的擴大就很成為問題。因為目前主體,已經不是1000家、2000家公司了,而是1.5萬家公司了。我們原來做產業鏈研究,招幾十個人就可以做,但現在要招幾百個人來做,組織一個幾百人的人員團隊,是一個非常有挑戰性的事情。而要手工處理所有1.5萬家的全部財報或公告的話,那需要幾千幾萬人。所以很難去規模化地擴大,很難去擴大生產,很難去延長產業鏈。這是資訊農業最大的問題。

資訊礦業,就是指在已經有了結構化資料的前提下,比如說,最典型的工商資料,從結構化和半結構化資料中去改進資料的可用性。這也是一種很好的模式。但如果沒有深度的加工能力,壁壘不會高。

第三種就是資訊手工業。傳統的金融的決策過程,大部分是手工業的過程。我自己去進行大量的閱讀,大量的學習,從而建立起對世界的認知,然後我把這個對世界的認知進行變現。這就是一個手工業的過程。這裡面涉及到個人的經驗,也涉及到人脈。很多訊息,你能得到,別人卻得不到,為什麼?就因為我認識誰誰誰。最早的時候,我們去採訪一些金融界的年輕人,有一位跟我說,“我感覺好像我的能力什麼的,跟我的老闆也沒啥區別,但就是因為他認識一些人,所以他在那個位置上,我在這個位置上”,他憤憤不平。如果一件事情本身就是依賴於個人的經驗,那的確會這樣。在此也可以看到,基於這樣的手工業,同樣會導致VC或是券商的某些部門,在它大到一定程度後,裡面的人成熟以後,有人就會憤憤不平,他一定會走,帶著他的經驗和人脈,因為這是一個個人不可複製的資產。

最後一種是叫大工業。大工業的特點,不是依賴於個人的經驗和人脈的,也不是依賴於一些現有的自然資源的。它是基於一種可複製的技術和系統,建立起一種協作的關係,從而製造出千千萬萬種有質量保證的產品。在礦業中,那就是開採石油;在工業中,那就是製造塑膠。從這兒可以看到,例如中東那些產油國,雖然他們能夠生產很多石油,但是他們可能連生產一支筆的塑膠都造不出來,因為他們不具備這種工業能力。

我認為未來的金融服務業,在美國那邊是260億美元的生意,但在中國還是規模非常小的。中國金融的資訊服務業是不到100億人民幣的生意。是不是有一天,中國也達到260億美元,或者說2000億人民幣呢?是不是會有一天甚至比美國更大呢?也是完全有可能的。但如果走到這一天,一定不是靠農業這種辦法,也不是靠有更多的農民來“種地”的辦法,而一定是透過技術建立起金融資料大工業,從而連帶著整個金融產業發生一些比較大的變化。而且這些變化並不是像 Kensho 這種,我有了一個變魔術的機器,便能夠使我比市場贏得更多回報率的東西。

如果再往前發展的話,我認為中國金融在今後十年之內,會發生一個很大的變化。它會超越現在的手工業的金融,它能夠有更大的標準化的生產。比如說我相信大家每一個人都有自己的EXCEL表格,每個人都有自己的分析模型,每個人都有自己積累的一些小技巧。其實在早期的手工業裡面,這很容易看到,諸如造個輪子,造個碗,每一家都會有這樣的小技巧,每一家都把自己的小技巧藏著掖著。所有這些手工業者都擔心其他的手工業者搶走他們的飯碗。所以,手工業者會傳兒不傳女,把很多技巧給藏著。但我們知道,最後這些手工業者都還是被大工業給幹掉了。這樣的事情會不會也在金融界發生?我相信會的。

所以,最關鍵的事情,不是在現在這個階段,大家都去追求超出市場收益率的投資決策。如果我們大家想用 Kensho以實現坐著數錢,這件事情是永遠都不會發生的。現在不會發生,再過10年不會發生,再過100年也不會發生

新協作、新體系

能夠真正建立起來的合理的追求目標,是建立起一個金融資訊處理的協作系統。或者更現實一點兒講,我們並不是非得跑得比整個市場快,有時候只需要比旁邊的人快就行了。

其實在不同的部門裡面會有不同的落地形式。前兩天我也跟一個機構的IT部門負責人聊過。他提到一件事,他說以前他們在上投研工具的時候,領導是沒太大動力的。因為從領導來看,無非是他省了點錢。而在整個公司的三張表裡頭,這筆錢是放在費用裡面的,不是放在收入那邊的。這事對領導不見得有什麼動力。首先便已經證明了,從長期來看,透過這種工具來提高收益回報率的目標不切實際。第二,如果僅僅是省錢,這個目標不夠性感。他想讓事情這樣發展:在這個基金中,研究員會不停流動。在他看來比較有意義的目標,是整個投研不再依賴個人。但其實金融是什麼?金融就是資訊和資料。把這些資訊和資料資產化,這才是我上這個系統最大的價值所在。

我覺得這就是一種非常正面的思路,而不再是傳統的、狹隘的,一個個人提高投資回報率的過程。這更多是從系統角度講,如何去建立一個協作系統,在這個協作系統中提高了整個組織的資產(assets)

在投行、銀行這些行業也都有類似案例,我們也都聊過。

我這邊再著重講一下監管。自去年十九大以來,整個監管對科技,特別是對人工智慧的熱度和關注度好像一下升上來了。包括幾個大的部門,股票、基金、債券;也包括新三板這邊,合規性檢查;還有下面的評估、評級,以及整個宏觀風險的監控。目前國家的投入量是非常大的。

在我看來,這也是一個大家特別需要關注的宏觀方向。它的壓力會一層一層的傳導下來。前天我也看到有一個從事券商的高管在朋友圈裡抱怨,說以後沒有辦法再做了,一罰罰50個億。其實這也可能代表,我們們關注投資的時候,不能僅僅只看收益或者是金融創新,在目前階段,更重要的是如何去規範這件事情。中國新金融往前的傳導會有一個傳導週期。可能最早的、最先把最核心的技術給應用起來的,是國家機構。它是在整個產業最上游,把這些新技術應用起來的。它會有一個傳導過程,然後一步一步地傳導到,比如說券商,再往下傳導到上市公司,上市公司的子公司、連帶的公司,如此一級一級傳導下去。這個傳導週期,可能會要花幾年時間。但是我相信,大家或多或少都會在未來感受到。

我們不應該去追求替代交易員,或者是投資經理。這是做不到的。我們也不應該去追求跑贏市場,因為市場本身不能打敗市場。當所有人都去追求跑贏市場的時候,沒有任何人能夠跑贏市場。從人工智慧角度來說,人們不應該去追求透過圖靈測試。實際上在很長一段時間內,大家對於類似Kensho的金融問答系統,是希望它達到人的水平的。而那也就是圖靈測試,是做不到的。

投資、投顧、投研:不能直奔平臺而去

另外一點,對於這樣一個複雜的系統,我剛才也分析了,做好 Kensho 有很多的攔路虎。如果我們想做好,不應該一下子就去追求做這樣的系統,不管是智慧投研系統、智慧投顧系統,或者是智慧投資、智慧投機系統。可能在短期內都是做不到的。

就針對這兩個多說幾句。其實這個事情反常識,它不僅僅是在金融這一個領域,應該是在所有的人工智慧領域裡面的,是一個普遍的反常識。建設一個人工智慧的系統平臺,不能直奔平臺而去,因為通常人工智慧系統都是一個非常複雜的系統,都是要幾百個人年才能做得到的。

一開始,不管你是做語音也好,做影像也好、文字也好,如果你一開始就搞一個很大的平臺,比如說我錢多,一下子砸10個億、砸100個億,基本上註定這個專案一定會失敗。最典型的就是日本的五代機。日本在80年代的時候,想做出第五代計算機來,冠名人工智慧計算機。那是舉國之力,用整個日本國家的力量來做這樣一件事情,但沒有做成。目標太大了。

這可能是大型系統普遍的規律,它不是設計出來的,它是生長出來的,它是一點一點地透過一些很小很小的元件,一點一點地逐漸地去碰撞、去組合,慢慢地生成的。這件事情很難透過一下子砸100個億,就能夠達成的,沒有這樣的事情。直奔這個平臺而去,基本上可以收穫100%的失敗。

第二個,如果我們要做金融領域的人工智慧,就不能直奔著搖錢樹而去。最早的時候,也有人給我提過這個建議。他說,你跟客戶談錢就好了,就說“我能幫你掙更多的錢”。你給他種個搖錢樹,給他更好的投資回報。但這其實是做不到的。如果奔著搖錢樹而去,最終是真長不出來樹的,也長不出果子。這都是反常識。可能一開始剛剛進入這個行業的時候,很多人直接就這樣,“我要造一個系統,能夠持續幫我掙錢,躺著都能掙錢,睡覺都能掙錢!”。但是做不到。

具體分三個領域來講:投資、投顧、投研,每一塊展開都能說兩個小時,今天只能提綱挈領地來講了。

比如說智慧投資這邊,打敗市場是困難的,最重要的是打敗自己。每個人都是非理性的,所以我們僅僅只透過資料是不可能形成正確的決策的。在前幾年的時候,曾經有一個很火爆的東西,叫大資料指數基金。最早應該是在2010年的時候,印地安納大學的一個教授曾提出過這個理論。他還寫了一篇文章,說自己開過一個公司,就實踐他這個理論,可兩年後公司破產了。我們也看到,過去這幾年,所謂的大資料指數基金基本上回報率都是很低的。在此基礎上,我們也看到了一些和它類似的東西,比如說,智慧投顧,它的整個回報率應該也是低於市場回報率的。

另外一點就是規模。我們也經常遇到這些情況。有人說量化有用,人工智慧有用,但是你可能要問他一個問題,你是在多大錢的規模上?
如果是在幾十萬上面,那是一個事情。幾百萬上,是另一個事情。幾千萬上,更是另一個事情。如果在一個億以上的事情,那還能做得到,那真是非常非常的牛逼。但是在座的很多人身家應該都超過1個億,或者是管理規模超過1個億。在這個基礎上,每個策略能夠做什麼事情,它對市場產生的影響是什麼。是不是一旦有效就變得無效?我相信很多人應該是有這方面的體會的。那麼對於10億以上的投資,你想透過人工智慧做一個策略,甚至是幾十個策略進行對沖,或者幾百個策略進行進化,都是非常非常困難的事情。當我們在談一個東西有效的時候,前提就是規模是多少。後面幾個細點就不提了,如果感興趣,我們可以回頭再研究。

投顧也是一樣的。投顧技術分成幾大塊,一塊就是底層的資產配置。這一塊是沒有多少人工智慧在裡面的。再一塊是使用者畫像,這裡面現在有很多用到的機器學習。從去年年中開始,越來越多的人開始關注智慧投顧後的其他事情了,不僅僅是投前,也不僅僅是資產配置,投後的服務。因為最早的時候,智慧投顧之所以能夠吸引到這麼多錢,可能是因為兩個原因:第一個原因,大家對人工智慧有一種期待,就是說我能夠打敗市場,我能夠去獲得更好的回報率。但是就目前市場的表現,實踐證明這一點很難做到。第二個原因,基於客戶本身,他們對人工智慧會有一種期待。你只要說我的基金用人工智慧了,我是智慧投顧了,就會有很多人來買。而一買就買上百億,以此收益率來獲客。資產新規出來之後,這條路也被關上了。所以智慧投顧往後走得開發新的東西,而不是原來這些東西。特別是投後的很多的事情,在智慧陪伴這一點上,也是人工智慧可以幫助大家的地方。

第三點,智慧投研。在投顧或者投資,或者投機裡頭也是需要投研的。我就不展開多說了,因為在市場上也看到很多類似投研的產品,包括怎麼幫助你更好地看公告,更好地看研報,更好地看資料。那是不是在傳統的場景裡,我們需要優先把這個東西用上?早些時候,我們曾經有過討論。我們在想,傳統的投研場景是什麼樣的?如果是對於紐約那邊的分析師來說,6個顯示器,那是投研的場景。可這種桌面的投研場景,是不是我們要去追求的?可能還有新興的場景,新興的應用,或者新興的機構。這些地方也許是投研更能夠去發揮的地方,或者,更多的是以前根本沒有想到可以用投研的地方。如果在中國,我們看傳統投研的話,券商那邊幾千人,買方分析師、投資經理幾萬人,加在一起可能不到5萬人。但如果我們把投研只用來服務這5萬人,就嚴重低估了這個技術。也許是5000萬人需要這個技術。

其實以上幾點一直都在討論,我們構造智慧金融系統,不必把我們的思想侷限在做交易這一件事情上面,很多點上面都是可以用它的,而且我們不一定要從一個所謂的大的系統開始做這個事情。

用零件的標準化觸發系統性變革

用歷史眼光來看,整個金融IT建設的歷史,可以分為四個階段:資訊化、大資料化、自動化、智慧化。

第一個階段就是資訊化,或者說是電子化,上各種資訊化系統。大概從十年前開始,我們就進行了大資料化,比如說銀行有各種雲,還有把分散的各個部門的資料彙總在一起的資料。這兩年開始便有了自動化,包括自動化報表,自動化服務。從去年開始有智慧化的需求。每一步都是依賴於前面那一步的。

在我看來,現階段,最重要的是自動化,我們把前面那一步已經做得挺好的了。經過以往7、8年到10年的實踐,大資料化,包括銀行、券商都做得相當不錯了。銀監會剛發了一個文,要求各個銀行加強內部資料治理,以後要有資料治理的標準。我們昨天剛聊了一個銀行,他們從一開始做了內部資料治理,便有了比較好的機構化資料;而有了那一塊之後,新的東西立刻隨之出現,例如各種自動化的需求,自動化的匹配、自動化的報表、自動化的研究。又比如說我認識一個券商的資管部門的研究人員,他們現在用各種EXCEL表格來做資產的配置,而這事以後肯定會自動化的,不需要再用EXCEL表格來做了。

所以核心就是自動化,怎麼做到自動化?怎麼做到人工智慧化?要把底層資料結構化。底層的這些東西,就是要一層一層的逐漸從零件開始。我們從投研的各個不同的環節開始做零件、做工具的打造,做解決方案,到系統。

我這裡再講一個小故事,跟金融沒有關係,但是挺有啟發的。瓦特作為蒸汽機的發明者,其實是改良者,他到底做了什麼?他發明了熱力學某某定律嗎?肯定沒有。他發明了一種新的熱機迴圈的方法嗎?也沒有。其實瓦特真正的改造,他之所以能夠讓蒸汽機的效率提升如此之大,都是在零件層面上做文章。比如說在如何傳動的問題上,他發明、改進了分離式冷凝器、行星式齒輪、平行運動連桿機構。而就是有了十幾個這樣的改進和各種零件層面上的改動,才促使了之後系統的變化。

再舉個例子,福特的汽車案例。他生產出了流水線,可他是如何把整個生產成本降到這麼低的?在很長一段時間,法國的汽車是比美國的汽車造得好,產量高的。但在福特發明了流水線之後,這一切全變了。一直到第一次世界大戰之前,法國一年只能造4萬輛汽車,因為需要手工打造每一輛汽車。而流水線的標準化改變了這一切。這便是零件的標準化所能帶來的價值。

而對於打造一個智慧金融的系統,我們目前可以製造其中大概一百多種零件。我們能做的零件肯定不止這些。我相信未來的金融大工業會需要比這多得多的各種零件。但我們目前可以從這些零件開始,來做一些現在、立即、馬上,就能夠做的事情。我們在著手去構造一個智慧金融系統時,一開始可能想的是用1000萬、2000萬來做這個事情。但是如果我們從現在就能夠做的小事開始的話,可能就不需要這麼多。也許20萬就能啟動一件事情。很多事情可能沒有想象的這麼難。

如果我們把我們的目標定在理性的目標上,要想做到這一點,我們就要打造新金融,用人工智慧打造新金融。新金融是需要新金融人的,我們可能要清掉我們腦裡原有的很多想法。這些業務中很多未必是透過原有的做法去向外推的。我們還可能需要一種新的方法去適應大工業時代的協作。至少,我們要更加地開放、更加地協作。

結論

說了這麼多,我相信大家今天回家以後,大部分內容可能都不記得了。但我就希望大家記得這一句話,Take-home message:智慧金融的路徑是由零件的標準化導向大工業金融的。就是標準化和大工業這兩件事情。如果說我們要想建立起未來的 Kensho,我們應該是要透過這樣的路徑。

相關文章