近日,明略資料宣佈已於去年完成 10 億人民幣 C 輪融資,投資方為華興新經濟基金、騰訊產業共贏基金。
明略資料是一家大資料應用公司,聚焦公共安全、金融、工業與物聯網等行業,基於知識圖譜資料庫的落地實踐幫助行業客戶實現業務智慧化。
目前,明略資料已與省、市級公安局、交通銀行、中國人民銀行、光大銀行、中國中車、上海地鐵等行業客戶展開多方合作。
畢業於北大數學系,明略資料創始人吳明輝對資料有著深刻的理解,並先後創辦了秒針系統和明略資料兩家公司,用資料賦能行業。
關於吳明輝和這兩家資料公司的故事,他跟我們聊了聊。同時,從他的創業史,我們能一窺這些年大資料企業級服務在中國是如何發展的。
以下為採訪對話實錄:
我為什麼做明略資料?
當時決定要做明略的時候,我看到中國企業級服務正處在天時地利人和的狀態。與美國相比,中國 To B 領域獨角獸企業數量偏少,估值較低。這就意味著企業數量會增加,也就是「天時」,企業數量增加,To B 服務就有新空間。「地利」是指技術進步,「人和」是指中國人口紅利消失,人口結構升級,企業有通過提升效率來提升競爭力的共識。
2013 年斯諾登事件發生以後,國家出臺了很多政策支援國產軟體發展。在這個事件發生之前,因為中國的 IT 產業比美國落後很多年,很多領域的國產軟體無論在功能上還是穩定性方面都比不上海外公司,大多數只能靠價格取勝。當時我看到了國產軟體即將崛起,還有大資料產業興起,就創辦了明略資料,幫助客戶搭建大資料平臺。
創業過程中運氣也很好,公司註冊一個月之後我們就簽下了銀聯。註冊一個月的公司服務銀聯,這是很驚奇的一件事情。當時自己也總結了一下:我們當時在技術上有很多的積累,在創辦明略資料之前,秒針系統已經是營銷大資料市場份額最高的公司,當時我們的團隊在處理網際網路類似的使用者行為資料,和 BAT 是一個資料量級的。
但是後來,我們的資料平臺產品服務了大概三、四個月之後,就開始發現源源不斷出現競爭對手。所以我當時就跟團隊討論方向,最後我們自己得出一個結論:在今天的網際網路時代,公共基礎建設類的技術產品,基本上就沒有創業公司的機會。
所以我就快速的決定轉型,一定要去切行業細分市場,因為行業市場的資料首先它有價值,能用起來,而不是隻是存起來。第二個是垂直行業化,就是資料處理技術不能僅僅依賴簡單的開源,在垂直行業也要找有壁壘的資料場景。
我們當時研究了海外所有的大資料公司,也驗證了「做應用這一層公司的市值遠遠大於做工具的」這一假設。在做應用公司中,做的最棒的就是 Palantir,看到這家公司之後,我們就決定開始朝著它的方向做,而 Palantir 最大的業務領域就是安防。
同時,我們在接觸銀行、公安、軌交等看起來很傳統的公司過程中,驚奇發現它們在資料底層方面已經做了很多準備,也對資料指導業務趨勢有很清楚的認識,問題在於行業數字化程度仍然不足,市場上也找不到合適的服務商。我們認為,這就是明略的市場機會。
在管理秒針和明略這兩家資料公司中,我自己一直有個觀點:坑就是機會,能輕鬆搞定的就不是機會。進入市場的時候一定是有困難的,當時我說:「我們就去試一把。」
我們試的時候發現傳統公安行業的軟體有很多提升空間,我察覺到這真的是大機會,需要趕快進入到這個市場裡面。
在安防領域的初步摸索
第一版做出來用了半年的時間,過程中我們也發現,其實公安客戶的團隊文化也很簡單,直接。因為他們每天工作壓力太大了,你能幫他們解決問題,就一定有市場。之前很多軟體公司跟公安合作不起來,都是因為他們沒有真正解決問題,沒有給真正的一線的警察解決問題。
我父親原來也是一個警察,基本晚上都很晚回家的,每天都是各種執行任務,很辛苦。後來我們真的開始解決問題以後,就越來越深地進到這個市場了。然後我們的產品就開始不斷迭代,走到今天。
我們是安防領域接觸警種最全的公司,是做資料治理和融合做的最好的公司。2015 年,我們推出了針對公安行業的人工智慧大腦「崑崙鏡」,在海量的公安資料基礎上,構建了公安行業知識圖譜。
過程中其實問題很多。最大的問題是原來的系統太多了,一個公安局加起來可能就有上百個系統。
所以我們要解決的第一個問題就是把這些資料整合到一起。這些資料很亂,還「年久失修」,所以我們業務開展的頭半年解決的核心問題就是怎麼把這些資料融合到一起。這其實正好也是原來最開始我們公司的初心。
相比於傳統的做法,我們是要把所有資料都匯聚到一起,資料和資料之間要連線到一起,才會產生價值。但是如果你只是把資料都存在一個硬碟上,它們中間沒聯絡,其實跟傳統資料庫沒區別。所以我們能看到,最大的挑戰就是這件事情:怎麼能夠把公共安全這個行業裡邊的這麼多種多樣的資料,我們叫多源異構資料融合到一起,這就是我們看到的最大的挑戰,後來我們公司投入了大量的精力來解決這個問題。
跟傳統的資料服務公司相比,我們的優勢在於能夠處理各種型別的資料和底層結構,解決傳統資料公司無法面對的問題。而且,我們還將案例沉澱,固化成產品,複用在不同客戶場景。這是我們特別驕傲的一點,明略在公安領域的覆蓋率和成功案例遙遙領先。
從安防到工業物聯網和金融
2015 年,明略資料接觸了地鐵軌道交通行業,並且實施了第一個軌交大資料平臺專案。到現在,我們看到,這個領域的市場需求很旺盛。當時,我們籤地鐵軌道交通領域的一個客戶,他們是國內製造業企業的絕對老大,在全世界也是中國拿出去的一張名片,他們也看到了大資料的機會,所以當時就想選一個大資料廠商。我們當時競標的幾個競爭對手基本上都是行業領軍的 IT 企業,但是最後我們贏了。
我覺得我們贏在誠意,我們派去的團隊打動了客戶,客戶說,你們派過來的人是天天可以陪著我一塊工作的,而且團隊也很優秀,所以本土的客戶很信任我們。
跟著客戶一起工作之後,我們發現其實工業資料有很多痛點。第一,資料量太大。舉個例子,一個機車,不用說後面的環節,光車頭上大概就有上千個感測器,每個感測器每秒鐘都要傳送很多訊號,如果把這些資料都存下來的話,一輛車一天的資料已經能夠達到幾百 GB 的量級,根本沒法存。後來,我們對每個感測器上各種各樣的引數設定臨界值,超過多少或者低於多少預設值的時候,就把這個時間點前後幾秒鐘的資料存下來。
資料存好了,就面臨了另一個問題。這些資料發回來的請求速度是很快的,需要系統具有實時計算的能力。我們對計算引擎做了很多優化和改進,接下來再利用上面的資料去做資料探勘,甚至做 AI 模型。這些其實都不簡單。
還有一個挑戰,比如一個車車頭有很多的零部件,但是不同的零部件可能來自不同的廠商。車上面不光有車身系統,還有軌道和訊號系統等等,每一個系統都有自己的資料,這些資料之間還有協議的問題,加密的問題。想把它們全部都連線到一起,並按照我們的思路去解決問題,這本身就是一個很「重」的工作。
到今年 4 月,我們明略已經做了四年,這四年也是通過這種「重」,積累了大量懂行業的資料人才。
後來我們開始做金融,起初我們做的是一個評分模型,當時市場上已經有很多公司在做了,競爭非常激烈。
但其實,我們在金融領域做的這件事情,本質上來講是我們公安業務的延伸,因為資料探勘和AI演算法是我們的強項。每一個金融集團,旗下都有很多板塊;一個銀行的系統可能包含好幾百個元件。我們做的事情是幫它們把各個板塊的資料連起來。整合完之後,在這個基礎上幫他們解決業務問題,比如說員工的內部審計,反欺詐,還有交易分析等等。這些其實都跟公安有關係的,因為公安系統裡有一個專門的部門叫經濟偵查,就專門處理這些案件的,處理完了以後一般都要到銀行來找證據。本來就有聯絡,所以我們就順藤摸瓜做過來了,這個東西和傳統的風險評分不太一樣。我們其實更多的是把這些資料關係轉變成知識圖譜,進行全維度的風險畫像的展現,和公安有些類似,所以我們進入金融領域有一些天然的優勢。
明略的產品佈局邏輯
我們的方向是「堅定地做深,做垂直行業化」。去年,我們釋出了行業人工智慧大腦,也就是明智系統,目的是更容易為行業服務。它包括面向AI的大資料治理產品CONA、知識圖譜資料庫蜂巢(也就是NEST),這些產品會通過行業大腦SCOPA的機器學習、符號推理等能力實現秒級運算以及實時線上分析挖掘。這些產品是我們構建公安大腦、金融風控大腦、工業安全大腦的基礎。
我們的目標其實是要設計開發出來一個像人類大腦一樣靈活的儲存器,什麼資訊都能存。
當然這個目標還需要很多努力,我們花了很多的代價,還在不停地往前走。這個儲存系統裡面需要既有傳統的搜尋引擎的索引,就像像百度和Google,又要有智慧的圖文檢索,最後要像人的大腦一樣,很靈活地把資料存起來。
在系統之上,我們提供了一個自然語言互動入口——「小明」,它能夠以文字對話的形式降低人工智慧產品的使用門檻,提供高效的業務支援。
當你的功能太多,很多東西都聯網的時候,你會發現任何人機互動形式都不如自然語言互動。這就是小明的必要性。
今天為什麼大家都在搶智慧音響這個入口,因為確實每個人生活最理想的狀態,就是每個人都有一個保姆。那個音響其實就是你家的阿姨。同樣的道理,我們是做企業級服務的,在工作場景大家都希望有個祕書,是不是?
小明就是這麼一個目標,但小明和 Siri 最大的區別是什麼,在工作場景裡邊就不要語音了,因為會打擾別人,所以我們就用文字輸入的形式。比如現在我想查這個人最近跟誰有往來過,你就打這句話就行,背後可能有一百個系統,有很多的資料庫,來幫你挨個去查,這就是小明的價值。但是具體到基層實際應用的時候,坦白講還是有很多問題,離大規模應用還有距離。
這一整個體系我們稱為明智系統。
資料業務是一個由「重」到「輕」的過程
你可能也發現了,在我們的業務模式中,人的參與度還是很高的。其實,今天去看 Palantir 也是這樣的,我上次看他們的報告,分析師都已經 1500 人。我們的團隊發展得也挺快,所以這個事兒還是挺「重」的。
逐步自動化這件事情它有個過程,人工在這裡面扮演的角色,最開始確實會特別重的,可能甚至有很多是體力活,因為我們的業務特點就是人到現場。但是慢慢的就會變得更簡單。
舉個例子,我剛剛說的資料融合的過程,最開始是要去人工的去看,隨著治理的資料越來越多,這個時候後臺的系統就可以把一些人工的事變成自動化去做,甚至用人工智慧去做。
在公安領域,公安裡面有很多不同的業務,需要的模型都是不一樣的,一開始第一個客戶的第一個業務可能都是人工重新給它定製,但是定製完了以後,比如情報分析這個場景,客戶和客戶之間,很多是一樣的。所以說這是一個可複製的、從重到輕的一個過程,但是一開始是免不了需要很多人去做。
明略選領域的時候,會去看行業本身的知識密集性是不是很高,是不是需要比較優秀的知識勞動者才能去從事的行業,這是第一點。第二點就是說它本身需要的量很大,比如知識型工作人員在這個行業裡面的人是遠遠不夠的,是供不應求的。這些行業我們都會去關注。
其實公共安全就是這樣一個行業,中國的警察人均服務人口數量,是全世界平均的三倍,但是老百姓對警察的要求是很高的,每一個老百姓都希望有人在背後保衛他的安全,很多人還想要個福爾摩斯。所以我們公安部部長一直都在提倡向科技要警力。
目前計劃我們還是先聚焦在現在已經紮根的這三個方向,行業人工智慧這個事情就是要一步一步走。以我們今天的體量來看,我們的資源還是在這幾個方向,既然有先發優勢,我們就好好做。