和數傳媒:人工智慧和區塊鏈可能是典型應用

LikeLib發表於2019-02-25

某種程度上,大資料的概念定義依舊處在混沌的狀態,很少有人能講清楚大資料到底是一種新技術,還是一種多樣化的全域資料形態?

從資料本身出發,還是資料處理出發,這是理解大資料的一個問題?大資料的話題鋪天蓋地,熱鬧非凡!但是各界人士對這一流行話題的表述與理解卻不完全一致。曾經有段時間,很多企業以4V特徵來定義大資料,即Volume(數量)、Velocity(速度)、Varity(種類)和Value(價值)。這樣一來,網際網路上客戶互動的日誌、社交媒體上的使用者評論等資料仍然佔據大資料的主流。還有一部分人在談大資料時,實際上指的是以Hadoop為代表的新技術,尤其是其中的非結構資料技術。這是長期以來關於大資料最流行的兩種說法。前一種從資料本身的特徵出發,後一種從資料處理技術出發。

現在大資料話題更多集中在應用上。最近一段時間來,有大資料定義的爭議已經不多了。我們經常會看到大資料行業應用或企業轉型的報導,例如說大資料提升了農產品產量。但仔細分析,這種說法其實是在說這些行業更好地利用了資料來指導業務與運營,與我們此前談的大資料概念與處理不同的另外一個話題。

其實比農業應用更熱的是金融。無論是“網際網路金融”還是“金融科技”核心講的就是資料驅動的“金融”。這裡的主要邏輯似乎是:網際網路業務模式下產生的資料就應該叫大資料,或者暗示網際網路業務就必須採用大資料才行。但網際網路業務到底是因為資料量大,還是因為非結構化,或是因為是新技術才與大資料發生關係?這需要找到兩者間的必然聯絡。

顯然,很多傳統企業受到了網際網路模式的衝擊,企業的決策者需要做出響應來應對變革。面臨的相同問題是:網際網路業務模式與大資料到底什麼關係呢?以及隨之而來的人工智慧和區塊鏈應用。在這樣的形勢下,迫切需要對大資料的概念做出更加準確、更加明晰的定義。

要回答這個問題,必須拋開Hadoop技術和資料形態,從分析現代資訊社會的核心本質特徵出發來尋找答案。現代資訊社會本質是更廣泛、深入的資料化(某種程度上是萬物資料化,從IT到DT的演變),以及全社會範圍內資料的互聯互通。這樣看來,現代資訊社會確實進入了“大資料時代”。

仔細分析後,我們發現,“大資料時代”區別於之前的“小資料時代”的核心本質特徵主要有兩個:一是資料化的範圍越來越廣泛深入。這裡所說的“資料化”並不等同於十年前我們所說的紙質文件“數字化”。如今的“資料化”更多地是指:人們或者企業已經習慣“以資料指導業務”的運營模式,而不像以前那樣是由業務向資料提出需求。這便是通常所說的“資料驅動業務”“資料驅動生活”的相關習慣、策略與模式,它在大資料時代被越來越廣泛地採納。另一方面,如《大資料時代》一書所說,在大資料時代,人們更多地是依賴全量資料分析而不是依賴取樣。這也逐漸成為一種趨勢。

二是資料互聯互通。現代資訊社會的另一個重要特徵,就是資料在全社會範圍內不再孤立。企業現在所面對的不僅僅是其內部資料互聯互通的問題,也需要面對資料在全社會範圍內的互聯互通問題。從目前對區塊鏈技術的理解看,區塊鏈可能是解決資料流通和變現的關鍵技術,至少是一種思維。

人群畫像便是資料驅動的一個例子:當某企業的網上客服第一次與某個準客戶進行交流時,企業的內部資料中並沒有關於該客戶的任何資料,客服人員本來是沒有辦法對該客戶提供個性化的、精準的服務的。但從全社會範圍來講,這個客戶雖然是第一次訪問該企業的網站,但卻用同樣的電腦訪問過很多其他網站。在社會範圍內會有一些組織蒐集與分析這些互聯互通的“大資料”,刻畫出該客戶的特徵。於是,網上客服只需利用資料互聯互通的特性,從外部直接申請獲取現成的、關於該客戶的相關資訊,就可以對其做出準確的反應。

因此,在現階段,我們將大資料定義為“更加廣泛、更加深入的數字化,以及全社會範圍內資料的互聯互通。”對企業而言,大資料問題的本質不是技術創新,也不是資料形態的多樣化,而是企業實現“資料驅動業務”的相關戰略與戰術。這一結論應該可以比較全面地概括了當今關於大資料的所有說法。

現在,我們再來回答網際網路業務模式與大資料之間關係的問題。既然互聯互通是大資料最重要的特徵,而網際網路正是實現資料互聯互通最根本的途徑與方式。那麼,網際網路金融等新的業務模式,與大資料本身就有了不可分割的關係,可以認為是同一事物的兩個方面。現在看來,它們不過是對現代資訊社會的核心本質特徵透過不同視角的描述而已。企業可以將自己應對網際網路業務的戰略稱作網際網路戰略,也可以稱作是大資料戰略。

相關文章