大資料的概念需要追本溯源。25年前,麻省理工學院教授尼葛洛龐帝的經典著作《數字化生存》首次出版,一時引起熱議。這位“數字化預言家”在書中對當時的未來生活給出了許多線索,其中最重要的觀點之一便是:“在各個領域,數字化位元都將代替原子”。25年後,《數字化生存》中的推測大多數變為了生活中最常見的場景。而從原子到位元,也成了對今天社會發展影響最廣的一大轉變。
二進位制為什麼重要
位元(bit)是資訊的載體,是資料傳輸的最小單位,而從原子到位元的轉變就是價值的轉換。這也說明了大資料技術中的資料,要在各個傳輸通道和產業鏈條上流動起來才會產生價值。
從大資料的概念提出至今,這一備受關注的IT技術已經細分出政務大資料、醫療大資料、教育大資料等多個領域,以及大資料分析、大資料視覺化、BI商業智慧分析、大資料檢索、產品大資料分析、大資料預測/諮詢、大資料服務支撐平臺、機器學習技術等多種商業應用。
在新冠肺炎防控期間,鐵路公司、運營商以及眾多企業和數不清的平凡的人們沿著資料的足跡,一步一步將病毒阻擊在外。國家鐵路集團運用實名制售票的大資料資源,梳理了重點時段、重點區域的乘客資訊,為醫學排查和疫情防控提供資料支援。各地運營商開始利用網路大資料,協助相關部門進行關於新冠肺炎的輿論監控,再通過移動使用者資料分析從武漢進入各地的人口數量。
不可忽視的是大資料行業內各家企業發揮的力量,數夢工場推出了系列數智抗疫解決方案,應用於疫情聯防聯控、精準施策及復產復工復學等場景;TalkingData藉助“資料+模型+視覺化+報告”的整體解決方案,實現了對北京市的各區人口及區域間、省際間人口流動的動態監測,以及重點區域的疫情監測。類似的企業和例子不勝列舉,我們也從這場與無形的病毒的對抗中,看到了大資料對生活的改變和未來的潛力。
資料是這個時代的新油田
大資料貢獻的重要性或許不止於此。2019年10月,十九屆四中全會上將資料資源提升到了可以作為生產要素,與土地、勞動力、技術等要素並列的重要位置。在新基建時代、在數字經濟整體結構中,資料資源是大資料、AI、區塊鏈等新一代資訊科技的基礎磚石,也揭示了大資料技術將佔據的地位。
在商業社會中,資料應該作為生產資源服務於企業成長髮展。而在這個過程中,最重要的不是結合了多少技術,而是將勞動者從資料收集、整理的低層次重複性勞動中解脫出來,轉向戰略和管理等更高層面的創新。
大資料分析提供的價值已經向連鎖零售、網路營銷、O2O、物流、泛網際網路、快消品等行業逐步滲透。大資料BI(商業智慧)服務商們提供的是越來越細緻全面的商業分析,幫助使用者從多個維度儘量全面地瞭解業務,進而達到更好的決策。
海致網路是一家提供視覺化大資料分析服務的公司,在海致網路的解決方案中,從資料整合、處理到視覺化分析,不論是使用者產生的本地資料還是來自網站統計、廣告推廣等第三方平臺的資料,都將作為基礎資源連線到資料視覺化分析工具。資料視覺化分析對於使用者來說,降低了對專業技能的要求,員工不必理解技術也可以藉助工具完成資料處理工作。業務產生資料,資料又反作用於業務,這是最自然流暢的過程。
除了以資料反哺自身發展,大資料也為AI技術的成熟提供了支撐。Testin雲測所做的工作是利用資料助力產業智慧化,為企業及開發者提供雲測試、AI資料標註等服務。Testin雲測根據模型訓練要求,進行資料採集、清洗及標註、測試,加速模型訓練及AI應用實施,幫助AI企業獲取規範、豐富、持續性的原始資料池,AI技術也在消化資料的過程趨於成熟和完善。
結語
衡量一家企業的成就有多個方面,就像可以從多個角度去理解一組資料。如果只是單純地追求漂亮的表格而忽略資料背後的實相,那麼這些資料肯定是價值有限的。同樣的,關注一家企業、一個行業也應該像挖掘資料的價值一樣透過現象看本質。這永遠是一項重要的能力,決定著未來的走向。