走進資料的歷史

xulinlucas發表於2022-12-08

作者:陳啟煥,某網際網路資料分析師

01 資料、資訊、知識

資料是當今的熱詞。多人的理解中,資料就是數字,其實不然,資料的範疇要大得多,包括數字、語言、文字、影像、影片,甚至是人類活動的行為都可以被認為是資料。資料本身是客觀存在的,但是他的範疇是隨著社會發展不斷演進的。例如在計算機出現以前,文字和語言並不被認為是資料,而現在文字和語言,已是翻譯,電子通訊等重要領域的核心資料。

走進資料的歷史

此外,我們還常把資料、資訊、知識混淆。簡單來說,資料承載資訊,知識是系統的資訊。資料本是人造物,甚至可以被偽造,沒有資訊的資料大多沒什麼意義。資料常常存在噪音,我們需要專業的知識和資料處理能力,才能挖掘出資料中包含的資訊。

例如,我們透過測量金字塔墓室的長寬高,得到金字塔墓室的外在資料,但是透過分析,金字塔墓室的長寬高符合勾股定理,這便是我們從資料得到的資訊。

走進資料的歷史

知識比資訊更加抽象,更加系統。資訊可能只在某種場景是正確的,但是如果要上升到作為真理的知識層面,則需要系統的資訊。例如,透過測量星球的位置和時間,我們得到資料,透過資料發現,星球的執行軌跡,這就是資訊,透過資訊,建立模型,總結出開普勒第三定律,這就是知識。

02 資料的歷史

講完資料,我們講講大資料。大資料是近幾年火起來的熱詞,資料一直存在,但是為什麼最近才出現大資料熱潮呢?帶著問題。首先,我們講講資料的歷史。早期的資料從觀察總結而來。人類為了生存,崔生出農耕文明,但是古代人耕種過程中常常受沿岸洪水困擾,於是古代人觀察天象,記錄資料,判斷洪水的時間,觀察天象資料的過程中又崔生出了天文學。人們觀察天文資料--分析資料(1年365天、每隔28-29天月亮變化一個週期等等)--建立模型(地心說、日心說)--預測未來(預測下一次洪水的到來)。所以說,資料從很早開始就給人帶來價值,是人類文明的基石。

走進資料的歷史

後來,隨著自然科學和基礎科學的快速發展,資料扮演了更加重要的地位。各種正規化理論的提出,各種數學、物理學、統計學、天文學領域的真理提出,幫助人類瞭解所處的世界。資料為各種模型的提出和驗證必不可少的條件。這個時代崔生出一大批想牛頓、愛因斯坦偉大的科學家,也鑄就了一個偉大的時代,工業革命標準化生產的時代,大大解放了人類生產力,促進社會發展。

走進資料的歷史

 計算機的誕生,將世界帶入了資訊時代。人類產生、獲取和處理資料的能力得到大大提升。計算機打破了人類固有的物理距離,網路將世界相連,改變了人們的生活方式,進一步提高了人類生產力。至此,我們會發現,資料在人類文明程式中扮演重要角色,是人類文明的基石。但是為何近幾年大資料熱才被掀起? 

03大資料熱潮的掀起

進入現代,資料的產生更加迅猛,尤其是進入移動網際網路時代,每個人,每部手機都是資料來源。資料每年以40%的增量增長。另外,資料的時效性,完備性更強,那麼我們說這是大資料熱潮掀起的第一個原因。大資料,資料體量大,及時性強,完備性強。

走進資料的歷史 

接著,硬體等基礎設施的強大。大量的資料產生了,但是我們該如何儲存、該如何計算、該如何儲存,都是一個很大的問題。幸運的是,隨著硬體的不斷提升,我們有能力去處理大量資料的儲存、計算、傳輸問題。這便是第二個原因。硬體配套能夠支援大資料。

再者,基礎理論的進步。隨著資料量的不斷上升,機器學習、人工智慧、深度學習等領域的理論不斷演進。這為從大量資料中提取有效資訊,發掘價值提供了必要的理論依據。這便是第三個原因,我們對資料的利用處理能力更強了。

走進資料的歷史

最後,透過大資料,智慧硬體,智慧演算法,智慧傳輸,大資料出現了大量的落地場景,尤其是給人類帶來了商業化的變革,大資料創造來了巨大的價值。所以說,這是第四點大資料引領了新的變革。綜上,大資料在正確的時間,掀起了人類新一輪熱潮。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31555699/viewspace-2655902/,如需轉載,請註明出處,否則將追究法律責任。

相關文章