走進資料的歷史
作者:陳啟煥,某網際網路資料分析師
01 資料、資訊、知識
資料是當今的熱詞。很多人的理解中,資料就是數字,其實不然,資料的範疇要大得多,包括數字、語言、文字、影像、影片,甚至是人類活動的行為都可以被認為是資料。資料本身是客觀存在的,但是他的範疇是隨著社會發展不斷演進的。例如在計算機出現以前,文字和語言並不被認為是資料,而現在文字和語言,已是翻譯,電子通訊等重要領域的核心資料。
此外,我們還常把資料、資訊、知識混淆。簡單來說,資料承載資訊,知識是系統的資訊。資料本是人造物,甚至可以被偽造,沒有資訊的資料大多沒什麼意義。資料常常存在噪音,我們需要專業的知識和資料處理能力,才能挖掘出資料中包含的資訊。
例如,我們透過測量金字塔墓室的長寬高,得到金字塔墓室的外在資料,但是透過分析,金字塔墓室的長寬高符合勾股定理,這便是我們從資料得到的資訊。
知識比資訊更加抽象,更加系統。資訊可能只在某種場景是正確的,但是如果要上升到作為真理的知識層面,則需要系統的資訊。例如,透過測量星球的位置和時間,我們得到資料,透過資料發現,星球的執行軌跡,這就是資訊,透過資訊,建立模型,總結出開普勒第三定律,這就是知識。
02 資料的歷史
講完資料,我們講講大資料。大資料是近幾年火起來的熱詞,資料一直存在,但是為什麼最近才出現大資料熱潮呢?帶著問題。首先,我們講講資料的歷史。早期的資料從觀察總結而來。人類為了生存,崔生出農耕文明,但是古代人耕種過程中常常受沿岸洪水困擾,於是古代人觀察天象,記錄資料,判斷洪水的時間,觀察天象資料的過程中又崔生出了天文學。人們觀察天文資料--分析資料(1年365天、每隔28-29天月亮變化一個週期等等)--建立模型(地心說、日心說)--預測未來(預測下一次洪水的到來)。所以說,資料從很早開始就給人帶來價值,是人類文明的基石。
後來,隨著自然科學和基礎科學的快速發展,資料扮演了更加重要的地位。各種正規化理論的提出,各種數學、物理學、統計學、天文學領域的真理提出,幫助人類瞭解所處的世界。資料為各種模型的提出和驗證必不可少的條件。這個時代崔生出一大批想牛頓、愛因斯坦偉大的科學家,也鑄就了一個偉大的時代,工業革命標準化生產的時代,大大解放了人類生產力,促進社會發展。
計算機的誕生,將世界帶入了資訊時代。人類產生、獲取和處理資料的能力得到大大提升。計算機打破了人類固有的物理距離,網路將世界相連,改變了人們的生活方式,進一步提高了人類生產力。至此,我們會發現,資料在人類文明程式中扮演重要角色,是人類文明的基石。但是為何近幾年大資料熱才被掀起?
03大資料熱潮的掀起
進入現代,資料的產生更加迅猛,尤其是進入移動網際網路時代,每個人,每部手機都是資料來源。資料每年以40%的增量增長。另外,資料的時效性,完備性更強,那麼我們說這是大資料熱潮掀起的第一個原因。大資料,資料體量大,及時性強,完備性強。
接著,硬體等基礎設施的強大。大量的資料產生了,但是我們該如何儲存、該如何計算、該如何儲存,都是一個很大的問題。幸運的是,隨著硬體的不斷提升,我們有能力去處理大量資料的儲存、計算、傳輸問題。這便是第二個原因。硬體配套能夠支援大資料。
再者,基礎理論的進步。隨著資料量的不斷上升,機器學習、人工智慧、深度學習等領域的理論不斷演進。這為從大量資料中提取有效資訊,發掘價值提供了必要的理論依據。這便是第三個原因,我們對資料的利用處理能力更強了。
最後,透過大資料,智慧硬體,智慧演算法,智慧傳輸,大資料出現了大量的落地場景,尤其是給人類帶來了商業化的變革,大資料創造來了巨大的價值。所以說,這是第四點大資料引領了新的變革。綜上,大資料在正確的時間,掀起了人類新一輪熱潮。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31555699/viewspace-2655902/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 歷史股票資料的爬取
- Angular Universal 的演進歷史Angular
- 走進大資料,感受大資料大資料
- zabbix清除歷史監控資料
- DataPipeline:讓資料生產力的歷史程式,再前進一步API
- python實現股票歷史資料析Python
- 資料科學的歷史,從洞穴壁畫到大資料資料科學大資料
- 資料庫學習筆記1(資料管理歷史)資料庫筆記
- 幾類歷史資料沉澱的方案過渡
- 過去十幾年的歷史資料顯示,A股春節前後的走勢反轉概率較高
- 第1章 下載A股歷史資料
- LangChain 進階歷史對話管理LangChain
- 資料中心的發展歷史
- 資料視覺化的概念/作用/型別/工具/歷史視覺化型別
- SqlServer查詢資料改動歷史記錄SQLServer
- 【HIVE】hive 使用shell指令碼跑歷史資料Hive指令碼
- MySQL使用pt-archiver歸檔歷史資料MySqlHive
- HTTP的歷史HTTP
- 一文讀懂資料平臺的發展歷史
- OceanBase 首席架構師:關聯式資料庫到三代分散式資料庫,我親歷的資料庫演進史架構資料庫分散式
- 零售資料分析之操作篇9:用歷史聚合計算歷史銷售SKU數
- 我經歷過的監控系統演進史
- 如何高效率刪除大表歷史資料
- C/C++ Qt 資料庫與Chart實現歷史資料展示C++QT資料庫
- 騰訊的歷史
- 微信的歷史
- 天空衛士資料安全智慧化走進香港
- 軟體自動化測試工具的歷史演進
- iOS歷史(iOS系統發展歷史)iOS
- Percona-Toolkit 之 pt-archiver 刪除歷史資料Hive
- Fabric 1.0原始碼分析(21)Ledger #historydb(歷史資料庫)原始碼資料庫
- 光榮策略遊戲的歷史及未來——歷史篇遊戲
- 歷史背景
- tcpdump歷史TCP
- 容器歷史
- OAuth歷史OAuth
- 縱橫20年,我所經歷的資料開放演化史
- 清除 GitHub 歷史記錄的隱私資訊Github