資料之美不在大,在乎實效之間也
《大資料時代》作者維克托·邁爾·舍恩伯格用四個v的特徵描述,給大資料做了一個定義:一是資料體量夠大(volume); 二是資料型別夠多(variety);三是資料價值密度低(value);四是具有實效性(velocity)。那麼對很多傳統企業來說,所擁有的“不夠大”,“不夠多”的資料,是不是就沒有參考價值了?
近日看到一個解放戰爭中“小資料”助力打勝戰的故事。遼瀋戰役打響後,林彪要求每天深夜都要進行軍情彙報,由值班參謀讀出各個縱隊、師、團用電臺報上來的當日戰況和繳獲情況,包括每支部隊殲敵多少、俘虜多少;繳獲的火炮、車輛多少;槍支、物資多少……某一天,林彪就胡家窩棚戰鬥的繳獲,問出了三個問題:“為什麼那裡繳獲的短槍與長槍的比例比其他戰鬥略高?”“為什麼那裡繳獲和擊毀的小車與大車的比例比其他戰鬥略高?”“為什麼在那裡俘虜和擊斃的軍官與士兵的比例比其他戰鬥略高?”由此林彪司令員得出了敵人的指揮所就在這裡的結論。
這堆資料之小、之雜亂無序,可集中挖掘後,也分析出研究物件的內在規律,也能起到大作用。
如何用好大資料?
首先資料意識很重要。不用糾結於是不是大資料,先把資料建立起來。據說林彪“從紅軍帶兵時起,身上有個小本子,上面記載著每次戰鬥的繳獲、殲敵數量”。我們已經進入了一個一切都可以被資料化的年代,微博是資料化了的思想和觀點, 簽到網站是資料化的位置;地圖是資料化的地理場景。而無處不在的感測器,更是讓量化一切變成了可能。當這個世界被植入了感知、計算、通訊,任何人/物都會成為一個資料來源。一切狀態和行為都能量化,能夠在資料空間中被操作。
其次從商業社會的角度理解資料。大資料在各行各業衍生出各據應用。谷歌、亞馬遜等公司是發展大資料技術的主要推動者。據《華爾街日報》報導,亞馬遜於2013年12月獲得“預期遞送(anticipatory shipping)”新專利。在我們點選“下單”之前,亞馬遜能把預遞送的商品存放在快遞公司的寄送中心或卡車上。大資料發展到今天,技術已不是問題。我們不僅是在資料上下功夫,更關鍵的是要與現實生活相結合。種種資料,只有及時高效地挖掘利用,能夠形成預測,能夠助於商務決策,才是關鍵。
最後要懂得借力而為。對於大多數企業來說,企業自己建設IT系統,自己從頭開始積累資料,費心費力費錢,且收效甚微。有三種解決方案,一種聯合行業或價值鏈上下游共同開發,促進企共同發展;另一種是做外包,把IT建設外包給合適的服務商;而最好的方式是藉助一個好的平臺,節省自己開發大資料的成本,企業將所有精力投入到客戶開發上就好。在這方面,運營商無疑有著天然的優勢,擁有大量使用者相關資料,而且準確度高;而在通訊管道基礎上搭建“雲+大資料”的基礎設施,能讓平臺上的各使用者群體開啟“開關”即可使用。
資料不在大小,能夠助於運營發展就有價值。推動大資料研究的動力還是來自企業的經濟效益。資料之美不在大小,而在於是否真的能為企業帶來好處。
相關文章
- 真愛 不在乎誰是“程式猿”
- 《瞬間之美》筆記筆記
- 我為什麼不在乎人工智慧人工智慧
- 大資料Storm 之RCE實踐大資料ORM
- 前端資料之美 -- 基礎篇前端
- 領略大資料之美——資訊圖大資料
- 大資料教程分享實用的大資料之陣列大資料陣列
- 綻放資料視覺化之美視覺化
- 大資料之偽大資料
- 資料結構與演算法之美-王爭-極客時間資料結構演算法
- JavaScript 資料結構與演算法之美 - 時間和空間複雜度JavaScript資料結構演算法複雜度
- 《瞬間之美》讀書筆記筆記
- 大資料匯入之MySql設計之空間換時間的設計變更大資料MySql
- 你做過不在乎結果的專案嗎?
- [譯]大資料之“資料黑市”大資料
- 大資料實戰之環境搭建(八)大資料
- bundle實現Activity之間的資料傳遞
- 資料結構與演算法之美資料結構演算法
- 陣列(Array)- 極客時間(資料結構與演算法之美)陣列資料結構演算法
- 程式碼之美---遞迴之美遞迴
- 大資料之概率論大資料
- 大資料之Flume(二)大資料
- 大資料技術與Hadoop之間的關係大資料Hadoop
- 大資料與Hadoop之間是什麼關係?大資料Hadoop
- 時間序列資料庫武鬥大會之 KairosDB 篇資料庫AIROS
- 大資料:大資料之基礎語法大資料
- fragment之間相互傳資料、共享資料Fragment
- 資料結構之資料、資料元素、資料項、資料物件之間的關係資料結構物件
- 雲端計算、大資料和物聯網之間,之間有什麼關係與區別?大資料
- 新書預告《資料視覺化之美》新書視覺化
- 大資料分析與機器學習之間的區別與聯絡大資料機器學習
- 大資料解決方案(一)之表空間--bigfile tablespace大資料
- 頁面之間傳遞資料
- Oracle兩表之間資料更新Oracle
- 不同Oracle資料庫之間的資料同步Oracle資料庫
- 異構資料庫之間資料作業資料庫
- 大資料測試之ETL大資料
- 大資料架構之:Spark大資料架構Spark