大資料計劃驅動因素是種類而不是數量
對各大行業調查報告顯示結果表明,當被問及關於大資料成功的驅動因素時,69%的企業高管稱資料品種是最重要的因素,其次是數量(25%),速度(6%)落後。在企業界,整合更多資源可以找到巨大的資料,而不是更大的數額。可見處理和管理大資料量並不是決定大資料投資驅動的關鍵因素。相反,它是整合更多資料來源的能力,例如新資料、舊資料、大資料、小資料、結構化資料、非結構化資料、社交媒體資料、行為資料和遺留資料等多樣化資料型別。
大資料的實踐是整合多樣化資料來源
對於大型企業來說,當許多高管想到大資料時,通常會想到大量的資料,這導致了一個普遍存在的觀點,在資料和分析方面,資料量越大越好,而往往忽略了資料結構的多樣化。這就促成了大資料的神話,大資料等同於大量的資料。一個企業大資料應該是是彙集了各種資料所有的資訊來源:
· 客戶群體資訊來源
· 客戶地域資訊來源
· 客戶年齡資訊來源
· 競爭對手資訊來源
· 客戶性別資訊來源
我們以電商購物平臺為例,客戶線上購買一件商品,我們可以追蹤到客戶的線上的任何資料。並且可以生成大量的結構化和非結構化資料。 例如人口統計:年齡,性別,地理區域,收入。心理資料:偏好,價值觀,推動購買的動機等多種型別的資料來源。
對這些多樣化的資料來源進行分析和彙總我們可以得出一些結論,對於使用者來說我們可以完善使用者的購物體驗,吸引更多潛在客戶。對於企業來說可以分析市場競爭情況,優化產品類別,瞭解競爭對手動態,提升企業在市場上的競爭力。
多樣化的資料幫助各行業實現精準資料分析
我們用探碼科技智慧選址平臺為例,如果是創業開店,要實現精準選址分析模型,那麼資料所覆蓋的範圍主要包括住宅資料、商圈資料、客流資料以及商業體資料等多樣化的資料體系,這樣才能夠實現智慧選址,快速準確的分析出什麼型別的店開店在什麼地方可以挖掘最大的使用者群體。
智慧選址應用於各大行業所體系的資料結果也不同:
· 資訊釋出類:房產中介、廣告服務商、業主,創業服務類公司
· 戶外廣告:廣告牌出租、購買分析
· 實體開店:餐飲、服裝、美容、建材、酒店等
· 超市便利:店鋪選址、銷售、競品分析、經營分析
· 教育:創業指導、學生網路行為分析
· 商業地產:商鋪招租、招商指引、主題規劃、廣告投放
多樣化的資料來源增強各行業人工智慧化的大資料行為分析能力
從企業的角度出發,企業通過多樣化的資料來源將資料管理工作集中在開發更強大的資料和分析上。
捕獲舊資料來源
以電商平臺為例,利用大資料技術捕獲企業傳統的遺留資料來源,包含客戶資訊、客戶購買產品、客戶地域分佈、年齡段等等資料,採集分析挖掘現有資料來源,然後再在轉向新的資料來源,並把傳統的資料來源和現有資料來源相結合最終融合成為企業新的資料來源,增強電商購物在行業當中的競爭力,贏取更高的市場份額。
整合非結構化資料
從企業角度出發我們把結構化資料被假定為時間序列的形式,該時間序列對特定時期內的企業績效的某些方面進行編碼,如每月或每週的銷售資料或股票價格等。非結構化資料可以從訊息源,消費者的內部儲存庫反饋,部落格和討論論壇,也可以從微博,微信等社交媒體獲得。
越來越多的公司(29%)現在專注於整合這些非結構化資料,用於從客戶情緒分析到監管檔案分析到保險索賠裁決。整合非結構化資料的能力正在擴大傳統分析,將定量指標與定性內容相結合。其目的是生成新的資料形式,可用於未來推導預測模型或執行因果分析,或幫助企業進行風險評估。
新增社交媒體和行為資料來源
雖然大資料早期的大部分興趣來自於eBay和Facebook等公司捕捉社交媒體和行為活動,但這些應用程式在“財富”1,000強中相對較早,僅有14%的人將此列為優先事項。隨著公司在大資料方面的努力取得進展,他們很可能會將注意力轉向關注社交資料在諸如患者堅持和基於消費者購買行為和偏好的移動裝置建議等領域提供的未開發機會。及時的建議可以立即產生結果。
要符合納入社交媒體分析類別的資格,產品必須有多樣化的資料來源組合:
· 建立可用資料指標衡量的業務目標
· 提供跟蹤和共享資料
· 評估受眾規模,參與度和受眾特徵
· 提供情緒分析
· 綜合社交媒體統計
· 比較來自單個廣告系列,帖子或網頁的資料
無論是從電商平臺線上購物體驗、還是到智慧選址、再到企業資料的抓取、及社交媒體行業行為分析等,從這當不難看出企業執行大資料策略並不是通過數量,而是多樣化的資料來源的一個集合體。
正如探碼科技自主研發的DYSON智慧分析系統,是在歷經8年的技術沉澱,遵循大資料的技術生命週期,把機器學習系統充分融入到大資料體系中去,實現使用者多樣化的資料資訊抓取及分析,讓大小資料視覺化,並且可以實時匯出資料分析報告,讓企業的資料與業務可實時追蹤。
如何用智慧分析系統抓取我們需要的資料可以參考:
相關文章
- 大資料的興起:自媒體時代成就了網紅,而不是大資料大資料
- 雲端計算發展的驅動因素
- parseInt 是用於字串,而不是用於數字字串
- 用“資料驅動”幹掉遊戲策劃?遊戲
- 按功能劃分Package,而不是按層Package
- 10種資料驅動策略提高CRO
- 資料跟蹤應該是選擇加入而不是選擇退出
- 決定一個SQL執行效率的是執行計劃, 而不是SQL的寫法SQL
- 江蘇印發《大資料發展行動計劃》大資料
- jdbc的資料庫驅動類DriverManager.getConnection()引數JDBC資料庫
- “資料要素×” 行動計劃要做的幾件小事,可都不是小事
- 資料驅動的介面設計
- AI的警告:人類擔心的應該是自己,而不是機器AI
- 資料湖與資料倉儲的根本區別,在於前者是“市場經濟”,而後者是“計劃經濟”
- 如何利用大資料驅動業務增長?大資料
- 【譯】需要學習的是程式設計,而不是程式語言程式設計
- 無伺服器是一種學說,而不是技術 - PaulDJohnston伺服器
- 影響資料驅動業務目標的大資料挑戰大資料
- 資料驅動決策的13種思維方式
- 幾種連線資料庫的OLEDB驅動程式資料庫
- 遊戲防沉迷,防的是沉迷,而不是遊戲遊戲
- 為什麼是“程式猿”而不是“程式媛”?
- John Bantleman:客戶驅動大資料發展大資料
- 每日安全資訊:資料跟蹤應該是選擇加入而不是選擇退出
- Hortonworks:驅動大資料市場的七大關鍵動力大資料
- 用好工業大資料的基礎是資料質量大資料
- 鴻蒙資料驅動鴻蒙
- 實現挖掘大資料價值的三大因素大資料
- 大資料如何採集資料?大資料的資料從何而來?大資料
- 使用屬性而不是可訪問的資料成員
- 360驅動大師是幹嘛的 360驅動大師可以解除安裝嗎
- 統計:從計數到大資料大資料
- 資料驅動: 建立資料文化
- 為什麼要建資料倉儲,而不是直連資料來源?
- 大資料類大資料
- 互動派:大資料必將驅動企業變革大資料
- MyBatis排序時使用orderby動態引數時需要注意,用$而不是#MyBatis排序
- 馬斯克: 教育是解決問題, 而不是教工具馬斯克