BI怎樣才能搞定大資料

ecioforum發表於2012-02-08

 現在的企業每天都在產生並獲取大量的各種資料。加上目前可以在多媒體、智慧手機和社交網站獲取的資訊,我們正面臨著比以往任何時候都更多的資料。

傳統資料倉儲的效能已無法應付龐大的資訊,但是大資料(Big Data)技術使我們能夠訪問和使用這些寶貴的、大規模資料集以應對越來越複雜的資料分析和更好的商業決策制定。

大資料明確將被持續下去。Gartner公司的分析師聲稱資訊量每年正以最少59%速度在遞增。IDC最新的Digital Universe研究估計到2020年世界上的資料儲存總額將達到35 ZB。

大資料將改變商業智慧的佈局,併為企業提供一種有價值的資料來源。CIO遵行以下的步驟才能成功地將大資料融合在他們的商業智慧程式中。

找到合適的專案: 可以說最重要的一步是確定在合適的專案上測試大資料。需要解決的必需是一種商業問題,而不是一種技術問題。確保專案能提供直接利益或好處,而這些在現有的基礎設施上是無法實現的。那樣你就能贏得主管的支援。

獲得主管的支援:Big Data是對你在資料倉儲技術中現有投資的補充。主管的支援將基於對以證據為基礎的策略價值的接受。

找到合適的人: 你會需要有非常特殊技能的人;那些能處理大型、分散式資料集和與之相關的硬體的人。然後是一些讓所有的資料有意義並能把它們放入商業內容的人;要把資料科學家想成是和現有的資料分析師和資料探勘師不一樣的人。

接受開源: 大資料意味著對工具集不一樣的思考並很快能適應開源。傳統的供應商不一定能解決這方面的問題;大多數大資料工具都是開源的。在這個市場上的創新團體是由來自谷歌、雅虎、蘋果和Facebook這樣的公司中最聰明的人組成。

不要從零開始: 最廣為接受的大資料工具是Hadoop,它是一種可以從Cloudera 或EMC獲得的開源技術。Hadoop旨在緩解在資料上執行規模化批處理的複雜性,並在Apache的專案框架內進行管理;它能提供你需要的基本工具。主要的BI供應商都宣佈對大資料技術的支援,或在解決方案中使用大資料技術。

對架構和硬體的改變作好準備: 資料海洋中的大資料要做的事不僅要對大規模的資訊執行分析而且也成為資料倉儲的一種來源。你會更少需要對少數大型機器的依賴和更多依靠大量的通用硬體和雲資源。

購買裝置從少量標準部件起:IaaS供應商們和雲資源為所需的企業提供大量的最新,及時的基礎設施。安全的憂患往往是個阻力,但是可以克服的。

找到一種未使用的資料來源: 比如說,看一看從你公司網站上收集的資料。它可以給你提供網頁的受歡迎程度、一天中對網站訪問的集中的時間和你的客戶使用的是哪一個網路服務提供商這樣一些資訊。挖掘用於市場和銷售的這些資訊的潛能。

考慮視覺化:想一想呈現資料的新方式。由於資料容量的原因,表格或圖形的使用對一些大資料分析根本沒有意義。

管理期望值:大資料有益於大型分析以及長期的戰略方向。確保你的使用者知道它不會交付在結構化資料之上的月度管理報表或即時查詢。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/25389417/viewspace-715860/,如需轉載,請註明出處,否則將追究法律責任。

相關文章