市場研究公司IDC預測,2015年大資料市場規模將從2010年的32億美元增長到170億美元,複合年增長率為40%。大資料是一個龐大的新的領域,其中的資料集可以增長的非常龐大,以至於使用傳統的資料庫管理工具也很難處理。處理這種問題所需要的新工具、框架、硬體、軟體和服務是一個巨大的市場機會。隨著企業使用者越來越多地需要連續不斷地訪問資料,好的大資料工具集將以最低的成本和接近實時的速度提供可伸縮的、高效能的分析。通過分析這種資料,企業可得到更大的智慧以及競爭優勢。下面是Hadoop和大資料專業廠商MapR共同創始人和執行長約翰·施羅德(John Schroeder)對2014大資料市場的預測。
1. SQL擁有大資料的最大潛力
用於 Hadoop(分散式計算)的SQL的發展能夠讓商業分析師利用自己的技能和選擇的SQL工具執行大資料專案。開發人員可以選擇Hive、Drill和 Impala等Apache專案,以及選擇Hadapt、HAWQ和Splice Machine等公司的專有技術。
2. 儘管如此 SQL還面臨挑戰
SQL需要資料結構。而集中的結構化資料可引起延遲並且需要人工管理。SQL還限制分析型別。過分強調SQL將延遲機構全面利用其資料價值的努力和延遲反應。
3. 身份識別是主要的資料安全問題
隨著Hadoop(分散式計算)中提供的接入控制能力的猛烈攻擊,機構迅速認識到線路級身份識別是必要的基礎。沒有充分的身份識別,任何更高階的控制都很容易被繞過,妨礙預定的安全計劃。
4. 資料錯誤變成學習機會
2014年機構將出現許多資料錯誤。資料錯誤將表明基礎的來源系統的問題嗎?資料錯誤是在下游分析中出現偏差導致的資料提取問題嗎?資料錯誤將表明定義差異或者缺少跨部門和業務部門的一致性嗎?2014年將看到解決資料異常問題。
5. 出現可執行的Hadoop
2014年將看到Hadoop在各個行業中的生產部署顯著增加。這將顯示出Hadoop在運營中的實力。在那裡,生產應用與分析結合在一起能夠提供可以衡量的商業優勢,如在客戶化零售建議、詐騙檢測和試驗感測器資料進行規範的維護等應用中提供這些優勢。
6. 更多的資料倉儲將部署企業資料中心
資料中心把資料提取處理和資料從企業資料倉儲解除安裝到Hadoop。作為一個核心的中心企業中心,資料中心要便宜10倍,能夠對額外的處理或者新的應用進行更多的分析。
7. 新的以資料為中心的應用將成為強制性的
利用大資料的能力將在2014年成為競爭的武器。更多的公司將使用大資料和Hadoop準確地針對個人消費者的偏愛追逐賺錢的追加銷售和交叉銷售的機會,更好地緩解風險以及減少生產和開銷成本。
8. 資料成為資料中心的核心
機構將從開發者過渡到大資料計劃中。IT部門將越來越多地擔負定義支援多種應用的資料基礎設施的任務,把重點集中在部署、處理和保護一個機構的核心資產所需要的基礎設施方面。
9. 搜尋將成為非結構化的查詢語言
2013年有大量的用於Hadoop的SQL計劃。2014年將是這種非結構化查詢語言成為重點的一年。把搜尋整合到Hadoop將為查詢重要資訊的企業使用者提供一種簡單和直觀的方法。搜尋引擎還是包括推薦引擎在內的許多發現和分析應用的核心。
10. Hadoop將獲得地位
Hadoop將繼續取代其它IT開支,顛覆企業資料倉儲和企業儲存。例如,甲骨文的主要營收目標在過去的10個季度裡有5個季度沒有實現。Teradata在過去的5個季度有4個季度沒有實現營收和利潤目標。
11. Hadoop仍需要幫助才能成為主流應用
更多的機構認識到Apache Hadoop本身還沒有準備好在企業應用。Apache Hadoop不是為系統管理或者災難恢復等統一企業IT流程設計的。企業將繼續推進混合的解決方案,把架構技術創新與Apache Hadoop的開源軟體結合在一起。