大資料創造業務價值

  有效利用大資料,不僅可以實時監控各種潛在風險,提高生產效率,更重要的是為企業提供諸多洞見,提升投資回報和競爭優勢,而且有助於企業從多維度判斷全球市場潛在商機,實現跳躍式快速發展。大資料通過IT創造價值主要分為三個階段,第一個階段是批量分析,資料主要來自企業內部結構化資料;第二個階段是實時分析,資料分析型別逐步從結構化演進到包括非結構化和半結構化資料;第三個階段則是全方位事實分析,不僅有來自企業內部的資料,同時會納入來自第三方的競爭資料,以非結構化資料為主。

  中國市場大資料分析現狀

  對於大資料分析在中國市場發展的現狀,中橋分析師表示,中國市場90%以上的使用者處於大資料分析第一階段,而且使用者大資料分析主要圍繞企業內部的結構化資料,如資料庫或事務性資料,較少企業將日誌、感應資料、社群資料納入大資料分析。不過這一趨勢將會發生變化,因為半結構化和非結構化資料在中國大資料分析的佔比在未來24個月將會快速增長。

  大資料分析市場趨勢

  雖然中國使用者尚處於大資料分析的第一階段,但中國企業已經意識到其重要性。那麼在資料分析解決方案部署上,中橋分析師表示,在未來12個月40.9%的企業級使用者考慮部署新的資料分析解決方案;而對於45.0%中小企業來說,未來12-24個月將成為大資料分析新方案的強增長點。

大資料分析IT投資趨勢

圖1.大資料分析IT投資趨勢

  大資料儲存的挑戰

  那麼,在大資料創造價值的過程中,中國使用者又面臨哪些儲存挑戰?分析師表示,受訪企業和機構在進行資料分析時面臨的儲存難題依次為:儲存容量不能滿足需求(50.1%)、資源配置複雜(44.4%)、採購和運營成本高(40.2%)、不能滿足並行處理能力需求(39.3%)、非結構化資料的大資料分析(33.2%)、儲存硬體利用率低下(20.9%)。

大資料儲存挑戰

圖2.大資料儲存挑戰

  這表明在大資料時代,在資料量飛速增長的情況下,企業的儲存容量面臨的壓力最大,而應用的多元化和IT的分層管理,帶來了系統IT資源配置和管理的複雜;要滿足如此海量資料和多種應用的需求,企業的儲存採購和運營成本也居高不下;而多個應用的同時執行,則對系統的並行處理能力提出了更高要求;非結構化資料的大資料分析則進一步反映了企業資料型別的多樣性和複雜性。因此,為了滿足大資料時代的IT需求,企業需要大容量、高效能、保證資料生命週期高價效比的儲存來滿足大資料儲存、資料保護和業務連續性需求。

 戴爾流動資料特色

針對上述大資料時代中國使用者普遍遇到的儲存挑戰,以及使用者對於新型儲存的需求,分析師認為,戴爾流動資料架構可以簡單快捷的實現儲存容量和效能的升級擴充套件;橫向擴充套件可以跨不同節點擴充套件,保證了在容量擴充套件時效能不會衰減,以及容量和效能的獨立升級線性擴充套件;同時跨不同節點實現了無斷代技術升級,避免了叉車式斷代升級帶來的管理難度和對業務連續性的影響,確保了儲存生命週期的高可擴充套件性。此外,戴爾通過一個“智慧”(資料塊級智慧)和三個“自動化”(資料分類自動化、對映自動化、遷移自動化)、流動資料的分層結合、不同RAID級別和儲存層,滿足不同工作負載對高可用、高效能和容量的需求,以最微粒化的維度提高大資料分析過程中的資源利用率。戴爾流動資料架構還結合一系列的儲存容量優化技術(自動精簡、資料壓縮和重複資料刪除),大大加少了資源浪費。其叢集、快閃記憶體技術(SLC和MLC)和固態盤分層技術的結合,有效提高了IOPS,降低了時間延遲,實現了大資料對OLTP和OLAP的高要求,以及儲存容量可擴充套件和資源優化的目的。

應用場景分析

1. SQL應用

英國某衛生行業雲端計算提供商對於客戶各種需求的滿足,加大了對資料儲存容量和效能、大資料分析頻率和速度的要求。該提供商結合Microsoft SQL Server 2012 Enterprise軟體和商業智慧工具,通過混合雲平臺,為各種醫療機構和醫生提供使用者可選擇的商業智慧分析服務。大資料分析過程中,儲存主要面臨的挑戰是擴充套件和儲存利用率以及近實時分析效能。

戴爾流動資料架構的橫向擴充套件特性,以及引入快閃記憶體帶來的高效能和分層技術可以幫助醫療機構在實現儲存資源優化的同時,滿足大資料分析的效能需求。

2. SAP HANA應用

美國某電信供應商面臨的問題是,如何將不同來源的海量資料進行大資料近實時分析,通過多種渠道為2100萬使用者提供所需服務。2012年,該公司部署了SAP HANA,對多種維度的資料進行大資料近實時和實時分析。快速部署SAP HANA,以及SAP HANA分析平臺對儲存容量、儲存效能、資料高可用性,以及資料保護的需求對傳統儲存帶來挑戰。

戴爾不僅提供了SAP HANA認證整體解決方案,其快閃記憶體優化大幅度提高了一層儲存的效能,並且流動資料架構的細粒度分層都保證了最大限度降低了SAP HANA部署、調優和管理所需的資源。

3. Hadoop應用

SecureWorks作為資訊保安服務商,幫助從政府到企業的各種使用者通過Web應用、網路、日誌等掃描及全天候安全監控,提高資訊保安性。隨著客戶量的增加,資料量快速攀升,如何保證儲存高可擴充套件性、資料高可用性,以及儲存動態資源配置能力,是選擇儲存的關鍵。

戴爾 Crowbar結合ClouderaHadoop方案,簡化了Hadoop的方案整合,提高了儲存效能,優化了儲存資源利用率,降低了業務風險。為從IT架構管理,向IT 服務交付提供了標準化、規範化、自動化的IT管理平臺。

4. Oracle應用

紐約某教育資訊交換中心支援64所不同的高等教育機構,為使用者提供多種應用;同時,為24所高教機構管理140個Oracle資料庫、50多種Oracle應用,對各種資料進行批量分析。隨著資料庫容量和課件的非結構化檔案儲存容量快速攀升,如何提高儲存資源利用率、對結構化和非結構化儲存的集中統一管理,並確保課件所需要的容量和吞吐量,以及課件的線上響應速度是他們面臨的挑戰。

戴爾流動資料架構結合資料塊級智慧和虛擬頁技術讓使用者制定靈活的RAID級別和儲存層,以及資料儲存的盤道位置,通過各種資源整合效應,確保業務關鍵型工作負載性和高可用性需求。同時,橫向擴充套件保證容量擴充套件過程的效能滿足課件所需要吞吐量,保證課件在所有時段的響應速度。

5. VDI應用

某保險公司有450個保險代理、50萬使用者,部署了1300個虛擬終端。隨著虛擬終端數量以及應用的增多,啟動風暴導致每天上班時啟動時間在15-30分鐘。如何保證啟動風暴所需要的IOPs,同時控制桌面虛擬化儲存成本,滿足儲存容量需求,是該保險使用者提高桌面虛擬化投資回報的最大挑戰。

戴爾12代伺服器通過GPU技術,提高了對於桌面虛擬化圖形檔案的處理能力,大大降低保險行業處理高清影像檔案對終端顯示卡的開支;同時,通過C系列和VRTX,為保險行業使用者提供整體IT架構解決方案,降低桌面虛擬化部署週期和管理難度。而戴爾流動資料架構同時保證了虛擬化效能,保證了生產效率。

(王叢 中橋諮詢首席分析師)