對話戴爾科技集團劉志洪 聊一聊非結構化資料儲存的那些事兒

陶然陶然發表於2020-10-10

        在“新基建”的推動下,數字化轉型與智慧物聯升級成為大勢所趨,許多企業都加速向數字化創新工廠邁進。此趨勢一方面助力萬物互聯的數字化建設,另一方面也帶來了資料“井噴式”增長,其中大部分資料是非結構化資料。

  如何高效處理非結構化資料成為當今使用者的挑戰與新痛點。戴爾科技集團及時響應使用者需求,適時推出了PowerScale非結構化資料儲存解決方案,可將結構化管理引入非結構化資料,最大化地釋放“新基建”時代資料的作用與價值。

  近日,筆者有幸採訪到了戴爾科技集團大中華區非結構化資料儲存事業部總經理劉志洪先生,和劉總圍繞非結構化資料儲存的概念、市場趨勢及戴爾科技集團針對非結構化資料儲存的一些舉措,展開了深入探討。

   何謂“非結構化資料”?

  據IDC預測,2018年到2025年之間,全球產生的資料量將會從33ZB增長到175ZB,複合增長率達到27%,其中超過80%的資料都會是非結構化資料。那麼,什麼是非結構化資料?非結構化資料和結構化資料相比有何不同?

  據劉志洪表示:“資料就是客觀世界的一個數學表示式。結構化資料是高度組織和整齊格式化的資料,計算機可以很輕鬆地搜尋到它,容易被人們使用。而非結構化資料本質上是結構化資料之外的一切資料,它不符合任何預定義的模型,可能是文字的或非文字的,也可能是人為的或機器生成的,不容易被處理與儲存。典型的非結構化資料包括文字檔案、電子郵件、社交媒體資料、網站、移動資料、通訊、媒體資料等等。”

   在談到非結構化資料和結構化資料區別時,劉志洪總結道:除了以上提到的概念性區別之外,非結構化資料和結構化資料還存在以下幾個區別,即非結構化資料的種類繁多、資料的來源廣,產生的速度比結構化資料更快,資料處理和儲存更困難。

  當我們在刷短影片,網上聊天時,是否想到過這些行為的背後帶來怎樣的資料鉅變?包括影像、影片、社交媒體內容在內的非結構化資料的增速驚人,遠大於結構化資料。據Gartner預測,從2019年到2024年,非結構化資料的總量預計將增加兩倍。那麼,隨著非結構化資料的擴張,客戶對非結構化資料儲存的需求也直線上升。如今,客戶對於非結構化資料儲存提出了哪些需求點呢?

  筆者看來,在各行各業,使用者都面臨著非結構化資料量大、資料增快的難題。毫無疑問,企業需要一種簡單、流暢、經濟高效的方式來儲存和使用非結構化資料。在這個問題上,劉總為我們總結了三大客戶需求點:

  首先,將結構化管理引入非結構化資料(從邊緣到核心到雲),能夠消除其複雜性,並且可以從小規模應用擴充套件到很大規模應用。

  第二,它能處理任意使用者、任意位置的各種不可預測的工作負載。能同時支援邊緣、核心和雲的儲存需求。

  第三,能使查詢和分析資料變得容易。組織需要找到所需的資料,無論它們位於何處。業務人員需要資料唾手可得;開發人員需要使用它進行編碼;IT組織需要處理和管理資料。好的解決方案應該是智慧的和賦能的。

  筆者認為,隨著近年來雲和邊緣計算等技術的興起,越來越多的非結構化資料從傳統資料中心轉移到雲和邊緣計算等新場景,那麼相關的解決方案只有兼顧到這一發展趨勢,才能立於不敗之地。

   “新基建”為數字化轉型帶來新機遇

  “新基建“是以5G、雲端計算、物聯網、人工智慧等新一代資訊科技為依託,對新型基礎設施的投入建設,及對傳統基礎設施進行數字化改造,推動面向數字經濟的全面轉型,為社會民生、工業、科技等方方面面注入全新的活力。

  隨著新型基礎設施的全面鋪開,資料爆發式增長、新一代資訊科技的應用需求快速增長、更多基於雲的新興業態及場景紛紛湧現,這些趨勢都大大加快了企業數字化轉型的步伐。在“新基建”這個趨勢下,對於非結構化儲存帶來了哪些需求和變化呢?

  劉志洪表示,在“新基建“的推動下,AI,5G等新興技術加速部署,人們對資訊的渴望被極大的喚起,常規的結構化資料互動已經不能滿足人們的需求。而伴隨著數字化的快速發展,非結構化資料扮演起越來越重要的角色,圖片、影片、語音蘊含的豐富資訊將被廣泛利用。

  另一方面,新興技術的快速發展也提高了行業對非結構化資料的重視程度。比如物聯網、工業4.0、ADAS、自動駕駛、影片直播等領域的發展產生了更多的非結構化資料,而例如人工智慧、機器學習、語義分析、影像識別等技術則需要大量的非結構化資料來開展工作。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28285180/viewspace-2726105/,如需轉載,請註明出處,否則將追究法律責任。

相關文章