解析分級儲存管理(HSM)

lenx2000發表於2009-09-27
   眾所周知,企業的應用系統線上處理大量的資料,隨著資料量的不斷加大,如果都採用傳統的線上儲存方式,就需要大容量本地一級硬碟。這樣一來一方面投資會相當較大,而且管理起 來也相對較複雜;另一方面由於磁碟中儲存的大部分資料訪問率並不高,但仍然佔據硬碟空間,會導致存取速度下降。在這種情況下,層次化儲存管理軟體,或稱為資料遷移軟體,可以在效能和價格間作出最好的平衡。這就是本文要與大家討論的分級儲存管理(HSM)。首先來了解一下分級儲存中所涉及的三種儲存方式。
    
一、  三種儲存方式

    所謂分級儲存,就是根據資料不同的重要性、訪問頻次等指標分別儲存在不同效能的儲存裝置上,採取不同的儲存方式。這樣一方面可大大減少非重要性資料在一級本地磁碟所佔用的空間,還可加快整個系統的儲存效能。在這裡就涉及到幾種不同效能的儲存裝置和不同的儲存形式了。
    目前常用於資料儲存的儲存裝置主要有磁碟(包括磁碟陣列)、磁帶(包括磁帶機和磁帶庫)和光碟(包括一切CD-R、CD-RW、DVD-R、DVD-RW等光碟塔和光碟庫裝置)。從效能上來說,磁碟當然是最好的,光碟次之,最差的是磁帶。而從價格上來說,單位容量成本上升磁碟最貴、光碟次之,磁帶最低。這就為我們不同的應用追求最佳價效比提供了條件,因為這些不同的儲存媒介可應用於不同的儲存方式中。這不同的儲存形式包括線上儲存(OnStore)、近線儲存(NearStore)和離線儲存(OffStore)。
    線上儲存
    線上儲存又稱工作級的儲存,儲存裝置和所儲存的資料時刻保持“線上”狀態,是可隨意讀取的,可滿足計算平臺對資料訪問的速度要求。如我們PC機中常用的磁碟基本上都是採用這種儲存形式的。一般線上儲存裝置為磁碟和磁碟陣列等磁碟裝置,價格相對昂貴,但效能最好。
    離線儲存
    離線儲存主要是用於對線上儲存的資料進行備份,以防範可能發生的資料災難,因此又稱備份級的儲存。離線海量儲存的典型產品就是磁帶或磁帶庫,價格相對低廉。離線儲存介質上的資料在讀寫時是順序進行的。當需要讀取資料時,需要把帶子捲到頭,再進行定位。當需要對已寫入的資料進行修改時,所有的資料都需要全部進行改寫。因此,離線海量儲存的訪問是慢速度、低效率的。
    近線儲存
    所謂近線儲存,就是指將那些並不是經常用到,或者說資料的訪問量並不大的資料存放在效能較低的儲存裝置上。對這些的裝置要求是定址迅速、傳輸率高。因此,近線儲存對效能要求相對來說並不高,但由於不常用的資料要佔總資料量的大多數,這也就意味著近線儲存裝置首先要保證的是容量。
    在分級資料儲存結構中,磁帶庫等成本較低的儲存資源用來存放訪問頻率較低的資訊,而磁碟或磁碟陣列等成本高、速度快的裝置,用來儲存經常訪問的重要資訊。資料分級儲存的工作原理是基於資料訪問的區域性性。透過將不經常訪問的資料自動移到儲存層次中較低的層次,釋放出較高成本的儲存空間給更頻繁訪問的資料,可以獲得更好的總體價效比。

二、  分級儲存的必要性和主要優點

    今天企業的資料中心非常複雜,資料保護是其關鍵。但是,並非所有的資料都具有同樣的價值,也並非所有的企業都具有同樣的需求。的確如此,通常認為企業中的關鍵和非關鍵資料量也符合“二八原則”,就是隻有20%的關鍵資料,而80%都是非關鍵的。系統中60%至80%的資料經常在一個月,甚至一年中都不會被訪問。而在經常訪問的資料中,重要性差別也十分突出,有的資料與使用者的業務聯絡緊密,可靠性、可用性及效能要求都很高,有的儘管經常使用但是與業務聯絡不是特別緊密。一般來說,重用資料的機率自資料建立3天之後就會下降50%,當資料建立30天后,重用的機率通常會降至很低,而高達90%的資料超過90天后就不會或很少被讀取。為了提供良好的資料保護,IT部門通常都保留巨大的空餘空間,用以防止出現容量不足的現象。
    IT企業總是要面對增長起來無休無止的資料量。各種應用都在建立越來越大的檔案,使用者也很少刪除資料和存檔,這就導致要訪問舊一些的檔案已經變得非常困難。之所以要採取分組儲存,是因為它既能最大限度地滿足使用者隨時訪問所有需要經常使用的資料,又可使儲存成本最小化。綜合起來,可以得出分級儲存的優點主要體現在以下兩個方面:
    1、  減少總體儲存成本
    在傳統的線上儲存中,所有資料都儲存在一線磁碟儲存裝置上,而由於絕大多數資料的訪問率並不高,佔住了大量寶貴的磁碟空間,在一定程度上是一種浪費。如果把這些資料轉移到儲存效能稍低的磁碟(如IDE或SATA介面磁碟)或光碟儲存裝置上,儲存成本可得以大幅降低。
    2、  提高整體系統效能
    由於絕大部分資料轉移到下級儲存裝置上,那需要時刻保持線上的資料就少了,系統資源的佔用也就少了許多,整體系統效能自然也就提高了。如果採用了離線儲存方式對很少使用的資料儲存在像磁帶這樣的離線儲存媒體上時,則不僅可提高系統效能,還可確保資料的安全性。
   
三、  分級儲存的管理
    分級儲存管理(Hierarchical Storage Management,HSM)就是要將使用者擁有的所有儲存資源統一管理,提高每種儲存裝置的利用率,節約了成本。在分級儲存中,儲存的分級是十分明顯的,僅從裝置上說,就有磁帶機、磁帶庫、NAS、中低端盤陣、高階儲存系統等等。而且線上、近線與離線儲存存放的資料價值不同,如何根據使用者資料的不同價值合理利用好每種儲存資源是一個不小的挑戰。
    分級儲存管理起源於1978年,首先使用於IBM的大型機系統。近10年來,HSM被廣泛應用於開放系統的Unix和Windows平臺。其中最關鍵的技術就是近線儲存和資料遷移技術。
    分級儲存管理是一種將離線儲存與線上儲存融合的技術。它將高速、高容量的非線上儲存裝置作為磁碟裝置的下一級裝置,然後將磁碟中常用的資料按指定的策略自動遷移到磁帶庫等二級大容量儲存裝置上。當需要使用這些資料時,分級儲存系統會自動將這些資料從下一級儲存裝置調回到上一級磁碟上。對於使用者來說,上述資料遷移操作完全是透明的,只是在訪問磁碟的速度上略有怠慢,而在邏輯磁碟的容量上明顯感覺大大提高了。通俗地講,資料遷移是一種可以把大量不經常訪問的資料存放在磁帶庫、光碟庫等離線介質上,只在磁碟陣列上儲存少量訪問頻率高的資料的技術。當那些磁帶等介質上資料被訪問時,系統自動地把這些資料回遷到磁碟陣列中;同樣,磁碟陣列中很久未訪問的資料被自動遷移到磁帶介質上,從而大大降低投入和管理成本。
    HSM應用也具備監測磁碟容量並在關鍵容量情況下做出反應的能力。這種軟體經過配置後可以為某個卷設定一個最小的剩餘空間,當達到這個極限後自動向使用者發出警告,提示使用者或自動進行資料遷移。這樣便可以立即釋放空間,管理員也可以在今後有空閒時再來解決空間的問題。
    由此可見,分級儲存管理更多從降低成本、不影響資料應用效果的角度解決資料的儲存問題。事實上,降低成本、提高效率已成為IT廠商追逐技術進步的一個目標。近線儲存就是這種進步的產物。伴隨單盤成本的下降,近線儲存市場漸熱,有業內專家預測,不久的將來,近線儲存技術將取代資料遷移技術,使用者將以模擬海量空間的、更為安全可靠的磁碟介質儲存歷史資料。而成熟完善的資料遷移軟體技術將更為恰到好處的融入到近線儲存裝置中,為近線儲存技術的發展起到推波助瀾的作用。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/11134849/viewspace-615642/,如需轉載,請註明出處,否則將追究法律責任。

相關文章