「分散式技術專題」非獨立儲存的優勢與劣勢

Hubble資料庫發表於2023-02-14

分散式數資料庫非獨立儲存採用非獨點空間的策略機制。

非獨站空間是資料空間的一種,可以透過資料空間中的一個屬性來描述,會與其他非獨佔空間的資料空間共用磁碟目錄,透過邏輯來隔離,非獨佔空間會包含多個 shard,多個shard可能屬於多個資料空間,屬於多張表。

非獨佔空間也可稱為共享表空間:每一個資料庫的所有的表資料,索引檔案全部放在一個或多個檔案中,預設這個共享表空間的檔案路徑。

原理

分散式資料庫與他關係型資料庫一樣,有具體的儲存結構、資料和後設資料的,作為分散式資料庫系統,首先要決定資料的儲存模型,即資料是以何種形式儲存下來。多個表對應一個表空間,一個表空間裡可以有多個 shard,在表建立時指定好表的空間及目錄結構。即可共用了一個磁碟目錄。1個磁碟儲存指的就是一個磁碟目錄,也就是一個儲存的例項。

實現方式

後設資料儲存( ”/”分隔符,實際不存在) 如下DB名稱”DB1”,TABLE名稱為” TABLE1”。* KV後設資料與Range之間的對映,如:儲存空間對映Range資訊。* 資料儲存方式(如果“索引ID”設計時本身就定義了一個“特殊的字首”,那就不再需要索引字首),如:KEY為 儲存記錄資料。

優勢與劣勢

優勢

•表空間可以分成多個檔案存放到各個磁碟,所以表也就可以分成多個檔案存放在磁碟上,表的大小不受磁碟大小的限制。
•資料和索相檔案放在一起方便管理。

劣勢

•所有的資料和索引存放到一個檔案,雖然可以把一個大檔案分成多個小檔案,但是多個表及索引在表空間中混合儲存,當資料量非常大的時候,表做了大量刪除操作後表空間中將會有大量的空隙,特別是對於統計分析,對於經常刪除操作的這類應用最不適合用共享表空間。
•共享表空間分配後不能回縮:當出現臨時建索引或是建立一個臨時表的操作表空間擴大後,就是刪除相關的表也沒辦法回縮那部分空間了。

面臨挑戰

•非獨佔表空間轉換為獨佔表空間,涉及技術細節較多,實現技術比較複雜。
•對資料表的規劃及未來的增長量需要相當明確。
•資料遷移時會比較複雜,實施週期長。

 

以上為非獨立儲存的優勢與劣勢, 「分散式技術專題」是國產資料庫 hubble 團隊精心整編,專題會持續更新,歡迎大家保持關注。

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70026685/viewspace-2935106/,如需轉載,請註明出處,否則將追究法律責任。

相關文章