[資料庫系統]儲存和檔案結構

zzcjojo發表於2018-07-24

所有計算機問題都可以歸結為快取問題 —某大佬

上面這句話是某日在知乎上無意看到的，但卻在我的腦海裡停留良久。如果之前看到這句話，可能也就略過了，但最近做了不少快取想關的工作，從redis到ADT裝置快取，從web應用到作業系統實現，快取無處不在，毫無疑問，資料庫系統也快取。這篇筆記主要從理論出發，淺析資料庫系統的儲存和檔案結構。

1.RAID

RAID是什麼?

RAID(ReDundant Array of Independent Disk)即獨立磁碟冗餘陣列，是一種多磁碟組織技術。
說人話：RAID其實就是通過冗餘提高儲存的可靠性和並行性，由概率論知識（概率論？？）可以知道，一堆磁碟出現一次故障的概率肯定比某一張磁碟發生故障的概率大，如果我們的N張磁碟在不做備份的情況下，只要有一張出現毛病，就會損失大量的資料，對於某些應用來說，就算丟了1byte的資料都是不可容忍的（你的支付寶少了1byte的錢（我沒這麼多不用擔心）），引入冗餘是個解決的好辦法，嗯，最簡單粗暴的方法就算砸錢復制每一張磁碟，這種技術也就是映象（影子），即一張邏輯盤對應幾張物理盤，這樣即使你的1byte記錄的鉅款在某個盤上丟了也沒事，但這時候你說，萬一地震了火災了三體人入侵了怎麼辦（三體人入侵你就等著去澳大利亞吧），當然，儘管有這麼多可能，映象也比單張磁碟的可靠性高不少（平均丟失時間可以長達55~100年）[1]

同時，RAID還可以提高並行性，就像使用Mycat進行資料庫分片一樣，我可以在多張磁碟進行資料拆分來提高傳輸速率，主要有以下幾種：
1.位元級拆分（聽起來很厲害的樣子）：把每個位元組都進行了拆分，將不同位存到不同的磁碟，比如第i位存到第i號磁碟。（好細緻。。）
2.塊級拆分（最常用）：把磁碟陣列看成一塊單獨的大磁碟，並且給塊進行邏輯編號，比如將邏輯上的第i塊存到物理磁碟(i mod n) + 1張磁碟上，有點意思了哈，讀一個大檔案的時候，可以從n張磁碟並行取n個塊，這樣不就快了嗎。
磁碟系統並行的兩個目的：1 負載平衡多個小的訪問操作（塊訪問）以提高訪問操作吞吐量，2 並行執行大的訪問操作，以減少訪問操作的響應時間[1]。

RAID級別

前面說道，映象是比較燒錢的，拆分雖然提高了並行性，但是不能提高可用性。為了降低成本（省錢）提出了一些方案，分為若干個RAID級別(RAID level),具體的就不贅述了。

2. 檔案組織

資料庫外表看起來這麼高大上，其實底層還是用檔案儲存的，由作業系統進行維護，資料庫中的記錄都是存在塊中的（而一個塊可以包含很多記錄），塊是儲存分配和資料傳輸的基本單元，大多數資料庫預設塊大小為4到8KB
記錄可以分成定長和變長記錄

Reference

[1] DataBase System Concepts 6th Abraham Silberschatz

檔案系統儲存與oracle資料庫儲存對比
2009-11-09
Oracle資料庫
大資料檔案儲存系統HDFS
2019-01-15
大資料
管理資料庫儲存結構
2010-05-11
資料庫
儲存系統實現-資料檔案格式
2013-05-19
層次結構資料的資料庫儲存和使用
2004-10-27
資料庫
PostgreSQL 資料庫學習 - 1.資料庫體系結構之儲存結構
2022-01-21
SQL資料庫
儲存與資料庫系統
2010-03-29
資料庫
把檔案系統的資料檔案遷移到ASM儲存
2014-05-14
ASM
【iOS資料儲存】iOS檔案系統介紹
2015-04-09
iOS
【資料結構——圖和圖的儲存結構】
2020-11-12
資料結構
資料庫內部儲存結構探索
2019-03-03
資料庫
2 Day DBA-管理Oracle例項-管理資料庫儲存結構-關於資料庫儲存結構
2014-01-27
Oracle資料庫
【PHP資料結構】圖的概念和儲存結構
2021-09-09
PHP資料結構
系統架構設計面試指南(02)-MQ和檔案儲存
2024-01-02
架構面試MQ
2 Day DBA-管理Oracle例項-管理資料庫儲存結構-關於資料檔案
2014-01-27
Oracle資料庫
HBase 資料儲存結構
2021-02-28
Oracle資料儲存結構
2013-05-21
Oracle
2 Day DBA-管理Oracle例項-管理資料庫儲存結構-檢視資料檔案資訊
2014-01-28
Oracle資料庫
詳解資料庫儲存的資料結構LSM Tree
2023-04-14
資料庫資料結構
【儲存資料恢復】IBM儲存檔案NTFS系統損壞的資料恢復案例
2022-09-19
資料恢復IBM
分散式檔案系統HDFS，大資料儲存實戰（一）
2019-02-18
分散式大資料
六、層次結構儲存系統
2021-01-03
2 Day DBA-管理Oracle例項-管理資料庫儲存結構-關於控制檔案
2014-01-27
Oracle資料庫
MySql體系結構和儲存引擎
2017-03-10
MySql儲存引擎
IOS資料儲存之檔案沙盒儲存
2016-05-11
iOS
資料庫檔案儲存（DBFS），是一款針對資料庫場景的雲原生共享檔案儲存服務
2022-05-04
資料庫
2 Day DBA-管理Oracle例項-管理資料庫儲存結構-關於其它儲存結構
2014-01-27
Oracle資料庫
資料庫系統檔案啟動資料庫
2009-05-01
資料庫
Prometheus時序資料庫-磁碟中的儲存結構
2021-03-01
Prometheus資料庫
一篇看懂圖資料庫janusgraph儲存結構
2019-01-22
資料庫
Oracle資料庫儲存結構之間的關係
2010-09-19
Oracle資料庫
達夢資料庫基礎知識（一）資料庫物理儲存結構
2021-10-26
資料庫
【儲存資料恢復】WAFL檔案系統下raid資料恢復案例
2023-05-08
資料恢復AI
Android中的資料儲存之檔案儲存
2020-03-11
Android
CentOS修改Mariadb資料庫檔案儲存路徑
2018-06-19
CentOS資料庫
本地儲存-系統和保留-系統檔案佔用儲存空間過大的解決方式
2020-12-06
MyRocks儲存引擎資料結構解析
2019-01-05
儲存引擎資料結構
分散式系統技術：儲存之資料庫
2020-06-05
分散式資料庫