使用SQL-Server分割槽表功能提高資料庫的讀寫效能

Agile.Zhou發表於2021-02-18

原文網址 : https://www.cnblogs.com/kklldog/p/14403028.html

首先祝大家新年快樂，身體健康，萬事如意。
一般來說一個系統最先出現瓶頸的點很可能是資料庫。比如我們的生產系統併發量很高在跑一段時間後，資料庫中某些表的資料量會越來越大。海量的資料會嚴重影響資料庫的讀寫效能。
這個時候我們會開始優化系統，一般會經過這麼幾個過程：

找出SQL慢查詢，針對該SQL進行優化，比如改進SQL的寫法，檢視執行計劃對全表掃描的欄位建立索引
引入快取，把一部分讀壓力載入到記憶體中
讀寫分離
引入佇列，把併發的請求使其序列化，來減輕系統瞬時壓力
分表/分庫

對於第五點優化方案我們來細說一下。分表分庫通常有兩種拆分維度：1.垂直切分，垂直切分往往跟業務有強相關關係，比如把某個表的某些不常用的欄位遷移出去，比如訂單的明細資料可以獨立成一張表，需要使用的時候才讀取 2.水平切分，比如按年份來拆分，把資料庫按年或者按某些規則按時間段分成多個表。
拆分表之後每個表的資料量將會變小，帶來的好處是不言而喻的。不管是全表掃描，還是索引查詢都會有比較高的提升。如果把不同的表檔案落在多個磁碟上那資料庫的IO效能還能進一步提高。
如果純手工拆分，比如按年份拆分成多個表，那麼上層業務程式碼也得進行調整。每次讀寫都得判斷該使用哪張表。如果是跨多個年份的分頁查詢更加難搞。人肉分表基本上不可能實現的，對於上層編碼簡直是個噩夢。所以針對分表分庫我們通常會使用某些中介軟體，比如Mycat，Sharding-JDBC等中介軟體。使用這些元件確實能實現分表分庫，並且對業務層程式碼遮蔽了資料庫架構的改動，但是配置略顯麻煩。如果你使用的是SQL Server資料庫，並且目前還不需要分庫，只需要分表，那麼其實使用內建的分割槽表功能是最簡單的方案。只需要開啟SQL Server Management Studio簡單設定幾下就可以了，對於你上層應用完全是無感的，你的程式碼、資料庫連線串都不需要改動。
以下我們通過2個簡單的測試，來簡單的演示下如何進行表分割槽操作，以及測試下分割槽前後效能變化。

測試寫效能

我們的測試方案：新建一張logs表，按年份寫入資料。2019年寫入1000000資料，2020年也寫入100000資料。為了加快寫入的速度，每個年份並行10個執行緒同時寫，每個執行緒寫100000資料，一共1000000資料。然後把logs表改成分割槽表再用同樣的方式寫入2000000資料。記錄耗時比較兩次的耗時。
硬體為一臺14年產的筆記本，OS為win10。掛載2塊硬碟，1塊為5400轉的機械硬碟，1塊為15年加的SSD。磁碟效能可以說極為垃圾。未分割槽時表檔案會落在機械硬碟上。

未分割槽情況下測試

使用指令碼建表：

CREATE TABLE [dbo].[logs](
	[id] [uniqueidentifier] NOT NULL,
	[log_txt] [varchar](200) NULL,
	[log_time] [datetime] NULL,
 CONSTRAINT [PK_logs] PRIMARY KEY CLUSTERED 
(
	[id] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
)

新建一個控制檯程式編寫程式碼：

class Program
    {
        static void Main(string[] args)
        {
            Console.WriteLine("Hello World!");
            Task.Run(() =>
            {
                InsertData(2019);
            });
            Task.Run(() =>
            {
                InsertData(2020);
            });
            Console.ReadLine();
        }

        static void InsertData(int year)
        {
            var tasks = new List<Task>();
            Stopwatch sw = new Stopwatch();
            sw.Start();
            for (int i = 0; i < 10; i++)
            {
                tasks.Add(Task.Run(()=> {
                    using (var conn = new SqlConnection())
                    {
                        conn.ConnectionString = "Persist Security Info = False; User ID =sa; Password =dev@123; Initial Catalog =fq_test; Server =.\\mssql2016";
                        conn.Open();
                        int index = 0;
                        for (int j = 0; j < 100000; j++)
                        {
                            var logtime = new DateTime(year, new Random().Next(1, 12), new Random().Next(1, 28));
                            conn.Execute("insert into logs2 values (newid(),'下訂單',@logtime)", new
                            {
                                logtime
                            });
                            Console.WriteLine("logtime:{0} index {1}", logtime, index++);
                        }
                    }
                }));
            }
            Task.WaitAll(tasks.ToArray());
            sw.Stop();
            Console.WriteLine("Year {0} complete , total time: {1}.", year, sw.ElapsedMilliseconds);
        }
    }

寫完2000000資料耗時1369454毫秒。

分割槽情況下進行測試

開始分割槽

把一個表設定為分割槽表大概有5個步驟：

新增檔案組
在檔案組新增檔案
新建分割槽函式
新建分割槽方案
開始分割槽

以下演示下如何使用SQL SERVER Management Studio管理器進行表分割槽：

選中資料庫=>屬性=>檔案組，新增group1，group2兩個檔案組。

選中資料庫=>屬性=>檔案。新增file1，檔案組選group1，路徑選擇一個檔案目錄。這裡選擇E盤data目錄。新增file2，檔案組選擇group2，路徑選擇一個檔案目錄。這裡選擇X盤的data目錄。這樣當分割槽的時候資料就會落在這2個目錄下。這裡的路徑可以選擇在同一個硬碟，但是為了更高的讀寫效能，如果有條件建議直接指定在不同的硬碟下。

選中logs表=>儲存=>建立分割槽，啟動分割槽嚮導工具。

新建一個分割槽函式，點選下一步。

新建一個分割槽方案，點選下一步。

選擇一個分割槽列，資料會根據該列進行水平拆分。這裡選擇logtime，因為時間是比較適合水平切分的一個維度。

值得資料拆分的範圍。範圍選擇“右邊界”。右邊界跟左邊界的差異在於對邊界值的處理。右邊界是<，左邊界是<=，也就是包含邊界值。
我們這裡設定group1儲存2019的資料，group2儲存2020的資料。所以group1的邊界值設定為2020-01-01，group2的邊界值設定為2021-01-01 。

設定完是這個樣子，需要3個檔案組。當出現不在group1，group2範圍內的資料就會儲存在第三個檔案組內。

建好分割槽函式、分割槽方案後，可以選擇生成指令碼或者立即執行。這裡選擇“立即執行”。當執行完成後，表裡的資料會按照分割槽方案設定的邊界分散到多個檔案上。

在分割槽情況下進行測試

先清空logs表所有的資料，然後使用同樣的程式碼進行測試。測試結果顯示寫完2000000資料耗時：568903毫秒。可以看到資料庫寫效能大副提高，大概提高了1倍不止的效能。這也比較符合兩塊磁碟同時IO的預期。

測試讀效能

我們的測試方案：新建一張log2表，使用上面的程式碼按年份寫入2000000資料。然後使用select語句同時讀取2019,2020年的資料。把log錶轉換成分割槽表，重新測試select的時間。比較兩次讀取資料的時間。
sql語句：

select * from log2 where (logtime > '2019-05-01' and logtime < '2019-06-01') or (logtime > '2020-05-01' and logtime < '2020-06-01')

首先在未分割槽的表上測試查詢效能，花費時間為3s。

把表按前面的方法進行分割槽拆分，查詢花費時間為1s。讀效能大概為未分割槽時的3倍。

總結

經過簡單的測試，SQL Server的分割槽表功能能大副提高資料庫的讀寫效能。通過SQL Server Management Stduio的簡單設定就可以對資料庫表進行分割槽操作，並且對應用層的程式碼完全是無感的，比用分表分庫中介軟體來說簡單多了。

關注我的公眾號一起玩轉技術

在分割槽表上使用正確的索引來提高效能
2019-06-13
索引
Oracle 資料庫 10g中的分割槽功能(轉)
2019-05-18
Oracle資料庫
zabbix上對mysql資料庫做分割槽表
2018-11-07
MySql資料庫
PostgreSQL 原始碼解讀（98）- 分割槽表#4（資料查詢路由#1-“擴充套件”分割槽表）
2018-11-28
SQL原始碼路由套件
MySQL資料表分割槽手記
2021-05-03
MySql
PostgreSQL 原始碼解讀（96）- 分割槽表#3（資料插入路由#3-獲取分割槽鍵值）
2018-11-27
SQL原始碼路由
oracle分割槽表和分割槽表exchange
2024-03-15
Oracle
ORACLE刪除-表分割槽和資料
2020-05-06
Oracle
hive 動態分割槽插入資料表
2020-12-18
Hive
提高知識分割槽
2024-07-29
PG的非分割槽表線上轉分割槽表
2022-07-12
MySQL的nnodb引擎表資料分割槽儲存
2018-06-01
MySql
AppBoxFuture: 大資料表分割槽的3種策略
2019-07-01
APP大資料
PostgreSQL 原始碼解讀（92）- 分割槽表#1（資料插入路由#1）
2018-11-24
SQL原始碼路由
PostgreSQL 原始碼解讀（94）- 分割槽表#2（資料插入路由#2）
2018-11-26
SQL原始碼路由
資料庫系統設計：分割槽
2022-09-14
資料庫
[oracle] expdp 匯出分割槽表的分割槽
2021-01-28
Oracle
oracle分割槽表和非分割槽表exchange
2024-03-15
Oracle
oracle 分割槽表move和包含分割槽表的lob move
2019-03-11
Oracle
移動分割槽表和分割槽索引的表空間
2018-05-23
索引
Oracle資料庫分割槽表SPLIT操作導致歸檔瘋漲
2023-12-27
Oracle資料庫
oracle 更改分割槽表資料 ora-14402
2021-01-29
Oracle
大資料資料庫讀寫分離分庫分表
2021-01-01
大資料資料庫
Zabbix系統MySQL資料庫分割槽表的設定--精簡說明
2019-03-20
MySql資料庫
E6 資料庫分割槽技術
2020-11-15
資料庫
MySql資料分割槽操作之新增分割槽操作
2021-09-09
MySql
PostgreSQL/LightDB 分割槽表之分割槽裁剪
2022-07-14
SQL
linux分割槽資料讀取工具：Paragon extFS for Mac
2023-12-12
LinuxGoMac
MySql分表、分庫、分片和分割槽
2021-06-17
MySql
調整分割槽後分割槽不見的資料找到方法
2022-06-14
Oracle查詢Interval partition分割槽表內資料
2018-11-17
Oracle
(3) MySQL分割槽表使用方法
2019-01-07
MySql
教程：如何使用DataLakeAnalytics建立分割槽表
2018-08-10
mariadb 分割槽表不能使用 ICP
2023-09-21
【MYSQL】分割槽表
2021-09-09
MySql
如何選擇正確的讀取SD的資料表，提高程式效能
2019-01-15
PostgreSQL使用表繼承實現分割槽表
2019-10-30
SQL繼承
非分割槽錶轉換成分割槽表
2022-07-09