資料庫水平切分方法

發表於2016-03-16

在大中型專案中，在資料庫設計的時候，考慮到資料庫最大承受資料量，通常會把資料庫或者資料表水平切分，以降低單個庫，單個表的壓力。我這裡介紹兩個我們專案中常用的資料表切分方法。當然這些方法都是在程式中使用一定的技巧來路由到具體的表的。首先我們要確認根據什麼來水平切分？在我們的系統（SNS）中，使用者的UID貫穿系統，唯一自增長，根據這個欄位分表，再好不過。

方法一：使用MD5雜湊

做法是對UID進行md5加密，然後取前幾位（我們這裡取前兩位），然後就可以將不同的UID雜湊到不同的使用者表（user_xx）中了。

function getTable( $uid ){
  $ext = substr ( md5($uid) ,0 ,2 );
  return "user_".$ext;
}

function getTable( $uid ){

$ext = substr ( md5($uid) ,0 ,2 );

return "user_".$ext;

}

通過這個技巧，我們可以將不同的UID分散到256中使用者表中，分別是user_00,user_01 …… user_ff。因為UID是數字且遞增，根據md5的演算法，可以將使用者資料幾乎很均勻的分別到不同的user表中。

但是這裡有個問題是，如果我們的系統的使用者越來越多，勢必單張表的資料量越來越大，而且根據這種演算法無法擴充套件表，這又會回到文章開頭出現的問題了。

方法二：使用移位

　　具體方法是：

public function getTable( $uid ) {
       return "user_" . sprintf( "%04d", ($uid >> 20) );}

1 2	public function getTable( $uid ) { return "user_" . sprintf( "%04d", ($uid >> 20) );}

這裡，我們將uid向右移動20位，這樣我們就可以把大約前100萬的使用者資料放在第一個表user_0000,第二個100萬的使用者資料放在第二個表user_0001中，這樣一直下去，如果我們的使用者越來越多，直接新增使用者表就行了。由於我們保留的表字尾是四位，這裡我們可以新增1萬張使用者表，即user_0000,user_0001 …… user_9999。一萬張表，每張表100萬資料，我們可以存100億條使用者記錄。當然，如果你的使用者資料比這還多，也不要緊，你只要改變保留表字尾來增加可以擴充套件的表就行了，如如果有1000億條資料，每個表存100萬，那麼你需要10萬張表，我們只要保留表字尾為6位即可。

上面的演算法還可以寫的靈活點：

/** 
 * 根據UID分表演算法 
 *  
 * @param int $uid  //使用者ID 
 * @param int $bit    //表字尾保留幾位 
 * @param int $seed //向右移動位數
 */
 function getTable( $uid , $bit , $seed ){
    return "user_" . sprintf( "%0{$bit}d" , ($uid >> $seed) );}

/**

* 根據UID分表演算法

* @param int $uid //使用者ID

* @param int $bit //表字尾保留幾位

* @param int $seed //向右移動位數

function getTable( $uid , $bit , $seed ){

return "user_" . sprintf( "%0{$bit}d" , ($uid >> $seed) );}

總結：

上面兩種方法，都要對我們當前系統的使用者資料量做出可能最大的預估，並且對資料庫單個表的最大承受量做出預估。

比如第二種方案，如果我們預估我們系統的使用者是100億，單張表的最優資料量是100萬，那麼我們就需要將UID移動20來確保每個表是100萬的資料，保留使用者表（user_xxxx）四位來擴充套件1萬張表。

又如第一種方案，每張表100萬，md5後取前兩位，就只能有256張表了，系統總資料庫就是：256*100萬；如果你係統的總資料量的比這還多，那你實現肯定要MD5取前三位或者四位甚至更多位了。

兩種方法都是將資料水平切分到不同的表中，相對第一種方法，第二種方法更具擴充套件性。。。

MySQL水平切分
2014-04-16
MySql
MySQL垂直切分和水平切分概念和優缺點介紹
2017-03-15
MySql
MySQL垂直和水平切分-轉載整理
2016-01-30
MySql
圖資料庫中的“分散式”和“資料切分”（切圖）
2023-03-15
資料庫分散式
MySQL資料切分策略介紹
2016-03-31
MySql
MySQL專題：資料庫垂直、水平拆分
2020-09-23
MySql資料庫
資料庫優化-水平拆分垂直拆分
2017-03-22
資料庫優化
海量資料遷移之外部表切分
2014-11-26
Mysql 資料庫水平分表儲存過程
2017-12-14
MySql資料庫儲存過程
分散式系統「伸縮性」大招之——「水平&垂直切分」詳解
2019-03-08
分散式
海量資料遷移之分割槽並行切分
2014-11-26
並行
「分散式技術專題」資料切分與合併
2023-02-14
分散式
海量資料遷移之透過rowid切分大表
2014-11-26
海量資料遷移之通過rowid切分大表
2014-08-12
順豐刪庫事件有感 - 資料庫資料恢復方法分享
2018-09-26
事件資料庫資料恢復
織夢資料庫配置檔案修改資料庫配置方法
2024-10-09
資料庫
資料庫表分割技術淺析(水平分割/垂直分割/庫表雜湊)
2015-09-24
資料庫
PHP匯出資料庫方法
2013-09-16
PHP資料庫
增加資料庫SGA的方法
2010-11-06
資料庫
監控Oracle資料庫方法
2007-05-31
Oracle資料庫
clone oracle資料庫的方法
2009-06-10
Oracle資料庫
清空資料庫中所有表資料的方法
2010-05-20
資料庫
海量資料遷移之使用分割槽並行切分匯入
2014-11-26
並行
使用 ER 方法的資料庫設計方法
2020-11-09
資料庫
【PG資料庫】PG資料庫的安裝及連線方法
2022-05-19
資料庫
SqlServer資料庫恢復備份資料的方法
2024-11-18
SQLServer資料庫
sqlserver 資料庫收縮的方法
2020-05-16
SQLServer資料庫
oracle資料庫插入行更快方法
2015-12-24
Oracle資料庫
訪問HyperSQL資料庫的方法
2011-01-11
SQL資料庫
Oracle資料庫打補丁方法
2011-08-15
Oracle資料庫
新建Oracle資料庫三種方法
2011-03-21
Oracle資料庫
資料庫設計方法步驟
2012-10-14
資料庫
Oracle 估算資料庫大小的方法
2012-03-31
Oracle資料庫
PB中建立資料庫的方法
2007-09-04
資料庫
Access資料庫日常維護和Access資料庫最佳化方法
2019-03-13
資料庫
C#取資料庫名稱與資料庫中表名的方法
2009-10-22
C#資料庫
oracle資料庫連續相同資料的統計方法
2019-01-27
Oracle資料庫
誤刪資料庫資料檔案的處理方法
2006-02-16
資料庫

資料庫水平切分方法

相關文章