理論知識
分表 - 從表面意思上看呢,就是把一張表分成N多個小表,每一個小表都是完正的一張表。分表後資料都是存放在分表裡,總表只是一個外殼,存取資料發生在一個一個的分表裡面。分表後單表的併發能力提高了,磁碟I/O效能也提高了。併發能力為什麼提高了呢,因為查尋一次所花的時間變短了,如果出現高併發的話,總表可以根據不同 的查詢,將併發壓力分到不同的小表裡面。
分庫 - 把原本儲存於一個庫的資料分塊儲存到多個庫上,把原本儲存於一個表的資料分塊儲存到多個表上。資料庫中的資料量不一定是可控的,在未進行分表分庫的情況下,隨著時間和業務的發展,庫中的表會越來越多,表中的資料量也會越來越大,相應地,資料操作,增刪改查的開銷也會越來越大;另外,一臺伺服器的資源(CPU、磁碟、記憶體、IO等)是有限的,最終資料庫所能承載的資料量、資料處理能力都將遭遇瓶頸。
情懷滿滿
分表、分庫在 .NET 下可謂是老大難題,簡單點可以使用類似 mycat 中介軟體,但是就 .NET 平臺的自身生態,很缺乏類似 sharding-jdbc 這樣強大的輪子。
本人就自身有限的技術水平和經驗,對分表、分庫進行分析,實現出自成一套的使用方法,雖然不極 sharding-jdbc 強大,但是還算比較通用、簡單。但願有朝一日出現一批真正 .NET 大神,造出偉大的開源專案,實現你我心中的抱負。
這套分表、分庫方法是建立在 .NET ORM FreeSql 之上做的,內容可能比較抽象,敬請諒解!後續會詳解各種租戶設計方案,除了按欄位區分租戶,還包括分庫、分表的方案,敬請關注!
入戲準備
FreeSql 是 .Net ORM,能支援 .NetFramework4.0+、.NetCore、Xamarin、XAUI、Blazor、以及還有說不出來的執行平臺,因為程式碼綠色無依賴,支援新平臺非常簡單。目前單元測試數量:5000+,Nuget下載數量:180K+,原始碼幾乎每天都有提交。值得高興的是 FreeSql 加入了 ncc 開源社群:https://github.com/dotnetcore/FreeSql,加入組織之後社群責任感更大,需要更努力做好品質,為開源社群出一份力。
QQ群:4336577(已滿)、8578575(線上)、52508226(線上)
為什麼要重複造輪子?
FreeSql 主要優勢在於易用性上,基本是開箱即用,在不同資料庫之間切換相容性比較好。作者花了大量的時間精力在這個專案,肯請您花半小時瞭解下專案,謝謝。功能特性如下:
- 支援 CodeFirst 對比結構變化遷移;
- 支援 DbFirst 從資料庫匯入實體類;
- 支援 豐富的表示式函式,自定義解析;
- 支援 批量新增、批量更新、BulkCopy;
- 支援 導航屬性,貪婪載入、延時載入、級聯儲存;
- 支援 讀寫分離、分表分庫,租戶設計;
- 支援 MySql/SqlServer/PostgreSQL/Oracle/Sqlite/達夢/神通/人大金倉/MsAccess;
FreeSql 使用非常簡單,【單機資料庫】只需要定義一個 IFreeSql 物件即可:
static IFreeSql fsql = new FreeSql.FreeSqlBuilder()
.UseConnectionString(FreeSql.DataType.MySql, connectionString)
.UseAutoSyncStructure(true) //自動同步實體結構到資料庫
.Build(); //請務必定義成 Singleton 單例模式
分表
既然是分表,那就大膽認為他是操作【單機資料庫】,只需要對實體類進行動態對映表名即可實現,FreeSql 原生用法、FreeSql.Repository 倉儲用法 都提供了 AsTable 方法對分表進行 CRUD 操作,例如:
var repo = fsql.GetRepository<Log>();
repo.AsTable(oldname => $"{oldname}_201903");
//對 Log_201903 表 CRUD
repo.Insert(new Log { ... });
repo.Update(...);
repo.Delete(...);
repo.Select...;
AsTable 動態設定實體對映的表名,達到對分表的操作目的。除了 CRUD 操作,還提供了建立分表的功能:
- 如果開啟了自動同步結構功能 UseAutoSyncStructure(true),則 AsTable 會自動建立對應分表;
- 可以使用 fsql.CodeFirst.SyncStructure(typeof(實體類), "分表名") 進行手工建表;
多數情況,我們都建議提前建立好分表,如果按月分表,手工建立一年的分表。
目前這種算是比較簡單入門的方案,遠不及 mycat、sharding-jdbc 那麼智慧,比如:
- 不能利用分表欄位自動進行分表對映;
- 不能在查詢時根據 where 條件自動對映分表,甚至跨多個分表的聯合查詢;
分庫(單機)
分庫,但是在同一個資料庫伺服器例項下。這種情況也可以使用 AsTable 方式進行操作,如下:
var repo = fsql.GetRepository<Log>();
repo.AsTable(oldname => $"{201903}.dbo.{oldname}");
//對 [201903].dbo.Log CRUD
分庫之後,老大難題是事務,如果使用 SqlServer 可以利用 TransactionScope 做簡單的跨庫事務,如下:
var repoLog = fsql.GetRepository<Log>();
var repoComment = fsql.GetRepository<Comment>();
repoLog.AsTable(oldname => $"{201903}.dbo.{oldname}");
repoComment.AsTable(oldname => $"{201903}.dbo.{oldname}");
using (TransactionScope ts = new TransactionScope())
{
repoComment.Insert(new Comment { ... });
repoLog.Insert(new Log { ... });
ts.Complete();
}
分庫(跨伺服器)
前面提到:【單機資料庫】只需要定義一個 IFreeSql 物件即可。那分庫是不是要定義很多個 IFreeSql 物件?答案是的。
一般思路可以定義 static ConcurrentDictionary<string, IFreeSql> 儲存所有 IFreeSql 物件(key = ConnectionString),當進行 CRUD 時獲取到對應的 IFreeSql 即可。由於 IFreeSql 是靜態單例設計長駐記憶體,分庫數量太多的時候會浪費資源,因為不是所有分庫都一直一直在訪問。例如租戶分庫 10000 個,定義 10000 個 static IFreeSql?
更好的辦法可以使用 IdleBus 空閒物件管理容器,有效組織物件重複利用,自動建立、銷燬,解決【例項】過多且長時間佔用的問題。有時候想做一個單例物件重複使用提升效能,但是定義多了,有的又可能一直空閒著佔用資源。專門解決:又想重複利用,又想少佔資源的場景。https://github.com/2881099/IdleBus
dotnet add package IdleBus
static IdleBus<IFreeSql> ib = new IdleBus<IFreeSql>(TimeSpan.FromMinutes(10));
ib.Register("db1", () => new FreeSqlBuilder().UseConnectionString(DataType.MySql, "str1").Build());
ib.Register("db2", () => new FreeSqlBuilder().UseConnectionString(DataType.MySql, "str2").Build());
ib.Register("db3", () => new FreeSqlBuilder().UseConnectionString(DataType.SqlServer, "str3").Build());
//...註冊很多個
ib.Get("db1").Select<T>().Limit(10).ToList();
IdleBus 也是【單例】設計!主要的兩個方法,註冊,獲取。idlebus 註冊不是建立 IFreeSql,首次 Get 時才建立,後面會一直用已經建立的。還有一個超時機制,如果 10 分鐘該 IFreeSql 未使用會被 Dispose,然後下一次又會建立新的 IFreeSql,如此反覆。從而解決了 10000 個 IFreeSql 長駐記憶體的問題。
還利用 AsyncLocal 特性擴充套件使用起來更加方便:
public static class IdleBusExtesions
{
static AsyncLocal<string> asyncDb = new AsyncLocal<string>();
public static IdleBus<IFreeSql> ChangeDatabase(this IdleBus<IFreeSql> ib, string db)
{
asyncDb.Value = db;
return ib;
}
public static IFreeSql Get(this IdleBus<IFreeSql> ib) => ib.Get(asyncDb.Value ?? "db1");
public static IBaseRepository<T> GetRepository<T>(this IdleBus<IFreeSql> ib) where T : class
=> ib.Get().GetRepository<T>();
}
- 使用 ChangeDatabase 切換 db;
- 使用 Get() 獲取當前 IFreeSql,省略每次都傳遞 db 引數;
- 使用 GetRepository 獲取當前 IFreeSql 對應的倉儲類;
注意:使用 IdleBus 需要弱化 IFreeSql 的存在,每次都使用 ib.Get 獲取 IFreeSql 物件;
IdleBus<IFreeSql> ib = ...; //單例注入
var fsql = ib.Get(); //獲取當前租戶對應的 IFreeSql
var fsql00102 = ib.ChangeDatabase("db2").Get(); //切換租戶,後面的操作都是針對 db2
var songRepository = ib.GetRepository<Song>();
var detailRepository = ib.GetRepository<Detail>();
目前這種算是比較簡單入門的方案,遠不及 mycat、sharding-jdbc 那麼智慧,比如:沒有實現跨庫事務。
寫在最後
.NET 生態還處於較弱的狀態,呼籲大家支援、踴躍參與開源專案,為下一個 .NET 開源社群五年計劃做貢獻。
希望正在使用的、善良的您能動一動小手指,把文章轉發一下,讓更多人知道 .NET 有這樣一個好用的 ORM 存在。謝謝了!!
FreeSql 開源協議 MIT https://github.com/dotnetcore/FreeSql,可以商用,文件齊全。QQ群:4336577(已滿)、8578575(線上)、52508226(線上)
如果你有好的 ORM 實現想法,歡迎給作者留言討論,謝謝觀看!