MySQL手動資料校驗+雲資料庫資料校驗

cdrcsy發表於2024-06-26

MySql資料庫

校驗原理

1、將每條資料需要比對的欄位拼接成為字串，欄位順序需要一致。

2、使用md5摘要演算法對字串進行轉換，生產該條資料的checksum，大多數情況checksum會比原始字串短，便於使用

3、百萬資料建議使用聚合比對轉步驟4，不使用聚合直接轉步驟6

4、對多條資料進行聚合，生成對對應checksum，用於批次資料校驗，加快校驗速度。

5、比對不同資料來源中的聚合checksum，找出不一樣的批次。

6、逐條比對（不一致批次內的）每一條記錄的checksum，找出不一致的資料

7、對不一致的資料進行同步處理

資料行checksum

1、使用concat函式將需要比對字串拼接成checkString

2、使用ifnull函式，因為當資料為null時，concat不生效

3、使用md5函式生成摘要字串，即checksum

select id,username,phone,sex,

concat(

ifnull(username,''),

ifnull(phone,''),

ifnull(sex,'')

) as check_str,

md5(

concat(

ifnull(username,''),

ifnull(phone,''),

ifnull(sex,'')

)

from t_user;

欄位拼接小技巧，快速獲取欄位的拼接sql,注意欄位排序，保證順序一致

select group_concat('ifnull(',column_name,','''')' order by ordinal_position asc )

from information_schema.columns

where table_schema = 'company' and table_name = 't_user'

聚合checksum

按照id大小進行分組統計

對單條checksum生成分組聚合的checksum

顯示每組的最大最小id和記錄數，便於比對和後續處理。

使用div進行分組，根據資料量多少進行調整

如果資料量百億，可以按照該方法進行多級聚合。

select

min(id) as minID,

max(id) as maxID,

count(1) as rowCnt,

md5(

group_concat(

md5(

concat(

ifnull(username,''),

ifnull(phone,''),

ifnull(sex,'')

)

order by id asc

)

) as checksum

from t_user

group by (id div 1000)

注意：表為空則不需要進行checksum，先判斷一下。

id必須是主鍵，唯一鍵可能為空。資料判斷可能出錯。

div的除數不能為0

==================== 雲資料庫校驗方法 ==============

例如：阿里雲RDS，百度雲RDS，騰訊雲RDS，華為雲RDS等。

都有對應的校驗工具。可表結構校驗，全量資料校驗。。

資料校驗
2024-08-01
[資料校驗/資料質量] 資料校驗框架(Java)：hibernate-validation
2023-11-10
框架Java
easypoi資料校驗
2020-10-27
Binding(四):資料校驗
2021-07-06
ORACLE資料校驗文件
2021-05-06
Oracle
行式填報資料校驗 --- 小計校驗
2020-03-30
struts2資料校驗
2018-07-16
JSR303 資料校驗
2020-07-17
JS
Hibernate資料校驗簡介
2021-11-25
前端資料校驗後，後端介面是否需要再次校驗？
2020-08-18
前端後端
前端資料校驗從建模開始
2018-08-30
前端
使用spring validation 作為資料校驗
2019-02-11
Spring
openGauss-資料校驗gs_datacheck
2024-08-29
WPF 資料繫結之ValidationRule資料校驗綜合Demo
2024-09-19
[Python]_[初級]_[校驗查詢sqlite3資料庫]
2020-11-30
PythonSQLite資料庫
前端與後端TP的資料校驗
2019-02-16
前端後端
.NET中特性＋反射實現資料校驗
2024-05-21
反射
使用@Validated校驗List集合中資料失效
2024-09-14
classloader實戰：如何不重啟校驗資料庫驅動連結
2018-06-06
資料庫
Bumpover.js – 牢固而趁手的資料校驗轉換庫
2019-02-28
JS
thinkphp validate unique 資料庫欄位唯一性校驗
2022-06-10
PHP資料庫
介面平臺實用功能設計分享——資料庫校驗
2020-12-18
資料庫
資料校驗---記一次讀取json配置資料，資料去重，去空
2019-03-25
JSON
SAP ABAP maintanence view的資料校驗機制
2020-03-04
AIView
Node 在 Controller 層如何進行資料校驗
2020-08-28
Controller
深入Spring官網系列（十七）：Java資料校驗
2020-10-30
SpringJava
.NET Attribute在資料校驗上的應用
2020-05-12
vxe-form table 表單使用資料校驗
2024-11-25
ORM
[C#.NET 拾遺補漏]09：資料標註與資料校驗
2020-10-09
C#
MySQL資料庫初體驗_gw
2020-12-26
MySql資料庫
整理SQL SERVER資料頁checksum校驗演算法
2019-08-07
SQLServer演算法
springBoot資料校驗與統一異常處理
2019-07-31
Spring Boot
皕傑報表之資料校驗與處理
2022-12-07
Django ModelForm中使用鉤子函式校驗資料
2020-12-29
DjangoORM函式
採用lua指令碼獲取mysql、redis資料以及jwt的校驗
2021-02-27
指令碼MySqlRedisJWT
2.4 一種基於kafka增量資料校驗的方案
2020-01-06
Kafka
Spring-Validation(後端資料校驗) 你值得擁有
2020-07-08
Spring後端
深度解析javaScript常見資料型別檢查校驗
2022-05-05
JavaScript資料型別

MySQL手動資料校驗+雲資料庫資料校驗

相關文章