從資料庫設計到效能調優，全面掌握openGemini應用開發最佳實踐

华为云开发者联盟發表於2024-06-04

原文網址 : https://www.cnblogs.com/huaweiyun/p/18230132

本文分享自華為雲社群《DTSE Tech Talk × openGemini ：從資料庫設計到效能調優，全面掌握openGemini應用開發最佳實踐》，作者：華為雲開源。

在本期《從資料庫設計到效能調優，全面掌握openGemini應用開發最佳實踐》的主題直播中，華為雲開源DTSE技術佈道師&openGemini社群發起人Shawn，透過解析資料庫應用開發的一般流程與開發者們分享了熟悉業務場景是做好資料庫設計的關鍵這一重要觀點，並分別向大家介紹了openGemini庫和表設計、資料寫入、資料查詢的最佳實踐，希望能讓開發者們從優秀實踐中獲得新的啟發和提升。

熟悉業務場景是做好資料庫設計的關鍵

任何資料庫都不是萬能的，熟悉業務場景是做好資料庫設計非常關鍵的一環，同時，當了解清楚業務場景再去做資料庫選型時會給你帶來很大的幫助。做資料庫選型之前，大家可以按照以下8條去做細緻的評估：

資料分類
應用分類
採集頻率(s)
時間線評估
每分鐘寫入資料量
採集的指標
業務查詢場景
資料保留週期

從資料庫設計到效能調優，全面掌握openGemini應用開發最佳實踐

openGemini庫和表設計最佳實踐

當把業務場景都瞭解清楚過後，便可以做庫和表的設計了。Shard是openGemini的資料分片概念，openGemini支援shard延時載入，也就有了有活動shard和歷史shard的區別。每個shard有自己的索引和快取，增加DB，或者增加RP，都會增加同等數量的shard，也就增大了資料處理的併發度。個人建議在使用openGemini時採用多個庫，適度增加DB數量，有利於系統資源得到充分利用，並提升效能。

當機器規格一定時，支援的shard數量是有上限的
粗略的評估方法：shard數量 <= 總量記憶體 * 0.25 / 60M
Shard數量受本地磁碟效能限制，因為不同shard之間存在磁碟頻寬和I/O的競爭。

從資料庫設計到效能調優，全面掌握openGemini應用開發最佳實踐

shard或表過多，容易對系統效能造成影響：

DB/RP越多，shard越多，佔用記憶體資源會越大，磁碟I/O競爭越大
表越多，資料檔案越多，佔用作業系統控制代碼資源越多
Shard和表越多，後設資料越多，ts-sql和ts-store與ts-meta之間同步後設資料時延大，會造成資料讀寫效能波動

表的設計原則：

建表要結合查詢場景做綜合考慮
建表要充分考慮指標列數量，大於1000列，建議開始分表

openGemini資料寫入最佳實踐

現在跟大家分享一下客戶端寫資料最佳實踐的注意事項：

客戶端批次寫入，減少網路互動
客戶端併發寫入，確保多批次資料之間時間線不存在交叉，減少亂序資料的產生
BatchSize指一次批次寫入的資料大小，需多次實驗，找到最為合適的值
ts-sql併發分發資料能力是一定的，增加sql數量才能處理更多資料
寫入併發比較大的情況下，可以適當減小BatchSize，否則ts-store容易造成資料堆積

從資料庫設計到效能調優，全面掌握openGemini應用開發最佳實踐寫效能的核心引數調優：正常情況下，業務的寫QPS是趨於穩定的，當出現比較大的波動時，引起原因可能是：資料量增大導致wal時延增加、磁碟IO瓶頸、資料快取堆積、Compaction阻塞等。

openGemini資料查詢最佳實踐

時間線比較多時（百萬以上），如下查詢場景要慎用，可能引發程序OOM：

全量時間線掃描，無TAG過濾
海量分組：TAG+Time | 細粒度Time
海量資料在ts-sql聚合場景（除first/last/count/sum/mean/min/max外）
海量時間線查詢, tag1=xxx 可能對應百萬時間線

從資料庫設計到效能調優，全面掌握openGemini應用開發最佳實踐

openGemini 查詢語句使用Tips：

1、查詢返回的資料量比較多時，推薦新增查詢引數：chunked=true&chunk_size=1000 ，可分批流式返回

例如：

curl -XPOST 'http://localhost:8086/query?db=mydb& chunked=true & chunk_size=1000 ' --data-urlencode 'q=SELECT * FROM mst'

2、在openGemini叢集中，一條時間線資料只屬於一個資料節點，因此在做簡單查詢時，可以使用Hint查詢，直接定位到具體資料節點查詢資料。

語法： /*+ full_series */

約束：查詢條件必須包含所有的TAG

例如:

SELECT /*+ full_series */ mean(C) FROM mst WHERE A=“a1” AND B=“b1” AND time > xxx AND time < xxx

3、巢狀查詢要遵循的原則：處在最裡層的子查詢儘可能透過TAG或者時間過濾資料，減少結果資料總量

例如：

SELECT * FROM
(SELECT temperature FROM disk_temp_monitor WHERE time > xxx AND time < xxx AND nd=“xxx” AND disk_type = SATA_HDD )
WHERE disk_type = SATA_HDD GROUP BY * LIMIT 1000

本次分享到這裡就結束了，openGemini社群旨在打造開放、合作、包容的全球性技術社群，歡迎大家試用openGemini時序資料庫，加入開源社群。

openGemini開源地址：https://github.com/openGemini

openGemini官網地址：https://opengemini.org

從資料庫設計到效能調優，全面掌握openGemini應用開發最佳實踐

openGemini是一款開源分散式時序資料庫，主要聚焦於海量時序資料的儲存和分析，透過技術創新，簡化業務系統架構，降低儲存成本，提升時序資料的儲存和分析效率。

HDC 2024，6月21日-23日，東莞松山湖，期待與您相見！

更多詳情請參見大會官網：

中文：https://developer.huawei.com/home/hdc

英文：https://developer.huawei.com/home/en/hdc

點選關注，第一時間瞭解華為雲新鮮技術~

掌握Oracle資料庫效能調優方法
2022-05-01
Oracle資料庫
Java 應用效能調優最強實踐指南！
2019-07-05
Java
資料庫設計的十個最佳實踐
2021-11-26
資料庫
TiDB 效能分析&效能調優&最佳化實踐大全
2022-06-20
TiDB
資料庫效能調優之始： analyze統計資訊
2021-01-25
資料庫
HarmonyOS：應用效能最佳化實踐
2024-10-30
HBase資料庫效能調優OW
2022-03-21
資料庫
資料庫設計中的6個最佳實踐步驟
2019-03-03
資料庫
璞華AI大模型應用的探索之路：從AI大模型開發與運營平臺到應用寶庫的最佳實踐
2024-11-01
AI大模型
效能優化資料庫篇-從單機到叢集
2021-07-18
優化資料庫
Hive效能調優實踐 - Vidhya
2022-02-20
Hive
DevOps最佳實踐之應用開發和部署
2022-12-30
dev
Kubernetes 資料儲存：從理論到實踐的全面指南
2024-05-21
新興資料倉儲設計與實踐手冊：從分層架構到實際應用（二）
2024-11-20
架構
新興資料倉儲設計與實踐手冊：從分層架構到實際應用（三）
2024-11-27
架構
TiDB 效能分析&效能調優&優化實踐大全
2022-06-20
TiDB優化
線上Redis高併發效能調優實踐
2020-09-28
Redis
.NET雲原生應用實踐（三）：連線到PostgreSQL資料庫
2024-10-22
SQL資料庫
軟體效能測試分析與調優實踐之路-Java應用程式的效能分析與調優-手稿節選
2022-03-01
Java
Agent 工具開發指南：從設計到最佳化
2024-11-19
2022 前端效能優化最佳實踐
2022-04-25
前端優化
PHP最佳實踐之資料庫
2019-02-16
PHP資料庫
從頁面載入到資料請求，前端頁面效能優化實踐分享
2021-07-14
前端優化
【譯】React 應用效能調優
2019-03-03
React
從設計到程式碼：探索高效的前端開發工具與實踐
2024-09-28
前端
Supercell開發分享：從創意到最佳遊戲設計
2022-05-30
遊戲設計
Linux效能調優從最佳化思路說起
2020-09-01
Linux
HBase最佳實踐－讀效能優化策略
2018-12-28
優化
資料庫安全最佳實踐：基本指南
2021-10-31
資料庫
資料庫例項效能調優利器：Performance Insights
2019-10-08
資料庫ORM
TypeScript 資料模型層程式設計的最佳實踐
2018-06-30
TypeScript模型程式設計
鴻蒙Next應用介面設計：國際化最佳實踐
2024-11-02
鴻蒙
SpringBoot優雅開發REST API最佳實踐
2024-08-13
Spring BootRESTAPI
Spark效能最佳化篇三：資料傾斜調優
2021-09-09
Spark
十分鐘初步掌握Oracle資料庫效能調優的常見場景與方法
2022-04-13
Oracle資料庫
資料庫調優
2018-03-12
資料庫
應用開發實踐之關係型資料庫(以MySql為例)小結
2020-05-04
資料庫MySql
Hive常用效能優化方法實踐全面總結
2021-01-25
Hive優化

從資料庫設計到效能調優，全面掌握openGemini應用開發最佳實踐

熟悉業務場景是做好資料庫設計的關鍵

openGemini庫和表設計最佳實踐

openGemini資料寫入最佳實踐

openGemini 查詢語句使用Tips：

相關文章