openGauss-智慧基數估計

MySQL成长之路發表於2024-08-29

openGauss- 智慧基數估計

可獲得性

本特性自openGauss 3.1.0版本開始引入。

特性簡介

智慧基數估計利用庫內輕量級演算法進行多列資料分佈建模,並且提供多列等值基數估計的能力。在資料分佈傾斜並且列之間相關性強的資料場景下能夠提供更準確的估計結果,從而給最佳化器提供準確的代價參考,提高計劃生成準確率,提高資料庫查詢執行效率。

客戶價值

透過本功能,使用者可以透過建立智慧統計資訊改善多列統計的準確率,從而提升查詢最佳化效能。

特性描述

智慧估計基數首先利用資料庫內資料樣本進行資料分佈建模,並且將模型壓縮儲存在資料庫中。最佳化器在執行計劃生成階段觸發智慧估計,實現對代價更精確的估計,並且生成更優的計劃。

特性增強

特性約束

  • 資料庫執行狀態良好,無資源緊張狀況。
  • 僅支援FLOAT8,Double Precision,FlOAT4,REAL,INT16,BIGINT,INTEGER,VARCHAR,CHARACTER VARYING,CHAR,CHARACTER,NUMERIC資料型別。
  • 僅支援不超過64列的查詢基數估計。
  • 為了保證系統效能,模型建立只利用一定量的資料樣本(最多200,000),如果資料過於稀疏,估計結果可能不準確。
  • 為了能夠充分利用有限的記憶體進行模型訪問加速,建議建立AI統計列數量不超過30個,否則可能會觸發記憶體替換。
  • 如果出現過長的變長字串型別資料,可能會影響基數估計模型建立和估計的效能。
  • 當前版本同時建立MCV和貝葉斯網路情況下,基數估計效能較低,不建議統計建立。

依賴關係

依賴於資料庫內的多列統計資訊建立語法和資料取樣演算法。

詳情檢視:https://opengauss.org

詳情檢視:https://docs-opengauss.osinfra.cn

相關文章