謂詞下推:計算和儲存分開進行分析是低效的?
將計算和儲存分開進行分析是非常低效的,也許我們應該支援謂詞和投影下推到儲存?
謂詞下推predicate pushdown是指提取 where 子句條件並使用它們修剪您從磁碟讀取的資料的最佳化(從執行引擎“下推”到儲存層/引擎)。可以大幅減少 I/O、快取流失和/或網路 I/O。包括啟用 AI 的謂詞下推。
謂詞下推的名字來自於SQL語句的一部分,那些過濾資料的語句,被稱為謂詞。它們之所以被稱為謂詞,是因為數理邏輯中的謂詞和SQL中的子句是同一種東西:對於不同的變數或資料值,可以是真或假的語句。
它可以透過減少從儲存檔案讀取的資料量(I/O)來提高查詢效能。資料庫程式根據儲存檔案中的後設資料評估查詢中的過濾謂詞。
謂詞下推是如何幫助處理規模化資料的?
後設資料可以幫助儲存那些與讀有關的檔案。
如果你在一個地方發出一個查詢,針對在另一個地方的大量資料執行,你可能會產生大量的網路流量,這可能是緩慢而昂貴的。但是......。
......如果你能將部分查詢 "下推 "到資料儲存的地方,從而過濾掉大部分的資料,那麼你就能大大減少網路流量。
鑑於儲存後設資料,"向下推 "幫助我們決定哪些檔案是相關的,哪些是不相關的。
Apache Spark 已經支援謂詞下推用於 Apache Parquet 和 RDBMS。從 Apache Spark 3.1.1 開始,您還可以將它們用於 Apache Avro、JSON 和 CSV 格式!
相關文章
- 容器化RDS—— 計算儲存分離 or 本地儲存
- 大資料SQL中的Join謂詞下推,真的那麼難懂?大資料SQL
- 【大資料】SparkSql連線查詢中的謂詞下推處理(一)大資料SparkSQL
- 【大資料】SparkSql 連線查詢中的謂詞下推處理 (二)大資料SparkSQL
- 計算機儲存器的分類及其特性計算機
- 計算機儲存器的容量計算和地址轉換計算機
- 搜尋線上服務的儲存計算分離
- 計算儲存分離在訊息佇列上的應用佇列
- 計算機儲存器容量和定址能力的關係計算機
- 何謂“第五代儲存”?
- 使用SpringBoot JPA進行自定義的儲存及批量儲存Spring Boot
- 計算機補碼儲存計算機
- 使用SpringBoot-JPA進行自定義的儲存及批量儲存Spring Boot
- 計算機中的層次化儲存是個什麼鬼?計算機
- 雲端計算儲存之Ceph架構是怎麼樣的?架構
- C++謂詞C++
- 計算機中帶符號的整數為何採用二進位制的補碼進行儲存?計算機符號
- ElasticSearch中使用ik分詞器進行實現分詞操作Elasticsearch分詞
- 執行計劃-4:謂詞的選擇時機與使用細節
- 如何進行雲端儲存架構框架設計?架構框架
- 雲端計算儲存技術
- lumen cli日誌和普通日誌分開儲存
- 資料中臺的儲存系統和計算平臺列舉
- Redis如何儲存和計算一億使用者的活躍度Redis
- 什麼是行儲存和列儲存?正排索引和倒排索引?MySQL既不是倒排索引,也索引MySql
- 開發邊緣計算儲存策略的關鍵考慮因素
- Java 8謂詞鏈Java
- 03-NSPredicate謂詞
- [Android開源]EasySharedPreferences:優雅的進行SharedPreferences資料儲存操作Android
- IEEE為計算、儲存、控制和網路技術制定了霧計算標準
- 計算機的硬體系統儲存器計算機
- 儲存卡變為RAW,如何進行儲存卡資料救援
- 什麼是存算分離架構?架構
- 你真的知道計算機是如何進行減法運算的嗎?計算機
- 可計算儲存技術全面升級CSD 3000儲存體驗
- 行式儲存 列式儲存
- 計算儲存分離在京東雲訊息中介軟體JCQ上的應用
- 三分鐘入門 InnoDB 儲存引擎中的表鎖和行鎖儲存引擎