ES 筆記四十一：聚合的精準度問題

ES筆記四十一：聚合的精準度問題

在Terms Aggregation的返回中有兩個特殊的數值
- doc_count_error_upper_bound：被遺漏的term分桶，包含的文件，有可能的最大值
- sum_other_doc_count:處理返回結果bucket的terms以外，其他terms的文件總數（總數-返回的總數）

ES筆記四十一：聚合的精準度問題

Terms 聚合分析不準的原因，資料分散在多個分片上，Coordinating Node 無法獲取資料全貌
解決方案1：當資料量不大時，設定Primary Shard 為1；實現準確性
解決方案2：在分散式資料上，設定shard_size 引數，提高精確度
- 原理：每次從Shard 上額外多獲取資料，提升準確率

ES 筆記四十一：聚合的精準度問題

ES筆記四十一：聚合的精準度問題

調整 shard size 大小，降低 doc_count_error_upper_bound 來提升準確度
- 增加整體計算量，提高了準確率，但會降低相應時間

Shard Size 預設大小設定

shard size = size * 1.5 +10

GET kibana_sample_data_flights/_search
{
"size": 0,
"aggs": {
"weather": {
  "terms": {
    "field":"OriginWeather",
    "size":5,
    "show_term_doc_count_error":true
  }
}
}
}
GET my_flights/_search
{
"size": 0,
"aggs": {
"weather": {
  "terms": {
    "field":"OriginWeather",
    "size":1,
    "shard_size":1,
    "show_term_doc_count_error":true
  }
}
}
}

https://www.elastic.co/guide/en/elasticsea...

本作品採用《CC 協議》，轉載必須註明作者和本文連結

快樂就是解決一個又一個的問題！

Django筆記四十一之Django中使用es
2023-11-19
Django筆記
es筆記六之聚合操作之指標聚合
2023-11-12
筆記指標
ES 筆記十五：聚合分析簡介
2019-10-30
筆記
ES 筆記三十九：Pipeline 聚合分析
2019-12-30
筆記
es筆記七之聚合操作之桶聚合和矩陣聚合
2023-11-17
筆記矩陣
ES 筆記四十：聚合的作用範圍及排序
2020-01-02
筆記排序
ES 筆記三十八：Bucket & Metric 聚合分析及巢狀聚合
2019-12-28
筆記巢狀
ES[7.6.x]學習筆記（十）聚合查詢
2020-05-26
筆記
MongoDB的聚合筆記
2023-12-10
MongoDB筆記
Es資料彙總不準確的問題
2021-12-27
《不測的祕密：精準測試之路》筆記
2020-10-10
筆記
ES筆記
2019-04-03
筆記
Elasticsearch聚合學習之五：排序結果不準的問題分析
2022-09-19
Elasticsearch排序
ES的優化筆記
2021-07-25
優化筆記
使用 ES6 Proxy 代理的 this 問題記錄
2018-12-04
簡單介紹Pygame 精準檢測影像碰撞的問題
2022-07-11
GAM
ES資料聚合
2024-10-18
C# Thread.Sleep 不精準的問題以及解決方案
2022-05-09
C#thread
es6筆記
2020-02-05
筆記
ES6--ES12筆記整理（1）
2021-11-18
筆記
ES6的學習筆記
2019-01-08
筆記
配置Mysql Group Replication遇到的問題筆記
2018-07-23
MySql筆記
吳恩達《Machine Learning》精煉筆記 3：迴歸問題和正則化
2021-01-14
吳恩達Mac筆記
ES 筆記五：倒排索引
2019-10-14
筆記索引
筆記：JavaScript ES6
2024-09-06
筆記JavaScript
記錄一下寫gulp遇到的ES6問題
2018-12-01
IP地址定位的精準度都要看哪些指標？
2020-12-19
指標
Django筆記十六之aggregate聚合操作
2023-04-05
Django筆記
[筆記]（更新中）最短路問題的變形
2024-11-27
筆記
利用 Arthas 精準定位 Java 應用 CPU 負載過高問題
2020-06-11
Java負載
提高專案預算精準度的關鍵步驟
2024-10-30
es6，es7的一些語法（筆記）
2018-03-15
筆記
ES學習筆記(11)--ES6中物件
2018-10-16
筆記物件
es筆記一之es安裝與介紹
2023-05-18
筆記
Python連線es筆記三之es更新操作
2023-04-21
Python筆記
用筆記來記錄遇到的問題：釋出版本和非釋出版本遇到的問題
2024-09-16
筆記
es6學習筆記
2024-03-20
筆記
ES 筆記三：基本概念
2019-10-12
筆記

ES 筆記四十一：聚合的精準度問題

相關文章