SpringBoot整合Elasticsearch遊標查詢（scroll）

李鋒鏑發表於2020-10-16

原文網址 : https://www.cnblogs.com/lifengdi/p/13827262.html

遊標查詢（scroll）簡介

scroll 查詢可以用來對 Elasticsearch 有效地執行大批量的文件查詢，而又不用付出深度分頁那種代價。

遊標查詢會取某個時間點的快照資料。查詢初始化之後索引上的任何變化會被它忽略。它通過儲存舊的資料檔案來實現這個特性，結果就像保留初始化時的索引檢視一樣。

啟用遊標查詢可以通過在查詢的時候設定引數 scroll 的值為我們期望的遊標查詢的過期時間。遊標查詢的過期時間會在每次做查詢的時候重新整理，所以這個時間只需要足夠處理當前批的結果就可以了，而不是處理查詢結果的所有文件的所需時間。這個過期時間的引數很重要，因為保持這個遊標查詢視窗需要消耗資源，所以我們期望如果不再需要維護這種資源就該早點兒釋放掉。設定這個超時能夠讓 Elasticsearch 在稍後空閒的時候自動釋放這部分資源。

GET /old_index/_search?scroll=1m 
{
    "query": { "match_all": {}},
    "sort" : ["_doc"], 
    "size":  1000
}

scroll=1m：保持遊標查詢視窗一分鐘。

返回結果示例：

{
    "_scroll_id": "cXVlcnlUaGVuRmV0Y2g7NTsxMDk5NDpkUmpiR2FjOFNhNnlCM1ZDMWpWYnRROzEwOTk1OmRSamJHYWM4U2E2eUIzVkMxalZidFE7MTA5OTM6ZFJqYkdhYzhTYTZ5QjNWQzFqVmJ0UTsxMTE5MDpBVUtwN2lxc1FLZV8yRGVjWlI2QUVBOzEwOTk2OmRSamJHYWM4U2E2eUIzVkMxalZidFE7MDs=",
    "took": 10,
    "timed_out": false,
    "_shards": {
        "total": 5,
        "successful": 5,
        "failed": 0
    },
    "hits": {
        "total": 2633253,
        "max_score": 1.0,
        "hits": [
            {
                "_index": "old_index",
                "_type": "old_index_type",
                "_id": "1",
                "_score": 1.0,
                "_source": {
                    ...
                }
            }
        ]
    }
}

這個查詢的返回結果包括一個欄位 _scroll_id，它是一個base64編碼的長字串。現在我們能傳遞欄位 _scroll_id 到 _search/scroll 查詢介面獲取下一批結果：

GET /_search/scroll
{
    "scroll": "1m", 
    "scroll_id" : "cXVlcnlUaGVuRmV0Y2g7NTsxMDk5NDpkUmpiR2FjOFNhNnlCM1ZDMWpWYnRROzEwOTk1OmRSamJHYWM4U2E2eUIzVkMxalZidFE7MTA5OTM6ZFJqYkdhYzhTYTZ5QjNWQzFqVmJ0UTsxMTE5MDpBVUtwN2lxc1FLZV8yRGVjWlI2QUVBOzEwOTk2OmRSamJHYWM4U2E2eUIzVkMxalZidFE7MDs="
}

注意：需要再次設定遊標查詢過期時間為一分鐘。

這個遊標查詢返回下一批結果。

另外儘管我們指定欄位 size 的值為1000，但是我們有可能取到超過這個值數量的文件。當查詢的時候，欄位 size 作用於單個分片，所以每個批次實際返回的文件數量最大為 size * number_of_primary_shards。

注意：遊標查詢每次返回一個新欄位 _scroll_id。每次我們做下一次遊標查詢，我們必須把前一次查詢返回的欄位_scroll_id 傳遞進去。當沒有更多的結果返回的時候，我們就處理完所有匹配的文件了。

整合

新增以下三個方法：

/**
 * 遊標查詢
 * @param params 查詢入參
 * @param indexName 索引名稱
 * @param type 索引型別
 * @param defaultSort 預設排序
 * @param keyMappings 欄位對映
 * @param keyMappingsMap 索引對應欄位對映
 * @param scrollTimeInMillis 遊標開啟的時間
 * @return Page
 */
protected Page<Map> commonStartScroll(Map<String, String> params, String indexName, String type, String defaultSort,
                                 Map<Key, FieldDefinition> keyMappings,
                                 Map<String, Map<Key, FieldDefinition>> keyMappingsMap, long scrollTimeInMillis) {
    SearchQuery searchQuery = buildSearchQuery(params, indexName, type, defaultSort, keyMappings, keyMappingsMap);
    return elasticsearchTemplate.startScroll(scrollTimeInMillis, searchQuery, Map.class);
}

/**
 * 遊標查詢
 * @param scrollId 遊標ID
 * @param scrollTimeInMillis 遊標開啟的時間
 * @return Page
 */
protected Page<Map> commonContinueScroll(String scrollId, long scrollTimeInMillis) {
    return elasticsearchTemplate.continueScroll(scrollId, scrollTimeInMillis, Map.class);
}

/**
 * 根據遊標ID清除遊標（提早釋放資源，降低ES的負擔）
 * @param scrollId 遊標ID
 */
protected void clearScroll(String scrollId) {
    elasticsearchTemplate.clearScroll(scrollId);
}

StoreSearchService中增加遊標查詢方法以及清除遊標方法：

/**
 * 遊標查詢
 * @param params 查詢條件
 * @return page
 */
public Page<Map> scroll(Map<String, String> params) {
    IndexConfig config = indexEntity.getConfigByDocCode(DOC_CODE);

    // 如果請求引數包含遊標ID，則說明執行翻頁操作，否則認為開啟新的遊標查詢
    String scrollId = params.getOrDefault(SCROLL_ID, null);
    if (StringUtils.isNotBlank(scrollId)) {
        return commonContinueScroll(params.get(scrollId), config.getScrollTimeInMillis());
    }
    return commonStartScroll(params, config.getIndexName(), config.getType(), DEFAULT_SORT,
            keyMappings, keyMappingsMap, config.getScrollTimeInMillis());
}
public void clearScroll(String scrollId) {
    super.clearScroll(scrollId);
}

對外暴露介面：

@PostMapping("/scroll")
public ResponseResult scroll(@RequestBody Map<String, String> params) {

    return ResponseResult.success(storeSearchService.scroll(params));
}

@GetMapping("/scroll/clear/{scrollId}")
public ResponseResult clearScroll(@PathVariable String scrollId) {
    storeSearchService.clearScroll(scrollId);
    return ResponseResult.success(null);
}

遊標查詢分為開啟和繼續兩個步驟，介面/scroll中根據_scrollId判斷為開啟遊標查詢還是繼續遊標查詢。

若條件允許的話，儘量將遊標查詢及時關閉，以釋放ES叢集的資源，降低負擔。

原始碼

Git專案地址：https://github.com/lifengdi/search

如果覺得有幫助的話，請幫忙點贊、點星小小的支援一下~

謝謝~~

原文連結：https://www.lifengdi.com/archives/article/2119

ElasticSearch - 分頁查詢方式二【scroll】滾動查詢（kibana、Java示例）
2020-10-20
ElasticsearchJava
SpringBoot 整合 elasticsearch
2019-02-28
Spring BootElasticsearch
SpringBoot整合elasticsearch
2018-05-04
Spring BootElasticsearch
ElasticSearch 整合 SpringBoot
2020-11-13
ElasticsearchSpring Boot
遊標查詢
2020-03-31
ElasticSearch8 - SpringBoot整合ElasticSearch
2024-03-25
ElasticsearchSpring Boot
Elasticsearch學習（三）springboot整合ElasticSearch
2021-01-02
ElasticsearchSpring Boot
Elasticsearch查詢
2018-12-01
Elasticsearch
SpringBoot整合ElasticSearch7.6.2
2020-06-24
Spring BootElasticsearch
「Elasticsearch」SpringBoot快速整合ES
2020-12-07
ElasticsearchSpring Boot
Elasticsearch複合查詢——boosting查詢
2021-11-17
Elasticsearch
SpringBoot整合ElasticSearch（第八更）
2020-10-27
Spring BootElasticsearch
Elasticsearch 高亮查詢
2019-01-24
Elasticsearch
ElasticSearch DSL 查詢
2021-02-23
Elasticsearch
ElasticSearch7.3學習(二十二)----Text欄位排序、Scroll分批查詢場景解析
2022-05-08
Elasticsearch排序
Elasticsearch 按照標籤匹配個數優先排序查詢
2022-11-22
Elasticsearch排序
Elasticsearch學習＜四＞SpringBoot整合es
2020-12-10
ElasticsearchSpring Boot
elasticsearch的模糊查詢
2019-01-04
Elasticsearch
Elasticsearch 或並查詢
2019-01-24
Elasticsearch
Elasticsearch（三）：索引查詢
2020-10-21
Elasticsearch索引
elasticsearch之多索引查詢
2021-12-31
Elasticsearch索引
elasticsearch之exists查詢
2023-01-12
Elasticsearch
Elasticsearch 分頁查詢
2021-04-05
Elasticsearch
ElasticSearch的查詢（二）
2021-02-03
Elasticsearch
Elasticsearch中的Term查詢和全文查詢
2021-07-06
Elasticsearch
手把手教你SpringBoot整合Elasticsearch（ES）
2021-03-07
Spring BootElasticsearch
elasticsearch查詢之大資料集分頁查詢
2022-02-08
Elasticsearch大資料
SpringBoot2.x教程--整合使用jOOQ物件導向查詢
2021-05-11
Spring Boot物件
Elasticsearch 並或查詢 JSON
2019-04-04
ElasticsearchJSON
Elasticsearch系列---聚合查詢(一)
2020-04-02
Elasticsearch
Elasticsearch系列---聚合查詢原理
2020-04-17
Elasticsearch
Elasticsearch——filter過濾查詢
2019-02-19
ElasticsearchFilter
elasticSearch head 查詢報錯
2024-11-12
Elasticsearch
Elasticsearch 查詢與過濾
2021-03-13
Elasticsearch
Elasticsearch 複合查詢——多字串多欄位查詢
2021-03-14
Elasticsearch字串
SpringBoot整合ElasticSearch實現多版本的相容
2018-05-08
Spring BootElasticsearch
elasticsearch7.6.x 整合springboot2(一)
2020-05-05
ElasticsearchSpring Boot
將聚合新增到 Elasticsearch 查詢
2024-05-17
Elasticsearch

SpringBoot整合Elasticsearch遊標查詢（scroll）

遊標查詢（scroll）簡介

整合

原始碼

相關文章