Elasticsearch bool query小結

NeoLu發表於2018-12-17
背景

最近有一個線上的es查詢問題,最後確定在使用bool query多條件組合查詢時出現should子句查詢失效,於是查詢資料來確定問題所在。

其中Elasticsearch: 5.5.0

問題

找到相關的查詢語句:

"query": {
    "bool": {     // bool query 查詢
      "should": [ // should子句
        {
          "match_phrase": {
            "name": {
              "query": "星起",
              "boost": 30,
              "slop": 5
            }
          }
        }
      ],
      "filter": { // #filter子句
        "bool": {
          "must": [
            {
              "terms": {
                "round": ["A輪"]
              }
            },
          ]
        }
      }
    }
  }
複製程式碼

問題在於:使用 bool query組合查詢時,shouldfilter 組合查詢的結果只匹配了filter子句,並不匹配should子句,達不到shouldfilter取交集的預期。

解決方法

翻了一下官方文件:Bool Query | Elasticsearch Reference [5.5] | Elasticshould的解釋:

The clause (query) should appear in the matching document. If the bool query is in a query context and has a must or filter clause then a document will match the bool query even if none of the should queries match. In this case these clauses are only used to influence the score. If thebool query is a filter context or has neither must or filter then at least one of the should queries must match a document for it to match the bool query. This behavior may be explicitly controlled by settings the minimum_should_match parameter.

大體的意思就是:should子句是在匹配文件中使用的,如果bool查詢是在query上下文,並且有must 或者 filter子句時不管should查詢是否匹配,都不影響must或者filter子句的查詢。這些子句只是影響查詢的score而已。如果bool查詢是在filter上下文 或者 既沒有must也沒有filter則應至少一個should查詢必須匹配bool查詢。也可以顯式設定minimum_should_match這個引數來解決。 從官方文件可以看出,有2種方式可以在bool query取各資料的交集:

  1. 將查詢的條件,移到filter上下文裡
  2. 使用設定minimum_should_match引數
解決方案

用上面提到2種方式,我們分別嘗試一下是否可以達到預期目標。

方案一

使用filter上下文:

"query": {
    "bool": {
      "filter": { // filter上下文
        "bool": {
          "should": [ // should子句
            {
              "match_phrase": {
                "name": {
                  "query": "星起",
                  "boost": 30,
                  "slop": 5
                }
              }
            }
          ],
          "filter": { // filter子句
            "bool": {
              "must": [
                {
                  "terms": {
                    "round": ["A輪"]
                  }
                }
              ]
            }
          }
        }
      }
    }
  }
複製程式碼

測試結果如下:

"hits": {
    "total": 1,
    "max_score": null,
    "hits": [
      {
        "_index": "index_name",
        "_type": "hub/product",
        "_id": "id",
        "_score": 0.0, // filter下分值為0.0
        "_source": {
          "round": "A輪",
          "name": "星起Starup",
          "created_at": "2015-12-25T22:20:36.210+08:00",
          "sector_name": "企業服務"
        },
        "highlight": {
          "name": ["<em>星起</em>Starup"]
        },
        "sort": []
      }
    ]
  }
複製程式碼

測試結果滿足shouldfilter子句交集,需要注意結果的分值為0.0, 沒有對查詢結果匹配程度打分。

方案二

使用minimum_should_match,至少匹配一項should子句,可以如下設定:

"query": {
    "bool": {     
      "should": [ // should 子句
        {
          "match_phrase": {
            "name": {
              "query": "星起",
              "boost": 30,
              "slop": 5
            }
          }
        }
      ],
      "minimum_should_match": 1, // 最少匹配一項should中條件子句
      "filter": { // filter子句
        "bool": {
          "must": [
            {
              "terms": {
                "round": ["A輪"]
              }
            },
          ]
        }
      }
    }
  }
複製程式碼

測試結果如下:

"hits": {
    "total": 1,
    "max_score": null,
    "hits": [
      {
        "_index": "index_name",
        "_type": "hub/product",
        "_id": "id",
        "_score": 757.66394,
        "_source": {
          "round": "A輪",
          "name": "星起Starup",
          "created_at": "2015-12-25T22:20:36.210+08:00",
          "sector_name": "企業服務"
        },
        "highlight": {
          "name": ["<em>星起</em>Starup"]
        },
        "sort": [757.66394]
      }
    ]
  }
複製程式碼

資料為shouldfilter子句的交集,符合預期的結果,並且有相應的匹配程度分值。

總結

從上面2種解決方案可以看出,Elasticsearch在查詢上還是比較靈活,平時除了需要熟悉官方的文件,還要結合業務的需求,才能找到正確解決問題的方法。

轉自:blog.lovecoding.org/2018/12/18/…

參考
  1. Bool Query | Elasticsearch Reference [5.5] | Elastic
  2. Boolean Operations and Filters in the Bool Query in Elasticsearch | Elastic
  3. ElasticSearch查詢

相關文章