07.full text query_string查詢

夜月行者發表於2020-10-25

1. query string簡介

GET /_search
{
    "query": {
        "query_string" : {
            "default_field" : "content",
            "query" : "this AND that OR thus"
        }
    }
}

query_string查詢分析輸入內容並在運算子周圍拆分文字。每個文字部分彼此獨立地進行分析。例如以下查詢:
如果不指定default_field的話,則預設會在(當前index,如果制定了index的話)所有可以查詢的欄位中進行查詢

GET /_search
{
    "query": {
        "query_string" : {
            "default_field" : "content",
            "query" : "(new york city) OR (big apple)" 
        }
    }
}

2. multi field 多欄位查詢

GET /_search
{
    "query": {
        "query_string" : {
            "fields" : ["content", "name"],
            "query" : "this AND that"
        }
    }
}

等價於


GET /_search
{
    "query": {
        "query_string": {
            "query": "(content:this OR name:this) AND (content:that OR name:that)"
        }
    }
}

由於從單個搜尋項生成了多個查詢,因此使用dis_max帶有tie_breaker 的查詢自動組合它們。例如(name使用^5符號表示增強5 ):

GET /_search
{
    "query": {
        "query_string" : {
            "fields" : ["content", "name^5"],
            "query" : "this AND that OR thus",
            "tie_breaker" : 0
        }
    }
}

簡單萬用字元也可用於搜尋文件的特定內部元素“內”。例如,如果我們有一個city包含多個欄位(或帶有欄位的內部物件)的物件,我們可以自動搜尋所有“城市”欄位:

GET /_search
{
    "query": {
        "query_string" : {
            "fields" : ["city.*"],
            "query" : "this AND that OR thus"
        }
    }
}

另一種選擇是在查詢字串本身中提供萬用字元欄位搜尋(正確轉義*符號),例如 city.*:something:

GET /_search
{
    "query": {
        "query_string" : {
            "query" : "city.\\*:(this AND that OR thus)"
        }
    }
}

由於\(反斜槓)是json字串中的特殊字元,因此需要對其進行轉義,因此上面的兩個反斜槓query_string

3. query string 的語法

這個有點類似於高階語義了,在kibana的對應的框中能夠使用對應lucene語法,使用的就是query string的語法,也就是query_string對應的query字串還可以有一些語法來支援更加靈活的查詢。

1. 在query中查詢其他特定的欄位

查詢status field中包含 active的doc
status:active

查詢title中包含quick 或者 brown的doc
title:(quick OR brown)

查詢author欄位包括短語"john smith" 的doc
author:“John Smith”

如果field name中有空格的話要用反斜槓包裹
first\ name:Alice

比如 book.title, book.content or book.date 這些field 包含 quick 或者 brown (*號要使用反斜槓轉義):
book.*:(quick OR brown)

判斷field存在
exists:title

2. 萬用字元

萬用字元搜尋可以在單個term上執行,使用?替換單個字元,並*替換零個或多個字元:

qu?ck bro*


3. 正規表示式

正規表示式模式可以通過將它們包裝在forward-slashes("/")中嵌入查詢字串中:

name:/joh?n(ath[oa]n)/

4. 模糊匹配

quikc~ brwn~ foks~

quikc~1 編輯距離是1

5. 臨近匹配

proximity searches

"fox quick"~5

這個編輯距離和上面的模糊匹配的不一樣,模糊匹配的是針對單個term詞的字元級別的編輯距離,這裡的編輯距離是word級別的編輯距離。所以詞出現的順序也可以是不同的。

“quick fox” 會被認為比 “quick brown fox” 更相關。

5. range範圍

date在2012年內
date:[2012-01-01 TO 2012-12-31]

date在2012之前
date:{* TO 2012-01-01}

數字count在1-5中間
count:[1 TO 5]

數字count在10以上
count:[10 TO *]

不包括5
count:[1 TO 5}

還可以使用下面的語法

age:>10
age:>=10
age:<10
age:<=10

age:(>=10 AND <20)
age:(+>=10 +<20)

相關文章