solr研磨之facet

動物園裡的一隻程式猿發表於2018-05-03

作者:戰鬥民族就是幹

轉載請註明地址:http://www.cnblogs.com/prayers/p/8822417.html

 

Facet  

開門見山,facet解決的就是篩選,我是把它理解為一種聚合。

  例如,商品屬性中的品牌名稱。例如:搜尋召回了100個sku,這100個sku裡面包含在20個品牌裡面,那我如何聚合出這20個品牌呢?solr給我們提供了強大的API,facet,基本用例如下

http://localhost:8080/solr/b2b/select?q=*:*&wt=json&indent=true&facet=true&facet.field=brandName

  這裡需要注意的是:如果brandName配置了分詞器,facet的結果是對域的域值分詞後得到的每一個唯一的詞進行分組統計。

  facet不僅僅可以支援單值域的分組統計,還支援多值域,文字域,嵌入式facet的統計。需要注意的是:在進行文字域的facet的時候大量的噪音詞會影響你返回的結果,這時候需要對文字域配置停用詞過濾器

  還有一種情況,比如說品牌名稱,我既需要查詢做分詞處理,又需要進行facet統計。但是分詞後facet的結果並不是我想要的,我想要的是不做分詞處理的facet的結果。這個時候我們可以使用複製域CopyField,將品牌名稱作為一個新域,並且是域的型別是StringFilter。copyField使用用例如下:  

<copyField  source="brandName"  dest="copyBrandName"  maxChars="30000" />

source:需要拷貝的域名稱

dest:被拷貝的域名稱

maxChars:限制複製的字元數

  單個域的facet用例如下  

http://localhost:8080/solr/b2b/select?q=*:*&wt=json&indent=true&facet=true&facet.field=brandName

  多個域的facet用例如下  

http://localhost:8080/solr/b2b/select?q=*:*&wt=json&indent=true&facet=true&facet.pivot=brandCode,brandName

  區間facet

http://localhost:8080/solr/b2b/select?q=*%3A*&wt=json&indent=true&facet=true&facet.range=price&facet.range.gap=10&facet.range.start=0&facet.range.end=10000

  facet.range:表示對那個域執行facet區間查詢,facet.range.start表示區間的上限值,facet.range.end表示區間的下限值,facet.range.gap:引數按照每個區間分佈多少個值進行自動區間劃分

 

相關文章