六十四、Elasticsearch核心原理-再談倒排索引

weixin_34050427發表於2017-07-12

1、倒排索引,是適合用於進行搜尋的

2、倒排索引的結構
(1)包含這個關鍵詞的document list

(2)包含這個關鍵詞的所有document的數量:IDF(inverse document frequency)

(3)這個關鍵詞在每個document中出現的次數:TF(term frequency)

(4)這個關鍵詞在這個document中的次序

(5)每個document的長度:length norm

(6)包含這個關鍵詞的所有document的平均長度

3、倒排索引不可變的好處

(1)不需要鎖,提升併發能力。避免鎖的問題

(2)資料不變,一直儲存在os cache中,只要cache記憶體足夠

(3)filter cache一直駐留在記憶體,因為資料不變

(4)可以壓縮,節省CPU和IO開銷

4、倒排索引不可變的壞處

每次都要重新構建整個索引。

若有興趣,歡迎來加入群,【Java初學者學習交流群】:458430385,此群有Java開發人員、UI設計人員和前端工程師。有問必答,共同探討學習,一起進步!
歡迎關注我的微信公眾號【Java碼農社群】,會定時推送各種乾貨:


4582242-ca4a357ae859b1aa.jpg
qrcode_for_gh_577b64e73701_258.jpg

相關文章