Lucene學習一

raorq發表於2020-04-06
最近要用到全文檢索技術。
這個Lucene是個在java界有著很高聲譽的全文檢索包。
通過學習,自己對它算是有個初步瞭解。所以寫下心得與經驗跟朋友們分享。
對於整個網站的結構我說下我的看法
資料庫+前端技術+後臺處理技術。
上面的這些我就不說了。用來用去就是那幾個,你覺得那個用的順手就行了。

搜尋引擎技術呢,我覺得要點是:
1。把我們分散的資料資源整合起來-----對應於Lucene的Index也就是索引的意思。
我們把資料庫的資料,按照自己的方式進行索引,關於索引的技術可以上網檢視。這些索引的資料結構是可以自己定義的,這樣方便查詢。
2。 搜尋技術,因為我們的資源太分散了,就拿資料裡面的資源來說吧,每個表都不同,裡面的欄位都不同,如果單純採用資料庫來做的話,你可能要寫很多個api進 行搜尋。並對搜尋結果進行出裡,這樣我們就要自己做很多事情。這麼麻煩的話,我們何不把這些資料庫裡面的資料進行索呢,把我們需要的資料,歸類,整理,然 後儲存到索引中,雖然這樣會增加磁碟的容量,但我覺得這應該就不是問題。
對於搜尋技術,我們這裡又要涉及到關於分詞的技術,因為我們中文不同洋文,對分詞技術的要求比較高。在這裡,我也只是略微看了下Lucene的理論,具體實現,我也很模糊。如果分詞分的好,對於搜尋精度是有很大幫助的。

3。說實話索引就是一個資料庫。他可以更新,刪除,修改等。
先記錄下這麼多,以後在專案中實踐的時候,繼續說說我的理解
理解可能偏差比較大。大家不要被我誤導啊。

不錯的關於lucene英文書 點此下載

相關文章