solr8.6.2 客戶端介面介紹及配置中文分詞器

HuDu發表於2020-11-13

啟動solr服務
訪問http://localhost:8080/solr/index.html

solr8.6.2 客戶端介面介紹

  • Dashboard:儀表盤,顯示了該 solr 例項開始啟動執行的時間,版本,系統資源,jvm等資訊。

  • Logging:顯示 solr 執行出現的異常或錯誤

  • Core Admin:Solr Core的管理介面,可以新增SolrCore例項。

solr8.6.2 客戶端介面介紹

主要有Add Core(新增核心),Unload(解除安裝和興),Rename(重新命名),Reload(重新載入核心),Optimize(優化索引)

Add Core是新增core:主要是在instanceDir對應的資料夾裡生成一個core.properties檔案

name:給core起名字

instanceDir:與我們在配置solr到tomcat裡時的solrhome裡新建的core資料夾名一致

dataDir:確認Add Core時,會在collection1目錄下生成名為data的資料夾

config:collection1下的conf下的config配置檔案(solrconfig.xml)

schema:collection1下的schema檔案(schema.xml)
  • Java Properties:solr在JVM執行環境中的屬性資訊,包括類路徑、檔案編碼、jvm記憶體設定等資訊。可檢視到java相關的一些屬性的資訊。

solr8.6.2 客戶端介面介紹

  • Thread Dump:顯示Solr Sever中當前活躍執行緒資訊,同時也可以跟蹤執行緒執行棧資訊。

  • Core selector(重點)

    • Analysis(重點):此介面可以測試索引分詞器和搜尋分詞器的執行情況
      solr8.6.2 客戶端介面介紹
    • Dataimport:可以定義資料匯入處理器,從關聯式資料庫將資料匯入到Solr索引庫中。預設沒有配置,需要手動配置
    • Document:通過/update表示更新索引,solr預設根據id(唯一約束)域來更新Document的內容,如果根據id值搜尋不到id域,則會執行新增操作,如果找到則更新,通過此選單可以建立索引、更新索引、刪除索引等操作
    • Query(重點):通過/select執行搜尋索引,必須指定“q”查詢條件方可搜尋。
      solr8.6.2 客戶端介面介紹

配置中文分詞器

配置 solr8 自帶分詞器

找到solr-8.6.2\contrib\analysis-extras\lucene-libs下的這個jar包,複製到配置的tomcat的webapps\solr\WEB-INF\lib目錄下
solr8.6.2 客戶端介面介紹

solr8.6.2 客戶端介面介紹

然後配置配置檔案,在solrhome的配置的管理員目錄下,我這裡是solrhome\demo_core\conf目錄下的managed-schema檔案。

solr8.6.2 客戶端介面介紹

在檔案中新增如下配置
solr8.6.2 客戶端介面介紹

<!-- ChineseAnalyzer 自帶的中文分詞器 -->
<fieldType name="solr_cnAnalyzer" class="solr.TextField" positionIncrementGap="100">
    <analyzer type="index">
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
    <analyzer type="query">
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
</fieldType>

配置ik分詞器

先下載solr8版本的ik分詞器,下載地址:search.maven.org/search?q=com.gith...
分詞器GitHub原始碼地址:github.com/magese/ik-analyzer-solr

下載jar包

solr8.6.2 客戶端介面介紹及配置中文分詞器

將jar包拷貝到tomcat\webapps\solr\WEB-INF\lib

solr8.6.2 客戶端介面介紹及配置中文分詞器

然後到solrhome\demo_core\conf目錄下配置managed-schema檔案
在配置檔案中加入以下程式碼:

<!-- ik分詞器 -->
<fieldType name="text_ik" class="solr.TextField">
    <analyzer type="index">
        <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
        <filter class="solr.LowerCaseFilterFactory"/>
    </analyzer>
    <analyzer type="query">
        <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true"     conf="ik.conf"/>
        <filter class="solr.LowerCaseFilterFactory"/>
    </analyzer>
</fieldType>

測試

啟動 solr,測試一下剛剛配置的中文分詞器。

solr8.6.2 客戶端介面介紹

solr8.6.2 客戶端介面介紹及配置中文分詞器

本作品採用《CC 協議》,轉載必須註明作者和本文連結

相關文章