自然語言處理工具hanlp自定義詞彙新增圖解
過程分析
1. 新增新詞需要確定無快取檔案,否則無法使用成功,因為詞典會優先載入快取檔案
2. 再確認快取檔案不在時,開啟本地詞典按照格式新增自定義詞彙。
3. 呼叫分詞函式重新生成快取檔案,這時會報一個找不到快取檔案的異常,不用管,因為載入詞典進入記憶體是會優先載入快取,快取不在當然會報異常,然後載入詞典生成快取檔案,最後處理字元進行分詞就會發現新新增的詞彙可以進行分詞了。
操作過程圖解:
1 、 有快取檔案的情況下 :
1 System.out.println(HanLP.segment(" 張三丰在一起我也不知道你好一個心眼兒啊,一半天歡迎使用 HanLP 漢語處理包! " +" 接下來請從其他 Demo 中體驗 HanLP 豐富的功能 ~"))
2
3 // 首次編譯執行時, HanLP 會自動構建詞典快取,請稍候……
4 //[ 張 /q, 三豐 /nz, 在 /p, 一起 /s, 我 /rr, 也 /d, 不 /d, 知道 /v, 你好 /vl, 一個心眼兒 /nz, 啊 /y, , /w, 一半天 /nz, 歡迎 /v, 使用 /v, HanLP/nx, 漢語 /gi, 處理 /vn, 包 /v, ! /w, 接下來 /vl, 請 /v, 從 /p, 其他 /rzv, Demo/nx, 中 /f, 體驗 /v, HanLP/nx, 豐富 /a, 的 /ude1, 功能 /n, ~/nx]
5
6
1. 開啟使用者詞典 –新增 ‘張三丰在一起’ 為一個 nz 詞性的新詞
2.2 原始快取檔案下執行–會發現不成功,沒有把 ‘張三丰在一起’ 分詞一個 nz 詞彙
1 System.out.println(HanLP.segment(" 張三丰在一起我也不知道你好一個心眼兒啊,一半天歡迎使用 HanLP 漢語處理包! " +" 接下來請從其他 Demo 中體驗 HanLP 豐富的功能 ~"))
2
3 // 首次編譯執行時, HanLP 會自動構建詞典快取,請稍候……
4 //[ 張 /q, 三豐 /nz, 在 /p, 一起 /s, 我 /rr, 也 /d, 不 /d, 知道 /v, 你好 /vl, 一個心眼兒 /nz, 啊 /y, , /w, 一半天 /nz, 歡迎 /v, 使用 /v, HanLP/nx, 漢語 /gi, 處理 /vn, 包 /v, ! /w, 接下來 /vl, 請 /v, 從 /p, 其他 /rzv, Demo/nx, 中 /f, 體驗 /v, HanLP/nx, 豐富 /a, 的 /ude1, 功能 /n, ~/nx]
5
3.1 刪除快取檔案 bin
3.2 再次執行程式,此時會報錯—無法找到快取檔案
1 System.out.println(HanLP.segment(" 張三丰在一起我也不知道你好一個心眼兒啊,一半天歡迎使用 HanLP 漢語處理包! " +" 接下來請從其他 Demo 中體驗 HanLP 豐富的功能 ~"));
2
3 /** 首次編譯執行時, HanLP 會自動構建詞典快取,請稍候……
4 十月 19, 2018 6:12:49 下午 com.hankcs.hanlp.corpus.io.IOUtil readBytes
5 WARNING: 讀取 D:/datacjy/hanlp/data/dictionary/custom/CustomDictionary.txt.bin 時發生異常 java.io.FileNotFoundException: D:\datacjy\hanlp\data\dictionary\custom\CustomDictionary.txt.bin ( 系統找不到指定的檔案。 ) 找不到快取檔案
6
7
8 [ 張三丰在一起 /nz, 我 /rr, 也 /d, 不 /d, 知道 /v, 你好 /vl, 一個心眼兒 /nz, 啊 /y, , /w, 一半天 /nz, 歡迎 /v, 使用 /v, HanLP/nx, 漢語 /gi, 處理 /vn, 包 /v, ! /w, 接下來 /vl, 請 /v, 從 /p, 其他 /rzv, Demo/nx, 中 /f, 體驗 /v, HanLP/nx, 豐富 /a, 的 /ude1, 功能 /n, ~/nx]
9
10 */
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2564943/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 自然語言處理工具hanlp關鍵詞提取圖解TextRank演算法自然語言處理HanLP圖解演算法
- HanLP 自然語言處理 for nodejsHanLP自然語言處理NodeJS
- NLP自然語言處理中的hanlp分詞例項自然語言處理HanLP分詞
- Hanlp自然語言處理中的詞典格式說明HanLP自然語言處理
- Hanlp自然語言處理工具之詞法分析器HanLP自然語言處理詞法分析
- 入門自然語言處理必看:圖解詞向量自然語言處理圖解
- 自然語言處理工具hanlp定製使用者詞條自然語言處理HanLP
- 自然語言處理工具HanLP-N最短路徑分詞自然語言處理HanLP分詞
- 配置Hanlp自然語言處理進階HanLP自然語言處理
- 自然語言處理:分詞方法自然語言處理分詞
- 開源自然語言處理工具包hanlp中CRF分詞實現詳解自然語言處理HanLPCRF分詞
- hanlp自然語言處理包的基本使用--pythonHanLP自然語言處理Python
- python呼叫自然語言處理工具hanlp記錄Python自然語言處理HanLP
- Hanlp自然語言處理工具的使用演練HanLP自然語言處理
- 自然語言處理之jieba分詞自然語言處理Jieba分詞
- 詞!自然語言處理之詞全解和Python實戰!自然語言處理Python
- 如何編譯執行HanLP自然語言處理包編譯HanLP自然語言處理
- 自然語言處理工具包HanLP的Python介面自然語言處理HanLPPython
- 中文自然語言處理工具hanlp隱馬角色標註詳解自然語言處理HanLP
- 自然語言處理NLP(6)——詞法分析自然語言處理詞法分析
- 自然語言處理工具python呼叫hanlp的方法步驟自然語言處理PythonHanLP
- 自然語言處理入門基礎之hanlp詳解自然語言處理HanLP
- hanlp自然語言處理包的人名識別程式碼解析HanLP自然語言處理
- Spring Boot中對自然語言處理工具包hanlp的呼叫詳解Spring Boot自然語言處理HanLP
- 自然語言處理工具python呼叫hanlp中文實體識別自然語言處理PythonHanLP
- 自然語言處理工具pyhanlp分詞與詞性標註自然語言處理HanLP分詞詞性標註
- NPL---自然語言處理單詞界定問題自然語言處理
- Pyhanlp自然語言處理中的新詞識別HanLP自然語言處理
- 自然語言處理之:搭建基於HanLP的開發環境自然語言處理HanLP開發環境
- 自然語言處理(NLP)路線圖 - kdnuggets自然語言處理
- 自然語言處理中的分詞問題總結自然語言處理分詞
- Python 自然語言處理(基於jieba分詞和NLTK)Python自然語言處理Jieba分詞
- 12 種自然語言處理的開源工具自然語言處理開源工具
- 自然語言處理工具包 HanLP在 Spring Boot中的應用自然語言處理HanLPSpring Boot
- 自然語言處理工具HanLP-基於層疊HMM地名識別自然語言處理HanLPHMM地名識別
- 自然語言處理工具hanlp 1.7.3版本更新內容一覽自然語言處理HanLP
- 自然語言處理(NLP)系列(一)——自然語言理解(NLU)自然語言處理
- 中文自然語言處理工具集:分詞,相似度匹配自然語言處理分詞