自然語言處理工具hanlp定製使用者詞條

adnb34g發表於2019-05-20


作者: baiziyu

關於 hanlp的文章已經分享過很多,似乎好像大部分以理論性的居多。最近有在整理一些hanlp應用專案中的文章,待整理完成後會陸續分享出來。本篇分享的依然是由baiziyu 分享的一篇文章,感興趣的可以在知乎上關注下他的專欄,寫的還是挺好的!

以下為文章的主要內容:

自定義詞表的修改

自定義詞表在 “pyhanlp\static\data\dictionary\custom”路徑下的“CustomDictionary.txt”檔案中,HanLP.segment支援自定義此詞表。如果需要修改自定義詞表,則直接編輯檔案“CustomDictionary.txt”,之後刪除路徑下的“CustomDictionary.txt.bin”,執行分詞程式碼後即可自動生效。

驗證修改是否生效

 

驗證程式碼

from pyhanlp import *

term_list = HanLP.segment(text)

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2644895/,如需轉載,請註明出處,否則將追究法律責任。

相關文章