自然語言處理工具python呼叫hanlp中文實體識別
Hanlp作為一款重要的中文分詞工具,在GitHub的使用者量已經非常之高,應該可以看得出來大家對於hanlp這款分詞工具還是很認可的。本篇繼續分享一篇關於hanlp的使用例項即Python呼叫hanlp進行中文實體識別。
想要在 python中呼叫hanlp進行中文實體識別,Ubuntu 16.04的系統環境
1.安裝jpype1,在cmd視窗輸入
pip install jpype1
2.下載hanlp的安裝包
在
( 1)下載新的 hanlp-1.7.1-release.zip檔案,裡面包含hanlp-1.7.1.jar , hanlp-1.7.1-sources.jar , hanlp.properties
( 2)點選data-for-1.7.1.zip下載。(底下第8條)
注:如果你在 點選下載hanlp.jar,下載下來的是hanlp-1.2.8.jar。之後在使用過程中可能會出現“字元型別對應表載入失敗”的錯誤,檢視相應路徑下也沒有CharType.dat.yes檔案。原因可能是hanlp-1.2.8版本過低,使用新版本應該不會出現這個問題。
3.新建一個資料夾Hanlp,放檔案hanlp-1.7.1.jar和hanlp.properties檔案
新建一個資料夾 hanlp,放data-for-1.7.1.zip解壓後的檔案
配置 hanlp.properties中的第一行的root為hanlp資料夾的位置,也就是data-for-1.7.1.zip解壓後的檔案放的位置。
4.寫py檔案呼叫hanlp進行中文分析。
用法可參考這個部落格 blog.csdn.net/u011961856/article/details/77167546。
另,檢視 HanLP關於實體識別的文件
裡面介紹說中文人名標註為 “nr”,地名標註為“ns”,機構名標註為“nt”,所以使用用法參考連結裡的NLPTokenizer.segment就可以標註出中文句子中的人名,地名和機構名。
比較使用 jieba進行詞性標註時,也可以標註出中文句子中的人名,地名和機構名。jieba分詞的詞性說明:
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2629870/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- python呼叫自然語言處理工具hanlp記錄Python自然語言處理HanLP
- 自然語言處理工具python呼叫hanlp的方法步驟自然語言處理PythonHanLP
- hanlp自然語言處理包的人名識別程式碼解析HanLP自然語言處理
- HanLP 自然語言處理 for nodejsHanLP自然語言處理NodeJS
- hanlp自然語言處理包的基本使用--pythonHanLP自然語言處理Python
- 配置Hanlp自然語言處理進階HanLP自然語言處理
- 自然語言處理工具HanLP-基於層疊HMM地名識別自然語言處理HanLPHMM地名識別
- 自然語言處理工具包HanLP的Python介面自然語言處理HanLPPython
- 中文自然語言處理工具hanlp隱馬角色標註詳解自然語言處理HanLP
- Hanlp自然語言處理工具的使用演練HanLP自然語言處理
- Python自然語言處理實戰(4):詞性標註與命名實體識別Python自然語言處理詞性標註
- python呼叫hanlp進行命名實體識別PythonHanLP
- 如何編譯執行HanLP自然語言處理包編譯HanLP自然語言處理
- Python自然語言處理Python自然語言處理
- Python自然語言處理 1 語言處理與PythonPython自然語言處理
- Python自然語言處理實戰(3):中文分詞技術Python自然語言處理中文分詞
- Spring Boot中對自然語言處理工具包hanlp的呼叫詳解Spring Boot自然語言處理HanLP
- Hanlp自然語言處理中的詞典格式說明HanLP自然語言處理
- NLP自然語言處理中的hanlp分詞例項自然語言處理HanLP分詞
- Pyhanlp自然語言處理中的新詞識別HanLP自然語言處理
- Hanlp自然語言處理工具之詞法分析器HanLP自然語言處理詞法分析
- 自然語言處理工具hanlp自定義詞彙新增圖解自然語言處理HanLP圖解
- Python 自然語言處理(NLP)工具庫彙總Python自然語言處理
- Python自然語言處理工具Python自然語言處理
- 自然語言處理工具hanlp定製使用者詞條自然語言處理HanLP
- 自然語言處理工具HanLP-N最短路徑分詞自然語言處理HanLP分詞
- 精通Python自然語言處理 4 :詞性標註--單詞識別Python自然語言處理詞性標註
- Python自然語言處理 3 處理原始文字Python自然語言處理
- 《Python自然語言處理實戰》連結表Python自然語言處理
- 自然語言處理之:搭建基於HanLP的開發環境自然語言處理HanLP開發環境
- 自然語言處理(NLP)自然語言處理
- 自然語言處理的最佳實踐自然語言處理
- 使用Mahout實現自然語言處理自然語言處理
- Python自然語言處理實戰(1):NLP基礎Python自然語言處理
- 自然語言處理工具hanlp 1.7.3版本更新內容一覽自然語言處理HanLP
- 開源自然語言處理工具包hanlp中CRF分詞實現詳解自然語言處理HanLPCRF分詞
- 精通Python自然語言處理 2 :統計語言建模Python自然語言處理
- 自然語言處理(NLP)系列(一)——自然語言理解(NLU)自然語言處理