Hanlp漢字轉拼音使用python呼叫詳解
1、 hanlp簡介
HanLP是一系列模型與演算法組成的NLP工具包,由大快搜尋主導並完全開源,目標是普及自然語言處理在生產環境中的應用。HanLP具備功能完善、效能高效、架構清晰、語料時新、可自定義的特點。
開源網址: HanLP: Han Language Processing
但由於 hanlp是用java來實現的,要在python中使用hanlp,只能通過呼叫pyhanlp這個包來。
但是 pyhanlp裡面有一些功能仍然不支援python直接呼叫,比如漢字轉拼音,這時候就需要從python中啟動jvm並指定Hanlp的jar路徑來使用其他功能了。
2 、下載並配置檔案
( 1)從開源網址中下載jar、data、hanlp.properties並修改配置檔案:
1、下載:data.zip
下載後解壓到任意目錄,接下來通過配置檔案 hanlp.properties告訴HanLP資料包的位置。
data
│
├─dictionary
└─model
使用者可以自行增刪替換,如果不需要句法分析等功能的話,隨時可以刪除 model資料夾。
3 、下載 jar和配置檔案:hanlp-release.zip
( 1 ) 配置檔案 hanlp.properties的作用是告訴HanLP資料包的位置,只需修改第一行為data的父目錄即可:
root=D:/JavaProjects/HanLP/
比如 data目錄是/Users/hankcs/Documents/data,那麼root=/Users/hankcs/Documents/ 。
( 2)從python中啟動jvm以及新增jar包路徑
其中 -Djava.class.path是用來新增jar包到classpath中,然後用startJVM來啟動jvm。
startJVM第一個引數是系統內的jvm位置,第二個為*arg引數,此處放置classpath。
以上得到的是 java的ArrayList型別,需要將他裝換為string型別:
結果如下:
4 、最後記得關閉 JVM
--------------------
作者: Juanly Jack
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2638828/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Android環境下hanlp漢字轉拼音功能的使用介紹AndroidHanLP
- 漢字轉漢語拼音
- Python 漢字轉拼音的庫--- PyPinyinPython
- C#漢字轉漢語拼音C#
- JS 漢字轉換拼音JS
- C#中漢字轉拼音C#
- xpinyin:漢字轉換為拼音庫
- ORACLE SQL函式中文漢字轉拼音首字母OracleSQL函式
- 漢字之美,拼音之韻
- C#漢字拼音檢索C#
- JavaScript按照漢字拼音順序排序JavaScript排序
- js 漢字陣列按拼音排序JS陣列排序
- 使用多執行緒查詢百萬條使用者資料將漢字轉化成拼音執行緒
- python呼叫hanlp分詞包手記PythonHanLP分詞
- 在Excel中如何獲取漢字拼音首字母?Excel
- Python 漢字區位碼、字串 相互轉換Python字串
- java 漢字轉配音Java
- python呼叫hanlp進行命名實體識別PythonHanLP
- Spring Boot中對自然語言處理工具包hanlp的呼叫詳解Spring Boot自然語言處理HanLP
- python呼叫自然語言處理工具hanlp記錄Python自然語言處理HanLP
- HanLP中人名識別分析詳解HanLP
- 阿拉伯-漢字-數字轉換
- PHP 將數字轉換為漢字PHP
- 用Python實現阿拉伯數字轉換成中國漢字Python
- win10拼音打不出漢字怎麼辦 win10電腦輸入法打不出漢字如何解決Win10
- 漢諾塔詳解
- 漢語言處理工具pyhanlp的拼音轉換與字元正則化HanLP字元
- utils公共方法:將數字轉為漢字
- HanLP中的人名識別分析詳解HanLP
- HanLP分詞命名實體提取詳解HanLP分詞
- HanLP-實詞分詞器詳解HanLP分詞
- JS 中文轉拼音JS
- 自然語言處理工具python呼叫hanlp的方法步驟自然語言處理PythonHanLP
- 使用Python呼叫商品詳情API的全面指南PythonAPI
- 直播原始碼開發,vue漢字獲取字母首拼或拼音、大小寫原始碼Vue
- python中怎麼列印漢字Python
- 在Python中呼叫Java擴充套件包HanLP測試記錄PythonJava套件HanLP
- 自然語言處理工具python呼叫hanlp中文實體識別自然語言處理PythonHanLP