python呼叫hanlp分詞包手記
python呼叫hanlp分詞包手記
Hanlp作為一款重要的分詞工具,本月初的時候看到大快搜尋釋出了hanlp的1.7版本,新增了文字聚類、流水線分詞等功能。關於hanlp1.7版本的新功能,後面有使用的到時候在給大家分享。本篇分享一個在python裡呼叫hanlp分詞包的過程文章,供需要的朋友參考學習交流!以下為文章內容:
1.在python下安裝pyhanlp
sudo pip install pyhanlp
( 詳見 pyhanlp官方文件 )
2.pyhanlp的一些使用方法
( 1)Hanlp.segment的使用
from pyhanlp import *
print HanLP.segment("今天開心了嗎?")
#輸出:[今天/t, 開心/a, 了/ule, 嗎/y, ?/w]
(2) 其它 API函式的使用。
( pyhanlp裡已經含有以下這些功能了,可以直接呼叫)
1 - # API列表
2 CustomDictionary= LazyLoadingJClass( 'com.hankcs.hanlp.dictionary.CustomDictionary' )
3 HanLP = SafeJClass( 'com.hankcs.hanlp.HanLP' )
4 HanLP.Config = JClass( 'com.hankcs.hanlp.HanLP$Config' )
5 PerceptronLexicalAnalyzer= SafeJClass( 'com.hankcs.hanlp.model.perceptron.PerceptronLexicalAnalyzer' )
6 DoubleArrayTrieSegment = SafeJClass( 'com.hankcs.hanlp.seg.Other.DoubleArrayTrieSegment' )
7 AhoCorasickDoubleArrayTrie = SafeJClass( 'com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie' )
8 IOUtil = SafeJClass( 'com.hankcs.hanlp.corpus.io.IOUtil' )
9 TraditionalChineseTokenizer=SafeJClass( 'com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer' )
呼叫方法
analyzer=PerceptronLexicalAnalyzer()
a =analyzer.analyze("今天開心了嗎?")
print a
3.其它更多的功能的實現。
① 比如繁體分詞,自動生成摘要這些 hanlp能實現的,但不在以上API函式裡面的,我們可以通過以下方法。
② 首先要在 “../pyhanlp/init.py”pycharm檔案下通過jclass語句引入更深類路徑。比如(我引入的是中文繁體分詞這個API函式)
③ TraditionalChineseTokenizer=SafeJClass('com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer')
④ 然後就可以直接呼叫了,真的超級棒。
⑤ print TraditionalChineseTokenizer.segment('三華裔獲得傑出青年獎‘)
⑥ #輸出:[三/m, 華裔/n, 獲得/v, 傑出青年/nz, 獎/n]
⑦ -其它更多的API函式的路徑請參考java原始碼。
---------------------
作者:小傻子 kkk
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2286462/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Spring MVCD框架中呼叫HanLP分詞的方法SpringMVC框架HanLP分詞
- 在Python中呼叫Java擴充套件包HanLP測試記錄PythonJava套件HanLP
- HanLP分詞工具中的ViterbiSegment分詞流程HanLP分詞Viterbi
- Elasticsearch整合HanLP分詞器ElasticsearchHanLP分詞
- HanLP-實詞分詞器詳解HanLP分詞
- python 中文分詞包 jiebaPython中文分詞Jieba
- HanLP中文分詞Lucene外掛HanLP中文分詞
- java分詞工具hanlp介紹Java分詞HanLP
- python呼叫自然語言處理工具hanlp記錄Python自然語言處理HanLP
- 分詞工具Hanlp基於感知機的中文分詞框架HanLP中文分詞框架
- Ansj與hanlp分詞工具對比HanLP分詞
- Hanlp分詞之CRF中文詞法分析詳解HanLP分詞CRF詞法分析
- HanLP分類模組的分詞器介紹HanLP分詞
- HanLP分詞命名實體提取詳解HanLP分詞
- 基於hanlp的es分詞外掛HanLP分詞
- Hanlp分詞1.7版本在Spark中分散式使用記錄HanLP分詞Spark分散式
- Hanlp中使用純JAVA實現CRF分詞HanLPJavaCRF分詞
- Spark中分散式使用HanLP(1.7.0)分詞示例Spark分散式HanLP分詞
- 基於 HanLP 的 ES 中文分詞外掛HanLP中文分詞
- Hanlp在java中文分詞中的使用介紹HanLPJava中文分詞
- 中文分詞演算法工具hanlp原始碼解析中文分詞演算法HanLP原始碼
- HanLP程式碼與詞典分離方案與流程HanLP
- 開源自然語言處理工具包hanlp中CRF分詞實現詳解自然語言處理HanLPCRF分詞
- Hanlp漢字轉拼音使用python呼叫詳解HanLPPython
- python呼叫hanlp進行命名實體識別PythonHanLP
- Hanlp分詞例項:Java實現TFIDF演算法HanLP分詞Java演算法
- hanlp原始碼解析之中文分詞演算法詳解HanLP原始碼中文分詞演算法
- hanlp中文智慧分詞自動識別文字提取例項HanLP分詞
- NLP自然語言處理中的hanlp分詞例項自然語言處理HanLP分詞
- PHP通過FFI呼叫CJieba分詞PHPJieba分詞
- PHP透過FFI呼叫CJieba分詞PHPJieba分詞
- hanlp自然語言處理包的基本使用--pythonHanLP自然語言處理Python
- 自然語言處理工具HanLP-N最短路徑分詞自然語言處理HanLP分詞
- python分詞和生成詞雲圖Python分詞
- MapReduce實現與自定義詞典檔案基於hanLP的中文分詞詳解HanLP中文分詞
- 自然語言處理工具python呼叫hanlp的方法步驟自然語言處理PythonHanLP
- Hanlp等七種優秀的開源中文分詞庫推薦HanLP中文分詞
- 空間分析:4-1.分詞模型hanLP簡介與安裝分詞模型HanLP