java分詞工具hanlp介紹
前幾天( 6月28日 ),在第 23屆中國國際軟體博覽會上,hanlp這款自然語言處理工具榮獲了“2019年第二十三屆中國國際軟體博覽會優秀產品”。
HanLP 是由一系列模型預演算法組成的工具包,結合深度神經網路的分散式自然語言處理,具有功能完善、效能高效、架構清晰、語料時新、可自定義等特點,提供詞法分析、句法分析、文字分析和情感分析等功能,是 GitHub最受歡迎、使用者量最大(超過13000個star)、社群活躍度最高的自然語言處理技術。
HanLP完全開源,包括詞典。不依賴其他jar,底層採用了一系列高速的資料結構,如雙陣列Trie樹、DAWG、AhoCorasickDoubleArrayTrie等,這些基礎件都是開源的。官方模型訓練自2014人民日報語料庫,您也可以使用內建的工具訓練自己的模型。
透過工具類 HanLP您可以一句話呼叫所有功能,文件詳細,開箱即用。底層演算法經過精心最佳化,極速分詞模式下可達2,000萬字/秒,記憶體僅需120MB。在IO方面,詞典載入速度極快,只需500 ms即可快速啟動。HanLP經過多次重構, 目前已經更新到了 1.7版本,新增並完善了中文分詞、命名實體識別、資訊抽取、文字分類、文字聚類、畫法分析等功能,使用效率和適用性得到了大幅提升。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2649388/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Hanlp在java中文分詞中的使用介紹HanLPJava中文分詞
- HanLP分類模組的分詞器介紹HanLP分詞
- HanLP分詞工具中的ViterbiSegment分詞流程HanLP分詞Viterbi
- Ansj與hanlp分詞工具對比HanLP分詞
- 分詞工具Hanlp基於感知機的中文分詞框架HanLP中文分詞框架
- Hanlp中使用純JAVA實現CRF分詞HanLPJavaCRF分詞
- 中文分詞演算法工具hanlp原始碼解析中文分詞演算法HanLP原始碼
- Elasticsearch整合HanLP分詞器ElasticsearchHanLP分詞
- HanLP-實詞分詞器詳解HanLP分詞
- 中文分詞原理及常用Python中文分詞庫介紹中文分詞Python
- Hanlp分詞例項:Java實現TFIDF演算法HanLP分詞Java演算法
- HanLP中文分詞Lucene外掛HanLP中文分詞
- 自然語言處理工具中的中文分詞器介紹自然語言處理中文分詞
- python呼叫hanlp分詞包手記PythonHanLP分詞
- Hanlp分詞之CRF中文詞法分析詳解HanLP分詞CRF詞法分析
- 自然語言處理工具HanLP-N最短路徑分詞自然語言處理HanLP分詞
- 空間分析:4-1.分詞模型hanLP簡介與安裝分詞模型HanLP
- 基於hanlp的es分詞外掛HanLP分詞
- HanLP分詞命名實體提取詳解HanLP分詞
- Spring MVCD框架中呼叫HanLP分詞的方法SpringMVC框架HanLP分詞
- Spark中分散式使用HanLP(1.7.0)分詞示例Spark分散式HanLP分詞
- 基於 HanLP 的 ES 中文分詞外掛HanLP中文分詞
- Java常用工具介紹Java
- HanLP程式碼與詞典分離方案與流程HanLP
- hanlp新增自定義字典的步驟介紹HanLP
- Hanlp在ubuntu中的使用方法介紹HanLPUbuntu
- NLP自然語言處理中英文分詞工具集錦與基本使用介紹自然語言處理分詞
- yocto-名詞介紹
- 開源自然語言處理工具包hanlp中CRF分詞實現詳解自然語言處理HanLPCRF分詞
- hanlp原始碼解析之中文分詞演算法詳解HanLP原始碼中文分詞演算法
- hanlp中文智慧分詞自動識別文字提取例項HanLP分詞
- NLP自然語言處理中的hanlp分詞例項自然語言處理HanLP分詞
- Hanlp自然語言處理工具之詞法分析器HanLP自然語言處理詞法分析
- Java介紹Java
- etcdctl工具介紹
- solr8.6.2 客戶端介面介紹及配置中文分詞器Solr客戶端中文分詞
- 自然語言處理工具hanlp定製使用者詞條自然語言處理HanLP
- 自然語言處理工具hanlp自定義詞彙新增圖解自然語言處理HanLP圖解