自然語言處理工具hanlp 1.7.3版本更新內容一覽

adnb34g發表於2019-05-10


 

HanLP 1.7.3 釋出了。HanLP 是由一系列模型與演算法組成的 Java 工具包,目標是普及自然語言處理在生產環境中的應用。HanLP 具備功能完善、效能高效、架構清晰、語料時新、可自定義的特點。 在提供豐富功能的同時,HanLP 內部模組堅持低耦合、模型堅持惰性載入、服務堅持靜態提供、詞典堅持明文釋出,使用非常方便,同時自帶一些語料處理工具,幫助使用者訓練自己的模型。

 

 

新版更新內容:

 

1. 感知機詞法分析器預設使用 98年人民日報6個月的大模型

2. 最佳化 DoubleArrayTrie fix #1136

3. 防止 ViterbiSegment.dat不必要的初始化

4. 修復詞法分析器對動態插入的詞條的處理 fix #271 (comment)

5. 詞法分析器 seg介面支援自定義詞性覆蓋統計詞性 fix #1156

6. 修訂拼音

7. 新資料包 data-for-1.7.3.zip md5=4e4f3695565a75b56427ba4a40731949

8. Portable版同步升級到v1.7.3

        <dependency>

            <groupId>com.hankcs</groupId>

            <artifactId>hanlp</artifactId>

            <version>portable-1.7.3</version>

        </dependency>

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2643876/,如需轉載,請註明出處,否則將追究法律責任。

相關文章