漢語言處理工具pyhanlp的簡繁轉換
繁簡轉換
HanLP幾乎實現了所有我們需要的繁簡轉換方式,並且已經封裝到了HanLP中,使得我們可以輕鬆的使用,而分詞器中已經預設支援多種繁簡格式或者混合。這裡我們不再做過多描述。
說明 :
· HanLP能夠識別簡繁分歧詞,比如印表機=印表機。許多簡繁轉換工具不能區分“以後”“皇后”中的兩個“後”字,HanLP可以。
演算法詳解 :
· 《漢字轉拼音與簡繁轉換的 Java實現》 —— 請查閱此文
1. from pyhanlp import *
2. # 繁簡轉化
3. print(HanLP.convertToTraditionalChinese("“以後等你當上皇后,就能買草莓慶祝了”。發現一根白頭髮"))
4. print(HanLP.convertToSimplifiedChinese("憑藉筆記簿型電腦寫程式HanLP"))
5. # 簡體轉檯灣繁體
6. print(HanLP.s2tw("hankcs在臺灣寫程式碼"))
7. # 臺灣繁體轉簡體
8. print(HanLP.tw2s("hankcs在臺灣寫程式碼"))
9. # 簡體轉香港繁體
10. print(HanLP.s2hk("hankcs在香港寫程式碼"))
11. # 香港繁體轉簡體
12. print(HanLP.hk2s("hankcs在香港寫程式碼"))
13. # 香港繁體轉檯灣繁體
14. print(HanLP.hk2tw("hankcs在臺灣寫程式碼"))
15. # 臺灣繁體轉香港繁體
16. print(HanLP.tw2hk("hankcs在香港寫程式碼"))
17.
18. # 香港/臺灣繁體和HanLP標準繁體的互轉
19. print(HanLP.t2tw("hankcs在臺灣寫程式碼"))
20. print(HanLP.t2hk("hankcs在臺灣寫程式碼"))
21.
22. print(HanLP.tw2t("hankcs在臺灣寫程式碼"))
23. print(HanLP.hk2t("hankcs在臺灣寫程式碼"))
1. 「以後等你當上皇后,就能買草莓慶祝了」。發現一根白頭髮
2. 憑藉膝上型電腦寫程式 HanLP
3. hankcs在臺灣寫程式碼
4. hankcs在臺灣寫程式碼
5. hankcs在香港寫程式碼
6. hankcs在香港寫程式碼
7. hankcs在臺灣寫程式碼
8. hankcs在香港寫程式碼
9. hankcs在臺灣寫程式碼
10. hankcs在臺灣寫程式碼
11. hankcs在臺灣寫程式碼
12. hankcs在臺灣寫程式碼
---------------------
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2639674/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 漢語言處理工具pyhanlp的拼音轉換與字元正則化HanLP字元
- pyhanlp 繁簡轉換之拼音轉換與字元正則化HanLP字元
- Pyhanlp自然語言處理中的新詞識別HanLP自然語言處理
- 文字相似度 HanPL漢語言處理
- 自然語言處理工具pyhanlp分詞與詞性標註自然語言處理HanLP分詞詞性標註
- java 中文繁簡體轉換工具 opencc4jJavaOpencc4j
- Python 輕量化簡繁轉換Python
- Golang語言包-字串處理strings和字串型別轉換strconvGolang字串型別
- 《NLP漢語自然語言處理原理與實踐》學習四自然語言處理
- 12 種自然語言處理的開源工具自然語言處理開源工具
- 人工智慧--自然語言處理簡介人工智慧自然語言處理
- 自然語言處理(NLP)簡介 | NLP課程自然語言處理
- 語言模型文字處理基石:Tokenizer簡明概述模型
- java 中文繁簡體轉換工具 opencc4j 使用介紹 1.8.0JavaOpencc4j
- C語言,實現數字譜到簡譜的轉換(二)C語言
- 漢語言處理包HanLP1.6.4釋出,優化新詞發現HanLP優化
- Pytext 簡介——Facebook 基於 PyTorch 的自然語言處理 (NLP) 框架PyTorch自然語言處理框架
- 使用 Python+spaCy 進行簡易自然語言處理Python自然語言處理
- NLP漢語自然語言處理入門基礎知識自然語言處理
- 自然語言處理中的語言模型預訓練方法自然語言處理模型
- 自然語言處理的最佳實踐自然語言處理
- 自然語言處理NLP(四)自然語言處理
- 自然語言處理(NLP)概述自然語言處理
- HanLP 自然語言處理 for nodejsHanLP自然語言處理NodeJS
- Go 語言異常處理Go
- 漢字轉漢語拼音
- NLP 與 NLU:從語言理解到語言處理
- Python自然語言處理工具Python自然語言處理
- 分享一個自然語言漢語時間語義識別的工具類
- 漢語言處理包HanLPv1.6.0釋出,感知機詞法分析器HanLP詞法分析
- 探索自然語言處理:語言模型的發展與應用自然語言處理模型
- 自然語言處理標註工具——Brat(安裝、測試、使用)自然語言處理
- C語言的隱式型別轉換C語言型別
- Go語言工具簡介 - HoneybadgerGo
- 精通Python自然語言處理 2 :統計語言建模Python自然語言處理
- 自然語言處理(NLP)系列(一)——自然語言理解(NLU)自然語言處理
- Java SimpleDateFormat處理日期與字串的轉換JavaORM字串
- [譯] 自然語言處理真是有趣!自然語言處理