漢語言處理工具pyhanlp的簡繁轉換
繁簡轉換
HanLP幾乎實現了所有我們需要的繁簡轉換方式,並且已經封裝到了HanLP中,使得我們可以輕鬆的使用,而分詞器中已經預設支援多種繁簡格式或者混合。這裡我們不再做過多描述。
說明 :
· HanLP能夠識別簡繁分歧詞,比如印表機=印表機。許多簡繁轉換工具不能區分“以後”“皇后”中的兩個“後”字,HanLP可以。
演算法詳解 :
· 《漢字轉拼音與簡繁轉換的 Java實現》 —— 請查閱此文
1. from pyhanlp import *
2. # 繁簡轉化
3. print(HanLP.convertToTraditionalChinese("“以後等你當上皇后,就能買草莓慶祝了”。發現一根白頭髮"))
4. print(HanLP.convertToSimplifiedChinese("憑藉筆記簿型電腦寫程式HanLP"))
5. # 簡體轉檯灣繁體
6. print(HanLP.s2tw("hankcs在臺灣寫程式碼"))
7. # 臺灣繁體轉簡體
8. print(HanLP.tw2s("hankcs在臺灣寫程式碼"))
9. # 簡體轉香港繁體
10. print(HanLP.s2hk("hankcs在香港寫程式碼"))
11. # 香港繁體轉簡體
12. print(HanLP.hk2s("hankcs在香港寫程式碼"))
13. # 香港繁體轉檯灣繁體
14. print(HanLP.hk2tw("hankcs在臺灣寫程式碼"))
15. # 臺灣繁體轉香港繁體
16. print(HanLP.tw2hk("hankcs在香港寫程式碼"))
17.
18. # 香港/臺灣繁體和HanLP標準繁體的互轉
19. print(HanLP.t2tw("hankcs在臺灣寫程式碼"))
20. print(HanLP.t2hk("hankcs在臺灣寫程式碼"))
21.
22. print(HanLP.tw2t("hankcs在臺灣寫程式碼"))
23. print(HanLP.hk2t("hankcs在臺灣寫程式碼"))
1. 「以後等你當上皇后,就能買草莓慶祝了」。發現一根白頭髮
2. 憑藉膝上型電腦寫程式 HanLP
3. hankcs在臺灣寫程式碼
4. hankcs在臺灣寫程式碼
5. hankcs在香港寫程式碼
6. hankcs在香港寫程式碼
7. hankcs在臺灣寫程式碼
8. hankcs在香港寫程式碼
9. hankcs在臺灣寫程式碼
10. hankcs在臺灣寫程式碼
11. hankcs在臺灣寫程式碼
12. hankcs在臺灣寫程式碼
---------------------
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2639674/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 漢語言處理工具pyhanlp的拼音轉換與字元正則化HanLP字元
- pyhanlp 繁簡轉換之拼音轉換與字元正則化HanLP字元
- Pyhanlp自然語言處理中的新詞識別HanLP自然語言處理
- 自然語言處理工具pyhanlp分詞與詞性標註自然語言處理HanLP分詞詞性標註
- 《NLP漢語自然語言處理原理與實踐》學習四自然語言處理
- java 中文繁簡體轉換工具 opencc4jJavaOpencc4j
- 12 種自然語言處理的開源工具自然語言處理開源工具
- 使用微軟的多語言工具包進行網站簡體與繁體的互轉和得到漢字、拼音、筆畫等相關資訊微軟網站
- Python 輕量化簡繁轉換Python
- 語言處理器
- GBK中文繁簡轉換函式函式
- 自然語言處理(NLP)簡介 | NLP課程自然語言處理
- 語言模型文字處理基石:Tokenizer簡明概述模型
- Python自然語言處理 1 語言處理與PythonPython自然語言處理
- C語言直接顯示漢字(轉)C語言
- Golang語言包-字串處理strings和字串型別轉換strconvGolang字串型別
- Perl語言的文書處理模式之一(轉)模式
- Perl語言的文書處理模式之二(轉)模式
- Perl語言的文書處理模式之三(轉)模式
- 漢語是最了不起的語言
- 用JAVA轉換簡繁體的基礎知識 (轉)Java
- NLP漢語自然語言處理入門基礎知識自然語言處理
- 漢語言處理包HanLP1.6.4釋出,優化新詞發現HanLP優化
- Python 自然語言處理(NLP)工具庫彙總Python自然語言處理
- 自然語言處理(NLP)自然語言處理
- java 中文繁簡體轉換工具 opencc4j 使用介紹 1.8.0JavaOpencc4j
- 基於 Python 的簡單自然語言處理實踐Python自然語言處理
- 分享一個自然語言漢語時間語義識別的工具類
- 自然語言處理新天地(之收藏者言) (轉)自然語言處理
- 是否需要漢語程式語言
- 漢語言處理包HanLPv1.6.0釋出,感知機詞法分析器HanLP詞法分析
- 寫了一個數字轉成簡 / 繁體漢字的助手函式函式
- SAP OTR語言轉換R語言
- 自然語言處理新天地(之三[1]) (轉)自然語言處理
- 自然語言處理新天地(之三[4]) (轉)自然語言處理
- 自然語言處理中的語言模型預訓練方法自然語言處理模型
- 自然語言處理(NLP)概述自然語言處理
- 自然語言處理NLP(四)自然語言處理