漢語言處理工具pyhanlp的簡繁轉換

adnb34g發表於2019-03-29

繁簡轉換

HanLP幾乎實現了所有我們需要的繁簡轉換方式,並且已經封裝到了HanLP中,使得我們可以輕鬆的使用,而分詞器中已經預設支援多種繁簡格式或者混合。這裡我們不再做過多描述。

說明

· HanLP能夠識別簡繁分歧詞,比如印表機=印表機。許多簡繁轉換工具不能區分“以後”“皇后”中的兩個“後”字,HanLP可以。

演算法詳解

· 《漢字轉拼音與簡繁轉換的 Java實現》 —— 請查閱此文

1.  from pyhanlp import *

2.  # 繁簡轉化

3.  print(HanLP.convertToTraditionalChinese("“以後等你當上皇后,就能買草莓慶祝了”。發現一根白頭髮"))

4.  print(HanLP.convertToSimplifiedChinese("憑藉筆記簿型電腦寫程式HanLP"))

5.  # 簡體轉檯灣繁體

6.  print(HanLP.s2tw("hankcs在臺灣寫程式碼"))

7.  # 臺灣繁體轉簡體

8.  print(HanLP.tw2s("hankcs在臺灣寫程式碼"))

9.  # 簡體轉香港繁體

10.  print(HanLP.s2hk("hankcs在香港寫程式碼"))

11.  # 香港繁體轉簡體

12.  print(HanLP.hk2s("hankcs在香港寫程式碼"))

13.  # 香港繁體轉檯灣繁體

14.  print(HanLP.hk2tw("hankcs在臺灣寫程式碼"))

15.  # 臺灣繁體轉香港繁體

16.  print(HanLP.tw2hk("hankcs在香港寫程式碼"))

17.

18. # 香港/臺灣繁體和HanLP標準繁體的互轉

19. print(HanLP.t2tw("hankcs在臺灣寫程式碼"))

20. print(HanLP.t2hk("hankcs在臺灣寫程式碼"))

21.

22. print(HanLP.tw2t("hankcs在臺灣寫程式碼"))

23. print(HanLP.hk2t("hankcs在臺灣寫程式碼"))

 

 

1. 「以後等你當上皇后,就能買草莓慶祝了」。發現一根白頭髮

2. 憑藉膝上型電腦寫程式 HanLP

3. hankcs在臺灣寫程式碼

4. hankcs在臺灣寫程式碼

5. hankcs在香港寫程式碼

6. hankcs在香港寫程式碼

7. hankcs在臺灣寫程式碼

8. hankcs在香港寫程式碼

9. hankcs在臺灣寫程式碼

10. hankcs在臺灣寫程式碼

11. hankcs在臺灣寫程式碼

12. hankcs在臺灣寫程式碼

---------------------

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2639674/,如需轉載,請註明出處,否則將追究法律責任。

相關文章