python3怎樣匹配中文

pswyjz發表於2021-09-11

python3怎樣匹配中文

Python re正則匹配中文,其實非常簡單,把中文的unicode字串轉換成utf-8格式就可以了,然後可以在re中隨意呼叫。

unicode中中文的編碼為/u4e00-/u9fa5,因此正規表示式u”[u4e00-u9fa5]+”可以表示一個或者多箇中文字元。

>>> import re
>>> s='中文:123456aa哈哈哈bbcc'.decode('utf8')
>>> s
u'u4e2du6587uff1a123456aau54c8u54c8u54c8bbcc'
>>> print s
中文:123456aa哈哈哈bbcc
>>> re.match(u"[u4e00-u9fa5]+",s)
<_sre.SRE_Match object at 0xb77742c0>
>>> pat='中文'.decode("utf8")
>>> re.search(pat,s)
<_sre.SRE_Match object at 0x16a16df0>
>>> newpat='這裡是中文內容'.decode("utf8")
>>> news=re.sub(pat,newpat,s)
>>> print news
這裡是中文內容:123456aa哈哈哈bbcc

python學習網,大量的免費,歡迎線上學習!

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/755/viewspace-2835070/,如需轉載,請註明出處,否則將追究法律責任。

相關文章