python拆分中英文混合字串 - 按中文拆分

pythontab發表於2013-09-10

出自群裡的提問,試了幾次就實現了,現在分享出來。

#coding=utf-8
import re
s = 'hi新手oh'.decode('utf-8') #舉個例子是字串s,為了匹配下文的unicode形式,所以需要解碼
p = re.compile(ur'[\u4e00-\u9fa5]') #這裡是精髓,[\u4e00-\u9fa5]是匹配所有中文的正則,因為是unicode形式,所以也要轉為ur
  
print p.split(s) #使用re庫的split切割


相關文章