出自群裡的提問,試了幾次就實現了,現在分享出來。
#coding=utf-8 import re s = 'hi新手oh'.decode('utf-8') #舉個例子是字串s,為了匹配下文的unicode形式,所以需要解碼 p = re.compile(ur'[\u4e00-\u9fa5]') #這裡是精髓,[\u4e00-\u9fa5]是匹配所有中文的正則,因為是unicode形式,所以也要轉為ur print p.split(s) #使用re庫的split切割
出自群裡的提問,試了幾次就實現了,現在分享出來。
#coding=utf-8 import re s = 'hi新手oh'.decode('utf-8') #舉個例子是字串s,為了匹配下文的unicode形式,所以需要解碼 p = re.compile(ur'[\u4e00-\u9fa5]') #這裡是精髓,[\u4e00-\u9fa5]是匹配所有中文的正則,因為是unicode形式,所以也要轉為ur print p.split(s) #使用re庫的split切割