这段python代码通过这规则表达式对字符串进行分割,使用\w作为分割符,只要不是字母和数字的就会被分割开来。
import re DATA = "Hey, you - what are you doing here! welcome to sharejs?" print re.findall(r"[\w']+", DATA)
输出结果如下
['Hey', 'you', 'what', 'are', 'you', 'doing', 'here', 'welcome', 'to', 'sharejs' ]