文章目录
显示
一、概念
re是Python自带的正则表达式模块,使用它需要有一定的正则表达式基础
正则表达式
二、用法
1.在str查找满足条件的字符串,匹配不上返回None
re.search(regex, str)
2.对返回结果可以分组,可在字符串内添加小括号分离数据:
groups()
group(index):返回指定的分组的内容
import re
html = " 我省新型冠状病毒肺炎新增确诊病例11例,新增治愈出院病例12例,新增疑似病例60例,新增死亡病例2例。"
patten = "新增确诊病例(\d+)例.*?出院病例(\d+)例.*?疑似病例(\d+)例.*?死亡病例(\d+)例" #.*?非贪心匹配
confirm_add = re.search(patten, html)
print(confirm_add)
print(confirm_add.groups())
print(confirm_add.group(0))
print(confirm_add.group(1),confirm_add.group(2),confirm_add.group(3),confirm_add.group(4))
通过匹配以上数据,我们就可以匹配这个列表下面的所有的数据了。
转载请注明:xuhss » Python Flask定时调度疫情大数据爬取全栈项目实战使用-6.使用Python的re模块解析内容