Python Flask定时调度疫情大数据爬取全栈项目实战使用-6.使用Python的re模块解析内容

python-flask xuhss 576℃ 0评论

一、概念

re是Python自带的正则表达式模块,使用它需要有一定的正则表达式基础

正则表达式

百度百科

二、用法

1.在str查找满足条件的字符串,匹配不上返回None

re.search(regex, str)

2.对返回结果可以分组,可在字符串内添加小括号分离数据:

groups()

group(index):返回指定的分组的内容

20210307204327703 - Python Flask定时调度疫情大数据爬取全栈项目实战使用-6.使用Python的re模块解析内容

四川卫生建设委员会疫情通报数据

import re

html = " 我省新型冠状病毒肺炎新增确诊病例11例,新增治愈出院病例12例,新增疑似病例60例,新增死亡病例2例。"

patten = "新增确诊病例(\d+)例.*?出院病例(\d+)例.*?疑似病例(\d+)例.*?死亡病例(\d+)例" #.*?非贪心匹配
confirm_add = re.search(patten, html)
print(confirm_add)
print(confirm_add.groups())
print(confirm_add.group(0))
print(confirm_add.group(1),confirm_add.group(2),confirm_add.group(3),confirm_add.group(4))

20210307204347766 - Python Flask定时调度疫情大数据爬取全栈项目实战使用-6.使用Python的re模块解析内容

通过匹配以上数据,我们就可以匹配这个列表下面的所有的数据了。

疫情通报列表

转载请注明:xuhss » Python Flask定时调度疫情大数据爬取全栈项目实战使用-6.使用Python的re模块解析内容

喜欢 (2)

您必须 登录 才能发表评论!