Python Flask定时调度疫情大数据爬取全栈项目实战使用-6.使用Python的re模块解析内容

文章目录 显示

一、概念

re是Python自带的正则表达式模块，使用它需要有一定的正则表达式基础

正则表达式

二、用法

1.在str查找满足条件的字符串，匹配不上返回None

re.search(regex, str)

2.对返回结果可以分组，可在字符串内添加小括号分离数据：

groups()

group(index)：返回指定的分组的内容

20210307204327703 - Python Flask定时调度疫情大数据爬取全栈项目实战使用-6.使用Python的re模块解析内容

四川卫生建设委员会疫情通报数据

import re

html = " 我省新型冠状病毒肺炎新增确诊病例11例，新增治愈出院病例12例，新增疑似病例60例，新增死亡病例2例。"

patten = "新增确诊病例(\d+)例.*?出院病例(\d+)例.*?疑似病例(\d+)例.*?死亡病例(\d+)例" #.*?非贪心匹配
confirm_add = re.search(patten, html)
print(confirm_add)
print(confirm_add.groups())
print(confirm_add.group(0))
print(confirm_add.group(1),confirm_add.group(2),confirm_add.group(3),confirm_add.group(4))

20210307204347766 - Python Flask定时调度疫情大数据爬取全栈项目实战使用-6.使用Python的re模块解析内容

通过匹配以上数据，我们就可以匹配这个列表下面的所有的数据了。

疫情通报列表

转载请注明：xuhss » Python Flask定时调度疫情大数据爬取全栈项目实战使用-6.使用Python的re模块解析内容

xuhss 简单、充实的学习

Python Flask定时调度疫情大数据爬取全栈项目实战使用-6.使用Python的re模块解析内容

一、概念

二、用法

您必须登录才能发表评论！

一、概念

二、用法

您必须 登录 才能发表评论！

您必须登录才能发表评论！