liting李

2021-03-02   阅读量: 387

Python

如何利用正则表达式提取文中特定内容呢?

扫码加入数据分析学习群

函数介绍:

1.re.compile():该函数用于生成一个正则表达式,也就是匹配的核心部分,用来定义你需要怎么匹配,匹配什么内容,更多细节可以去参看菜鸟教程。

2.re.findall():该函数用于在指定的字符串中进行匹配。


提取特定内容:

1.在一段文本或字符串中提取从某一位置XXX开始到某一位置X结束的特定内容:re.compile('XXX.+X'),示例:


import re
str='abcd1234efg'
pattern=re.compile('ab.+ef')   #匹配从ab开始,到ef结束的内容
result=pattern.findall(str)
print(result)

运行结果如下


['abcd1234ef']

2.在一段文本或字符串中提取从某一位置XXX之后到某一位置X之前的特定内容:re.compile('XXX(.+)X')


import re
str='abcd1234efg'
pattern=re.compile('ab(.+)ef')   #匹配ab与ef之间的内容
result=pattern.findall(str)
print(result)

运行结果如下


['cd1234']

所以从这两个匹配可以看出,两者的主要区别就在于有无(),很实用的一种方法~~


添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
109.0909 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子