PGC123

2019-04-15   阅读量: 640

大数据 数据分析师 Python编程 Python数据分析 Python爬虫

边界匹配的用法

扫码加入数据分析学习群

(1)“^”匹配字符串的开头。例如,^abc匹配abc开头的字符串。

(2)“$”匹配字符串的结尾。例如,abc$匹配abc结尾的字符串。

(3)“\A”匹配字符串的结尾。例如,\Aabc。

(4)“\Z”匹配字符串的结尾。例如,abc\Z。

边界匹配在爬虫实战中的使用较少,因为爬虫提取的数据大部分为标签中的数据,例如<spanclass="stats-vote"><iclass="number">186</i>好笑</span>中提取数字信息,边界匹配在这里没有任何作用。

最后介绍爬虫实战中常用的(.*?),"()"表示括号的内容作为返回结果,“.*?”是非贪心算法,匹配任意的字符。

例如,字符串'xxIxxjshdxxlovexxsffaxxpythonxx',可以通过'xx(.*?)xx'匹配符合这种规则的字符串,

代码如下:

import re 
a = 'xxIxxj
shdxxlovexxsffaxxpythonxx'
infos = re. findall(' xx(.*?) xx', a)

print( infos) #findall 方法 返回 的 为 列表 结构
添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 6 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子