热线电话:13121318867

登录
2019-04-15 阅读量: 821
边界匹配的用法

(1)“^”匹配字符串的开头。例如,^abc匹配abc开头的字符串。

(2)“$”匹配字符串的结尾。例如,abc$匹配abc结尾的字符串。

(3)“\A”匹配字符串的结尾。例如,\Aabc。

(4)“\Z”匹配字符串的结尾。例如,abc\Z。

边界匹配在爬虫实战中的使用较少,因为爬虫提取的数据大部分为标签中的数据,例如<spanclass="stats-vote"><iclass="number">186</i>好笑</span>中提取数字信息,边界匹配在这里没有任何作用。

最后介绍爬虫实战中常用的(.*?),"()"表示括号的内容作为返回结果,“.*?”是非贪心算法,匹配任意的字符。

例如,字符串'xxIxxjshdxxlovexxsffaxxpythonxx',可以通过'xx(.*?)xx'匹配符合这种规则的字符串,

代码如下:

import re 
a = 'xxIxxj
shdxxlovexxsffaxxpythonxx'
infos = re. findall(' xx(.*?) xx', a)

print( infos) #findall 方法 返回 的 为 列表 结构
0.0000
6
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子