2019-04-15
阅读量:
821
边界匹配的用法
(1)“^”匹配字符串的开头。例如,^abc匹配abc开头的字符串。
(2)“$”匹配字符串的结尾。例如,abc$匹配abc结尾的字符串。
(3)“\A”匹配字符串的结尾。例如,\Aabc。
(4)“\Z”匹配字符串的结尾。例如,abc\Z。
边界匹配在爬虫实战中的使用较少,因为爬虫提取的数据大部分为标签中的数据,例如<spanclass="stats-vote"><iclass="number">186</i>好笑</span>中提取数字信息,边界匹配在这里没有任何作用。
最后介绍爬虫实战中常用的(.*?),"()"表示括号的内容作为返回结果,“.*?”是非贪心算法,匹配任意的字符。
例如,字符串'xxIxxjshdxxlovexxsffaxxpythonxx',可以通过'xx(.*?)xx'匹配符合这种规则的字符串,
代码如下:
import re
a = 'xxIxxj
shdxxlovexxsffaxxpythonxx'
infos = re. findall(' xx(.*?) xx', a)
print( infos) #findall 方法 返回 的 为 列表 结构






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论