边界匹配的用法_CDA答疑社区

（1）“^”匹配字符串的开头。例如，^abc匹配abc开头的字符串。

（2）“$”匹配字符串的结尾。例如，abc$匹配abc结尾的字符串。

（3）“\A”匹配字符串的结尾。例如，\Aabc。

（4）“\Z”匹配字符串的结尾。例如，abc\Z。

边界匹配在爬虫实战中的使用较少，因为爬虫提取的数据大部分为标签中的数据，例如<spanclass="stats-vote"><iclass="number">186</i>好笑</span>中提取数字信息，边界匹配在这里没有任何作用。

最后介绍爬虫实战中常用的(.*？)，"()"表示括号的内容作为返回结果，“.*？”是非贪心算法，匹配任意的字符。

例如，字符串'xxIxxjshdxxlovexxsffaxxpythonxx'，可以通过'xx（.*？）xx'匹配符合这种规则的字符串，

代码如下：

import re 
a = 'xxIxxj
shdxxlovexxsffaxxpythonxx' 
infos = re. findall(' xx(.*?) xx', a) 

print( infos) #findall 方法 返回 的 为 列表 结构