2019-04-29
阅读量:
1101
爬虫中遇到空值怎么填充?
在爬取下列网页的代码中,价格有未确定的数值。但又要保持每个商品长度一致,如何爬取?
url='https://cq.fang.anjuke.com/loupan/all/p{}/'.format(y)
xf=requests.get(url
#,headers=headers
)
bs=BeautifulSoup(xf.text,'lxml')
lp=[i.text for i in bs.find_all('span','items-name')]
huxing=[i.text for i in bs.find_all('a','huxing')]
biaoqian=[i.text for i in bs.find_all('div','tag-panel')]
jiage=[i.text for i in bs.find_all('p',['price'])]
查看网页源代码时候能看到,未设定价格的地方会设定为:"price-txt"
所以只要多查询一次price-txt 元素就行,如下:
jiage=[i.text for i in bs.find_all('p',['price',"price-txt"])]






评论(0)


暂无数据