wangjuju123

2018-10-30   阅读量: 676

数据分析师 Python爬虫

urllib2 实现下载网页的三种方式

扫码加入数据分析学习群
#!/usr/bin/python
# -*- coding: UTF-8 -*-

importcookielib
importurllib2

url = "http://www.baidu.com"
response1 = urllib2.urlopen(url)
print"第一种方法"
#获取状态码,200表示成功
printresponse1.getcode()
#获取网页内容的长度
printlen(response1.read())

print"第二种方法"
request = urllib2.Request(url)
#模拟Mozilla浏览器进行爬虫
request.add_header("user-agent","Mozilla/5.0")
response2 = urllib2.urlopen(request)
printresponse2.getcode()
printlen(response2.read())

print"第三种方法"
cookie = cookielib.CookieJar()
#加入urllib2处理cookie的能力
opener =urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))

urllib2.install_opener(opener)
response3 = urllib2.urlopen(url)
printresponse3.getcode()
printlen(response3.read())
printcookie
添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 2 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子