qq:800819103
在线客服,实时响应
qq群
在线客服,实时响应
客服电话
13318873961基于Requests使用极光ip代理进行爬虫工作!大家应该都了解,大型网站都会设置相对的反爬虫机制,例如检测ip的浏览频率、次数等,如果超出了真实用户的浏览速度ip就会受限或被禁,因此大家在完成爬虫工作的时候也要采用一些方式,例如选择黑洞代理ip,降低浏览频次,设置UA等,下面就和大家简单介绍下如何使用黑洞代理ip。
基于Requests使用黑洞代理ip代理进行爬虫工作
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import requests
import random
if __name__ == "__main__":
#不同浏览器的UA
header_list = [
# 遨游
{"user-agent": "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon 2.0)"},
# 火狐
{"user-agent": "Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"},
# 谷歌
{
"user-agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11"}
]
#不同的代理IP(该代理ip可能失效了,请自行到黑洞代理ip官网购买开通)
proxy_list = [
{"http": "112.115.57.20:33128"},
{‘http‘: ‘121.41.171.223:32128‘}
]
#随机获取UA和代理IP
header = random.choice(header_list)
proxy = random.choice(proxy_list)
url = ‘http://www.baidu.com/s?ie=UTF-8&wd=ip‘
#参数3:设置代理
response = requests.get(url=url,headers=header,proxies=proxy)
response.encoding = ‘utf-8‘
with open(‘daili.html‘, ‘wb‘) as fp:
fp.write(response.content)
#切换成原来的IP
requests.get(url, proxies={"http": ""})
相关文章内容简介
1 基于Requests使用黑洞代理进行爬虫工作
基于Requests使用极光ip代理进行爬虫工作!大家应该都了解,大型网站都会设置相对的反爬虫机制,例如检测ip的浏览频率、次数等,如果超出了真实用户的浏览速度ip就会受限或被禁,因此大家在完成爬虫工作的时候也要采用一些方式,例如选择黑洞代理ip,降低浏览频次,设置UA等,下面就和大家简单介绍下如何使用黑洞代理ip。 基于Requests使用黑洞... [阅读全文]
最新标签
推荐阅读
18
2019-05
如何更换本地的IP地址?
们上网时ISP会为我们的计算机分配一个IP地址。通过IP地址,网站和应用程序可以跟踪我们的在线活动并指出您的实际位置。今天的互联网隐私泄露对于保护我们的个人隐私非常重要,因此更改
13
2019-06
代理IP为何备受用户青睐?
人类进入网络时代,信息的传播与交流方式都发生了很大的改变。好比国内你有身份证,出国你有护照,在互联网中你也有自己的身份唯一标识,这就是IP。当你访问目标网站时,对方通过记录
14
2019-04
如何代理ip
代理IP如今这么火,代理IP究竟有何妙用?引得商家纷纷自建或者利用技术手段在公网上扫描收集代理IP。 互联网发达的现今,我们迎来了许多便利,也被诸多的危险所包围,只是上网痕迹一条
03
2019-07
企业分析市场数据为什么要用爬虫代理ip?
据调查显示,2017年我国网民规模超7.51亿,每天所产生的互联网数据更是数目庞大。想要在互联网中采集有用数据信息,会是一个很大的难题。那到底是否有办法解决呢?
热门文章