您的位置: 首页 > 新闻资讯 > 正文

ua和代理ip在爬虫代理中如何被设置

发布时间:2019-08-22 16:59:36 来源:互联网

  一、设置User-Agent


  1、创建Request对象时指定headers


  url = 'http://ip.zdaye.com/'


ua和代理ip在爬虫代理中如何被设置


  head = {}


  head['User-Agent'] = 'Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) AppleWebKit/535.19 (KHTML,  like Gecko) Chrome/18.0.1025.166  Safari/535.19'


  req = request.Request(url, headers=head)


  #传入创建好的Request对象


  response = request.urlopen(req)


  html = response.read().decode('utf-8')


  print(html)


  2、创建Request对象后使用add_header


  req.add_header('User-Agent', 'Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.166  Safari/535.19')


  # 参数为 (key, value)


  二、代理IP设置


  使用install_opener方法之后,会将程序默认的urlopen方法替换掉。也就是说,如果使用install_opener之后,在该文件中,再次调用urlopen会使用自己创建好的opener。如果不想替换掉,只是想临时使用一下,可以使用opener.open(url),这样就不会对程序默认的urlopen有影响。


  from urllib import request


  if __name__ == "__main__":


  url = www.16yun.cn'


  #这是代理IP


  proxy = {'http':'168.68.8.88:66666'}


  #创建ProxyHandler


  proxy_support = request.ProxyHandler(proxy)


  #创建Opener


  opener = request.build_opener(proxy_support)


  #添加User Angent


  opener.addheaders = [('User-Agent','Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36')]


  #安装OPener


  request.install_opener(opener)


  #使用自己安装好的Opener


  response = request.urlopen(url)


  html = response.read().decode("utf-8")


  print(html)


相关文章内容简介

1 ua和代理ip在爬虫代理中如何被设置

  一、设置User-Agent  1、创建Request对象时指定headers  url∵=∵'http://ip.zdaye.com/'  head∵=∵{}  head['User-Agent']∵=∵'Mozilla/5.0∵(Linux;∵Android∵4.1.1;∵Nexus∵7∵Build/JRO03D)∵AppleWebKit/535.19∵(KHTML, ∵like∵Gecko)∵Chrome/18.0.1025.166 ∵Safari/535.19'  req∵=∵request.Request(url,∵headers=head)  #传入创建好的Request对象  response∵=∵request.urlopen(req)... [阅读全文]

最新标签

在线咨询
大客户经理
大客户经理
13318873961

大客户经理微信

微信公众号

微信公众号

回到顶部