您的位置: 首页 > 新闻资讯 > 正文

代理IP如何帮助爬虫爬取猫眼电影影片?

发布时间:2019-05-08 17:27:42 来源:互联网

  代理IP如何帮助爬虫爬取猫眼电影影片?想要获取最近热映影片,当然是用爬虫来爬取。今天我们就来看下,爬虫是如何爬取猫眼电影热映影片信息的。首先我们先打开猫眼电影的热映榜单页面,右键检查分析页面,查找目标信息位置。


代理IP如何帮助爬虫爬取猫眼电影影片


  具体代码如下:

  import requests

  import re

  url = 'http://maoyan.com/board'

  headers = {'User-Agent': '具体agent信息'}

  response = requests.get(url, headers=headers)

  pattern = re.compile(r'

  • ([\d\D]*?)

  • ')  # 只显示一个

  dd_list = pattern.findall(response.text)

  for dd in dd_list:

  #  电影名字

  title_pattern = re.compile(r'(.*?)')

  name = title_pattern.findall(dd)

  print(name[0].strip())

  #  电影主演

  people_pattern = re.compile(r'

([\d\D]*?)

')

  people = people_pattern.findall(dd)

  print(people[0].strip())

  #  上映时间

  time_pattern = re.compile(r'

([\d\D]*?)

')

  time = time_pattern.findall(dd)

  print(time[0])

  #  评分

  score_pattern1 = re.compile(r'([\d\D]*?)')

  score_first = score_pattern1.findall(dd)[0]

  score_pattern2 = re.compile(r'([\d\D]*?)')

  score_last = score_pattern2.findall(dd)[0]

  print(score_first + score_last)

  通过上述代码,我们就可以获取到猫眼电影热映影片的电影名字、主演、上映时间和评分信息了。黑洞代理服务器爬虫代理,数据采集服务服务提供商,为您提供更快,更可靠的服务。


相关文章内容简介

1 代理IP如何帮助爬虫爬取猫眼电影影片?

  代理IP如何帮助爬虫爬取猫眼电影影片?想要获取最近热映影片,当然是用爬虫来爬取。今天我们就来看下,爬虫是如何爬取猫眼电影热映影片信息的。首先我们先打开猫眼电影的热映榜单页面,右键检查分析页面,查找目标信息位置。  具体代码如下:  import∵requests  import∵re  url∵=∵'http://maoyan.com/board'  headers∵=∵{'User-Agent':... [阅读全文]

最新标签

在线咨询
大客户经理
大客户经理
13318873961

大客户经理微信

微信公众号

微信公众号

回到顶部