qq:800819103
在线客服,实时响应
qq群
在线客服,实时响应
客服电话
13318873961代理IP如何帮助爬虫爬取猫眼电影影片?想要获取最近热映影片,当然是用爬虫来爬取。今天我们就来看下,爬虫是如何爬取猫眼电影热映影片信息的。首先我们先打开猫眼电影的热映榜单页面,右键检查分析页面,查找目标信息位置。
具体代码如下:
import requests
import re
url = 'http://maoyan.com/board'
headers = {'User-Agent': '具体agent信息'}
response = requests.get(url, headers=headers)
pattern = re.compile(r'
([\d\D]*?)
') # 只显示一个
dd_list = pattern.findall(response.text)
for dd in dd_list:
# 电影名字
title_pattern = re.compile(r'
name = title_pattern.findall(dd)
print(name[0].strip())
# 电影主演
people_pattern = re.compile(r'
([\d\D]*?)
')
people = people_pattern.findall(dd)
print(people[0].strip())
# 上映时间
time_pattern = re.compile(r'
([\d\D]*?)
')
time = time_pattern.findall(dd)
print(time[0])
# 评分
score_pattern1 = re.compile(r'([\d\D]*?)')
score_first = score_pattern1.findall(dd)[0]
score_pattern2 = re.compile(r'([\d\D]*?)')
score_last = score_pattern2.findall(dd)[0]
print(score_first + score_last)
通过上述代码,我们就可以获取到猫眼电影热映影片的电影名字、主演、上映时间和评分信息了。黑洞代理服务器爬虫代理,数据采集服务服务提供商,为您提供更快,更可靠的服务。
相关文章内容简介
1 代理IP如何帮助爬虫爬取猫眼电影影片?
代理IP如何帮助爬虫爬取猫眼电影影片?想要获取最近热映影片,当然是用爬虫来爬取。今天我们就来看下,爬虫是如何爬取猫眼电影热映影片信息的。首先我们先打开猫眼电影的热映榜单页面,右键检查分析页面,查找目标信息位置。 具体代码如下: import∵requests import∵re url∵=∵'http://maoyan.com/board' headers∵=∵{'User-Agent':... [阅读全文]
最新标签
推荐阅读
20
2019-03
如何给自己搭建一个稳定的代理IP池!
在这篇文章之前, 应该不少人都看过很多搭建代理ip池的文章, 然后发现都是坑, 无法使用。说的比较多的 1. 推荐买xx家的代理ip, 贼稳定, 好使(广告) 2. 抓取xx免费代理ip, 然后自己写一个校验, 然
15
2019-01
VPS服务器的CPU占用过高如何解决?
怎样彻底解决VPS服务器的CPU占用过高的现象?导致vps服务器CPU使用率占用高的根本原因是有很多因素的,综合起来大概可分为以下几点。
31
2018-10
怎么获得免费的代理IP
怎么获得免费的代理IP?很多工作都需要用到IP,特别是一些网络营销、爬虫的工作,都需要大量的更换IP,但每个电脑或者手机都只有一个IP,虽然可以通过自动获取IP的方法更换IP,但...
28
2019-01
动态VPS之网络带宽基础知识
在购买动态VPS时一般来说都会牵涉到一个有关服务器提供网络宽带的问题,理所当然,有几个较为搞混人的基本概念,Mbps、Mb/s、MB/s。现阶段我们可以接触到的是Mbps、Mb/s、MB/s。那么他们的差异
热门文章