使用scrapy爬取拉勾网的不同职位的数据,该怎么处理?

0
我现在使用scrapy,先通过爬取首页,获取所有的工作类别,然后再通过修改请求头部的数据通过pn获取不同的页数,通过改变kd来实现改变爬取的工作种类

data = {
'first': 'true',
'pn': '1',
'kd': ''
}




我怎么实现所有工作种类并行,然后每个种类在做翻页的爬取
已邀请:
0

一只写程序的猿 - 一个圣骑士成熟的标志是不再向盲人解释阳光。公众号:Python攻城狮 2018-01-18 回答

拉勾网通过pn可以直接获取数据吗? 我记得拉勾网是ajax后台返回数据的吧,如果可行的话种类并行的话可以参考多进程
实现翻页爬取的话用Scrapy的深度爬取
设置对页面页码的提取规则
 from scrapy.spiders import CrawlSpider, Rule
from scrapy.linkextractors import LinkExtracto

要回复问题请先登录注册