使用scrapy爬取拉勾网的不同职位的数据，该怎么处理？

我现在使用scrapy，先通过爬取首页，获取所有的工作类别，然后再通过修改请求头部的数据通过pn获取不同的页数，通过改变kd来实现改变爬取的工作种类

data = {
'first': 'true',
'pn': '1',
'kd': ''
}

我怎么实现所有工作种类并行，然后每个种类在做翻页的爬取

重要提示：提问者不能发表回复，可以通过评论与回答者沟通，沟通后可以通过编辑功能完善问题描述，以便后续其他人能够更容易理解问题.

课程推荐：实战秘技，经典案例，一门课程锤炼数据分析师八大能力！

1 个回复

一只写程序的猿 - 一个圣骑士成熟的标志是不再向盲人解释阳光。公众号：Python攻城狮 2018-01-18 回答

拉勾网通过pn可以直接获取数据吗？我记得拉勾网是ajax后台返回数据的吧，如果可行的话种类并行的话可以参考多进程
实现翻页爬取的话用Scrapy的深度爬取
设置对页面页码的提取规则

 from scrapy.spiders import CrawlSpider, Rule

 from scrapy.linkextractors import LinkExtracto

要回复问题请先登录或注册

使用scrapy爬取拉勾网的不同职位的数据，该怎么处理？

1 个回复

发起人

相关问题

问题状态

使用scrapy爬取拉勾网的不同职位的数据，该怎么处理？

与内容相关的链接

1 个回复

发起人

相关问题

问题状态