scrapy需要爬取链接中链接的内容，需要怎么处理？

def parse(self, response):
item = TencentItem()
for each in response.xpath('//tr[@class="even"] | //tr[@class="odd"]'):
item['Positionname'] = each.xpath('./td[1]/a/text()').extract()[0]
item['Detailslink'] = 'http://hr.tencent.com/' + each.xpath('./td[1]/a/@href').extract()[0]
item['Positioncategory'] = each.xpath('./td[2]/text()').extract()
item['peoplenumber'] = each.xpath('./td[3]/text()').extract()
item['Workingplace'] = each.xpath('./td[4]/text()').extract()
item['Releasetime'] = each.xpath('./td[5]/text()').extract()

重要提示：提问者不能发表回复，可以通过评论与回答者沟通，沟通后可以通过编辑功能完善问题描述，以便后续其他人能够更容易理解问题.

课程推荐：实战秘技，经典案例，一门课程锤炼数据分析师八大能力！

1 个回复

一只写程序的猿 - 一个圣骑士成熟的标志是不再向盲人解释阳光。公众号：Python攻城狮 2018-01-18 回答

设置提取规则对链接中新的链接进行内容采集或者用yield返回新的链接再进行爬取

 核心处理规则： from scrapy.spiders import CrawlSpider, Rule

 核心处理提取： from scrapy.linkextractors import LinkExtractor

要回复问题请先登录或注册

scrapy需要爬取链接中链接的内容，需要怎么处理？

1 个回复

发起人

相关问题

问题状态

scrapy需要爬取链接中链接的内容，需要怎么处理？

与内容相关的链接

1 个回复

发起人

相关问题

问题状态