仰视浮云白

星星之火,可以燎原

1
推荐
1322
阅读

爬取拉勾网招聘信息—后续

前段时间爬取拉勾网职位信息有几大问题:1、代码太复杂2、爬取数据一段时间后得到职位的城市就会变成上海3、不能够添加搜索的关键词在此重新改变下代码,添加了搜索的关键词,同时在拉勾网最多只能爬取30页,也就是450个职位。第一步:分析搜索得到的网址,例如在搜索框输入网易视觉设计,城市选择全国,得到拉勾网的网...

发表了文章 • 2018-01-08 14:45 • 0 条评论

5
推荐
142201
阅读

爬取拉勾网招聘信息

最近有个朋友在找工作,正好之前11月参加了天善社区的培训,于是尝试下用python爬取拉勾网的招聘信息。数据的爬取:      1、在拉勾网选关键词查询,经过分析发现关键词源码页面都在https://www.lagou.com/zhaopin/xxxx上      2、从源码页面提取需要的内容,经过测...

发表了文章 • 2017-12-25 10:37 • 3 条评论

5
推荐
2936
阅读

爬取起点24小时热销榜前200名排名信息

周末两天的培训结束了,非常感谢这段时间老师的热情指导,现对起点小说排名信息的爬取已完成,具体思路如下:第一步:首先选取起点的网站网址:https://www.qidian.com/rank/hotsales,先尝试用代理和cookies进入网址,发现得到的界面源代码都没有问题,然后去掉代理和cookies发现也能爬取信息    使用代理和...

发表了文章 • 2017-11-21 21:40 • 2 条评论