爬虫项目,求大神帮忙出下建议,急~~~~

0
  之前我们的项目是根据用户需求生成要爬取的url,将url push到redis里,然后python项目将redis列队里的url依次爬取.问题就是列队url多的话   爬取时间过长  用户体验不好.
  我的想法是生成url后,python那边直接调java接口,得到url直接解析.这种方法可行不?
已邀请:
1

GeorgeYao - 路漫漫其修远兮,吾将上下而求索! 2016-08-24 回答

你可以参考一下我前同事的Blog:http://brucedone.com/archives/771
有什么问题,可以留言咨询他。

要回复问题请先登录注册