Wakingup88688的博客专栏

曾经材料狗,如今段子手。一个python小白。知乎专栏:https://zhuanlan.zhihu.com/Waking-up 简书文集:http://www.jianshu.com/nb/11041494

0
推荐
1727
阅读

python 网络爬虫入门(四)— 破解pexels高清原图

最近貌似对好看的图着迷,Pixabay爬不到原图不甘心呀。 百度+知乎了下,于是转向pexels,同样一个高人气图片网站。颜值逆天,画质不输Pixabay,瞬间感觉有了动力? 不到一下午就爬到高清原图,仅用re\requests几个库,随后又做了个下载器。 之前的博文泛泛带过的多,总感觉少了点什么,这次详细记录一下。&...

发表了文章 • 2017-04-10 14:02 • 0 条评论

2
推荐
1683
阅读

python网络爬虫入门(三)—— 做个简陋的pixabay 图片下载器

今天,我们用Python来开发一个简陋的图片搜索下载器。由于网站使用JavaScript和ajax动态加载技术,还有验证码机制,对小白来说想要获得原图实在太难啦。所以能获取缩略图,主要提供基本思路。选择的是pixabay,挺有名的高品质图片网站,免费的, 相信许多人对此并不陌生。一、目标:1、实现输入关键词,自动搜索到图片2...

发表了文章 • 2017-04-10 13:57 • 0 条评论

5
推荐
5018
阅读

python网络爬虫入门(二)——百度贴吧

前面爬完了糗事百科,接下来看看百度贴吧。可是光光获取评论文字也是忒无聊了,咱们来点图片。然鹅,找哪儿的图好吶,翻来覆去,一个偶然的机会,让我看到了这个:机智的我灵机一动,为什么创建这个“旅行吧”呀,从事物发展的规律来说,就是方便大伙儿各种晒图各种秀啊能拿来晒的东西,敢情应该不会差到哪去(至少比一般...

发表了文章 • 2017-04-08 13:56 • 4 条评论

1
推荐
1178
阅读

python网络爬虫入门(一)——糗事百科热门帖

Python小白,刚学习爬虫不久,会一般的静态网页抓取,动手来写第一个例子。一、目标    1、抓取糗事百科热门帖,获取其发布者、评论、点赞数、评论等信息    2、将信息清洗并打印,循环输出    3、设计程序,使可以选择抓取的页面范围     4、将每一页的信息保存到文...

发表了文章 • 2017-04-08 13:41 • 0 条评论