1
推荐
2264
阅读

requests‐bs4路线实现中国大学排名定向爬虫

预备阅读:Python中Requests库的用法   Python中Beautiful Soup的用法 前言最近学习了北京理工大学崇天老师的Python爬虫课程,老师讲了一个实现“中国大学排名定向爬虫”的实例,这里想自己实现一下,并分享给大家。2016年中国最好大学排名:http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html功能描述输入...

发表了文章 • 2017-03-15 10:47 • 1 条评论

3
推荐
2214
阅读

requests实战之爬取京东和亚马逊商品的区别

前面学习了requests库的基本使用,今天来学习一下实际应用中会出现的问题。这里我们只简单爬取某一个页面的商品,给大家一个参考。实战1:爬取京东图书“数据实践之美”页面数据实践之美URL:https://item.jd.com/12106224.html下面的截图作为测试,可以看到执行正确,得到了书籍的完整页面信息。下面看完整代码:import r...

发表了文章 • 2017-03-10 10:33 • 2 条评论

2
推荐
1993
阅读

再端一碗Beautiful Soup

前面已经介绍了Python中Beautiful Soup的简单用法,见文章Python中Beautiful Soup的用法。下面来说一下Beautiful Soup中更进一步的用法。请看正文:1、遍历文档树(1)直接子节点要点:.contents  .children  属性'''.contentstag 的 .content 属性可以将tag的子节点以列表的方式输出'''print soup.head.conte...

发表了文章 • 2017-03-08 07:53 • 0 条评论

2
推荐
1886
阅读

Python中Beautiful Soup的用法

1、Beautiful Soup的简介简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下:Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用...

发表了文章 • 2017-03-07 09:37 • 0 条评论

4
推荐
1941
阅读

Python中Requests库的用法

前面讲了Python的urllib库的使用和方法,Python网络数据采集Urllib库的基本使用 ,Python的urllib高级用法 。今天我们来学习下Python中Requests库的用法。Requests库的安装利用 pip 安装,如果你安装了pip包(一款Python包管理工具,不知道可以百度哟),或者集成环境,比如Python(x,y)或者anaconda的话,就可以直接使...

发表了文章 • 2017-03-06 07:55 • 2 条评论

4
推荐
2004
阅读

Python的urllib高级用法

预备阅读:Python网络数据采集Urllib库的基本使用前面一篇讲了一点urllib的基础,今天来讲一下urllib中更高级的用法。1.设置Headers可以看到,有个Request URL,还有headers,下面便是response,这个头中包含了许许多多是信息,有文件编码,压缩方式,请求的agent等等,agent就是请求的身份,如果没有写入请求身份,那么...

发表了文章 • 2017-03-03 10:23 • 4 条评论

1
推荐
1402
阅读

Python网络数据采集Urllib库的基本使用

作为一个数据科学家,从网络获取数据是必备的手段之一。今天来说一下使用Python来采集数据,虽然很多人更想叫它爬虫,但是本人更愿意叫网络数据采集。下面说一下Python中Urllib库的基本使用。在Python2.7中还有urllib2库,但是在Python3中,已经没有urllib2了,它们被整合到了一起成为urllib库。先看一个简单的小栗子:#...

发表了文章 • 2017-03-03 10:18 • 0 条评论

4
推荐
2179
阅读

Python中压缩和参数拆分,args和kwargs

压缩和拆分如果想把两个或多个列表压缩在一起,可以使用Zip把多个列表转换为一个对应元素的元组的单个列表中。list1 = [1, 2, 3] list2 = [‘a’, ‘b’, ‘c’] zip(list1, list2) #[(1, ‘a’), (2, ‘b’), (3, ‘c’)]如果列表的长度不同,zip会在第一个列表结束时停止。可以使用一种特殊的方法“解压”一个列表:paris = [...

发表了文章 • 2017-03-01 11:07 • 2 条评论

0
推荐
1534
阅读

Python统计列表中的重复项出现的次数的方法

前言在实际工作和学习中,经常会遇到很多重复的数据,但是我们又必须进行统计,所及这里简单介绍一下统计列表中重复项的出现次数的简单方法。实例本文实例展示了Python统计列表中的重复项出现的次数的方法,是一个很实用的功能,适合Python初学者学习借鉴。具体方法如下:#方法1: mylist = [1,2,2,2,2,3,3,3,4,4,4,4] m...

发表了文章 • 2017-02-28 15:16 • 0 条评论