1
推荐
3105
阅读
Python学习笔记:字典分组函数 itertools.groupby() 的用法
问题:假设我们有如下字典数据,我们想根据date字段来进行分组并且迭代访问,这时要怎么做呢?解决方法:itertools.groupby() 函数正好可以满足我们的需求,我们首先按照对date字段进行排序,然后调用 itertools.groupby() 函数。原理:groupby() 函数在每次迭代的时候,会返回一个分组后的date值和一个迭代器对象...
1
推荐
1197
阅读
Python学习笔记:对字典进行快速排序
itemgetter 函数:我们有一个字典列表,想根据某个字段进行排序,这时我们可以使用 operator 模块的 itemgetter 函数。举例:1、我们想根据下面字典中的fname 字段进行排序,这时我们可以这么写:2、itemgetter() 函数也支持多个 keys,比如下面的代码:输出结果如下:
0
推荐
1391
阅读
Python学习笔记:collections.Counter 类的用法
collections.Counter 描述:计算序列中出现次数最多的元素示例:1、查找出现频率最高的3个单词2、查找某个单词出的次数:
0
推荐
1150
阅读
Python学习笔记:slice 切片函数
函数的作用:slice() 函数实现切片对象,主要用在切片操作函数里的参数传递。函数的使用:截取下标2到3的元素。
2
推荐
5182
阅读
网络爬虫的抓取策略:深度抓取策略、广度优先遍历策略、Partial PageRank策略、OCIP策略、大站优先策略
前言遍历策略是爬虫的核心问题,在爬虫系统中,待抓取URL队列是很重要的一部分。待抓取URL队列中的URL以什么样的顺序排列也是一个很重要的问题,因为这涉及到先抓取那个页面,后抓取哪个页面。而决定这些URL排列顺序的方法,叫做抓取策略。爬虫策略主要有以下几种:一、深度优先遍历策略:深度优先遍历测试是指网络爬虫...
0
推荐
1329
阅读
Python 的迭代器
迭代器:迭代器是访问集合内元素的一种方式,迭代器对象从集合的第一个元素开始访问,直到所有的元素都被访问一遍后结束。迭代器不能回退,只能向前进行迭代。Python中最常见的迭代器场景是循环语句for,它用迭代器封装集合,并且逐个访问集合元素以执行循环体。比如:其中range()返回一个包含所指定元素的集合,而for语...
0
推荐
1257
阅读
Python学习笔记: (*)星号表达式的作用
一、序列赋值给多个变量常规做法问题:现在有一个包含N个元素的元祖或者序列,怎样将它里面的值同时赋值给N个变量呢?解决方法:任何序列都可以通过一个简单的赋值语句解压并复制给多个变量,唯一的要求是变量的数量必须与序列元素的数量是一致的。代码示例:有时候,我们可能只想赋值一部分,丢弃其他的值,对于这种情...