1
推荐
3105
阅读

Python学习笔记:字典分组函数 itertools.groupby() 的用法

问题:假设我们有如下字典数据,我们想根据date字段来进行分组并且迭代访问,这时要怎么做呢?解决方法:itertools.groupby() 函数正好可以满足我们的需求,我们首先按照对date字段进行排序,然后调用 itertools.groupby() 函数。原理:groupby() 函数在每次迭代的时候,会返回一个分组后的date值和一个迭代器对象...

发表了文章 • 2018-05-23 10:24 • 0 条评论

1
推荐
1197
阅读

Python学习笔记:对字典进行快速排序

 itemgetter 函数:我们有一个字典列表,想根据某个字段进行排序,这时我们可以使用 operator 模块的 itemgetter 函数。举例:1、我们想根据下面字典中的fname 字段进行排序,这时我们可以这么写:2、itemgetter() 函数也支持多个 keys,比如下面的代码:输出结果如下:

发表了文章 • 2018-05-22 18:09 • 0 条评论

0
推荐
1391
阅读

Python学习笔记:collections.Counter 类的用法

collections.Counter 描述:计算序列中出现次数最多的元素示例:1、查找出现频率最高的3个单词2、查找某个单词出的次数:

发表了文章 • 2018-05-22 17:55 • 0 条评论

0
推荐
1150
阅读

Python学习笔记:slice 切片函数

函数的作用:slice() 函数实现切片对象,主要用在切片操作函数里的参数传递。函数的使用:截取下标2到3的元素。

发表了文章 • 2018-05-22 17:41 • 0 条评论

2
推荐
5182
阅读

网络爬虫的抓取策略:深度抓取策略、广度优先遍历策略、Partial PageRank策略、OCIP策略、大站优先策略

前言遍历策略是爬虫的核心问题,在爬虫系统中,待抓取URL队列是很重要的一部分。待抓取URL队列中的URL以什么样的顺序排列也是一个很重要的问题,因为这涉及到先抓取那个页面,后抓取哪个页面。而决定这些URL排列顺序的方法,叫做抓取策略。爬虫策略主要有以下几种:一、深度优先遍历策略:深度优先遍历测试是指网络爬虫...

发表了文章 • 2018-05-10 11:33 • 0 条评论

0
推荐
1329
阅读

Python 的迭代器

迭代器:迭代器是访问集合内元素的一种方式,迭代器对象从集合的第一个元素开始访问,直到所有的元素都被访问一遍后结束。迭代器不能回退,只能向前进行迭代。Python中最常见的迭代器场景是循环语句for,它用迭代器封装集合,并且逐个访问集合元素以执行循环体。比如:其中range()返回一个包含所指定元素的集合,而for语...

发表了文章 • 2018-04-28 16:18 • 0 条评论

0
推荐
1257
阅读

Python学习笔记: (*)星号表达式的作用

一、序列赋值给多个变量常规做法问题:现在有一个包含N个元素的元祖或者序列,怎样将它里面的值同时赋值给N个变量呢?解决方法:任何序列都可以通过一个简单的赋值语句解压并复制给多个变量,唯一的要求是变量的数量必须与序列元素的数量是一致的。代码示例:有时候,我们可能只想赋值一部分,丢弃其他的值,对于这种情...

发表了文章 • 2018-04-28 15:14 • 0 条评论