丘老师的爬虫实例看完,跟着每一课都自己动手实践,于是兴致高涨的去看了崔庆才老师的课,感觉听不懂,好多专业术语都不清楚,所以我先把基础知识在回顾,同时对Python有个全面的了解。
切片:
字符串“xxx”也可以看成是一个list,每个字符都是一个元素,因此也可以做切片。
迭代:
通过for 循环遍历list或tuple,这种遍历就是迭代
- dict的迭代:因为dict的的存储不是按照list的方式顺序排列的,所以,迭代出的结果顺序是不一样的。
默认情况下,dict迭代的是key。如果要迭代value,可以用 for value in d.values(),如果要同时迭代key和value,可以用 for k,v in d.items()
- 判断对象是否可迭代:通过collections模块的Iterable类型判断:
- Python内置的enumerate函数可以把一个list变成索引-元素对,这样就可以在for循环中同时迭代索引号和元素本身:
生成器:
一边循环,一边计算的机制,叫做生成器:generator
1.创建:
- 如果一个函数定义中有yield关键字,那么这个函数就不再是一个普通函数而是一个generator
2.如何打印出generator的每个元素:
迭代器:
可直接作用于for 循环的对象统称为可迭代对象:Iterable。有两种:
1.集合类型数据,如:list、tuple、dict 、set、str等。
2.是generator,包括生成器和带yield的generator funtcion
可用isinstance()来判断一个对象是不是Iterable。
可被next()函数调用并不断返回下一个值得对象称为迭代器:Iterator
可以用isinstance()判断一个对象是否是Iterator对象。
生成器都是iterator对象,但list、dict、str等数据类型却不是Iterator。
把list、dict、str等Iterable变成Iterator可以使用iter()函数:
Iterator的计算是惰性的,只有在需要返回下一个数据时,才会计算。
Iterator甚至可以表示一个大的无限的数据流,例如自然数,而list是永远不可能存储全体自然数的。