Python 数据分析利器 -Pandas

通过 爬虫抓取的豆瓣电影数据 来高效学习 Pandas 的基本、高阶用法

0
推荐
1440
阅读

Pandas 教程——不同类型电影的比较(2)

除了 常见的分组操作,另一个比较重要的是多个 DataFrame 之间的连接操作 和 合并操作,在 MySQL 中相对应的就是 join 和 union 关键字。merge ( ) 函数MySQL 中通过 movie_id 字段对两个表进行 join:select * from movie_1 join movie_2 on movie_1.movie_id = movie_2.movie_id 对应的 Pandas 操作为:import pandas...

发表了文章 • 2019-03-20 09:35 • 0 条评论

0
推荐
1232
阅读

Pandas 教程——不同类型电影的比较(1)

对数据进行分组运算是数据分析中很常见的操作,如果数据存储在数据库,如 MySQL、Oracle、Hive 中,那么使用 groupby 关键字在大部分时候就可以满足需求。Pandas 提供了一系列函数来实现类 SQL 语句,好用到爆,下面来一起看看和 SQL 具体对应的操作:select [column1, column2 ... ] where [condition1,...

发表了文章 • 2019-03-16 11:10 • 0 条评论

0
推荐
1166
阅读

Pandas 教程——电影数据是干净的吗(2)

Pandas 中除了对数据进行删除、去重以达到数据清洗的目的,同时为了满足更多的计算需求,增加新列也是很常见的操作。如果逻辑关系比较简单,可以直接对 Pandas 的两列进行操作得到新的一列,比如:movie_pd['total_score'] = movie_pd['vote_count'] * movie_pd['score'] 更一般的方法是使用 for 循环,对 Pandas 的某一...

发表了文章 • 2018-12-21 10:15 • 0 条评论

1
推荐
1497
阅读

Pandas 教程——电影数据是干净的吗(1)

分析电影数据之前,先来检查一下数据的质量,包括是否有空值、重复值、异常值。import pandas as pd movie_pd = pd.read_csv('douban_movie.csv', header=0, sep='\t') print movie_pd.info() print movie_pd.describe()  movie_pd.info ( )  输出结果如下:<class 'pandas.core.frame.DataFrame'> Ran...

发表了文章 • 2017-11-24 09:02 • 0 条评论

1
推荐
1832
阅读

Pandas 教程——筛选让你动心的电影(3)

了解了 DataFrame 之后,我们开始对电影数据进行筛选。如果给你一个 Excel 表格,最容易想到的就是筛选出这个表格的某几行或某几列,那么在Pandas 中如何做这种筛选呢,可以分为三种情况:按一行或多行筛选使用非常好用的 loc( ) 函数,可以按照索引进行筛选import pandas as pd movie_pd = pd.rea...

发表了文章 • 2017-11-11 18:52 • 0 条评论

1
推荐
1676
阅读

Pandas 教程——筛选让你动心的电影(2)

上一节对 Pandas 整体有了一个简单的认识,接下来我们看一下 Pandas 的数据结构到底是什么,先使用 type( ) 查看一下变量类型import pandas as pd movie_pd = pd.read_csv('douban_movie.csv', header = 0, sep = '\t') print type(movie_pd)输出结果如下:<class 'pandas.core.frame.DataFrame'>可见...

发表了文章 • 2017-11-08 22:50 • 0 条评论

3
推荐
1755
阅读

Pandas 教程——筛选让你动心的电影(1)

在学习 Pandas 之前,首先需要安装 Pandas,在 Python 中安装模块使用 pip install 模块名 即可,但因为 Pandas 依赖于很多包,所以直接安装的话很大概率会遇到各种各样的问题。建议直接安装 Anaconda,省时省心,Anaconda 会默认安装众多流行的科学、数学、工程、数据分析的模块,比如 Numpy、Scipy、Matplotlib、...

发表了文章 • 2017-11-07 22:15 • 0 条评论

2
推荐
1854
阅读

电影数据轻松学习 Pandas

还记得刚开始接触 Pandas 的时候,没有找到比较系统的教程,印象最深的是看过别人翻译的官方教程《 10 Minutes to Pandas 》,遇到不懂的地方就去官网查查 API,后来在工作中不断地使用和总结,才感觉慢慢地掌握了 pandas 的用法,可以满足日常工作的各种需求。回过头来看,对于有一定 Python 基础的人来说,掌握 Pandas...

发表了文章 • 2017-11-07 18:23 • 2 条评论