1
推荐
2813
阅读

Pandas手册(12)- 时间序列

在数据分析中,时间序列应该很常见,这里,我们看看在pandas里面的使用1. 日期和时间数据类型    经常使用的datetime,time,及calendar模块 from datetime import datetime now = datetime.now() now Out[33]: datetime.datetime(2017, 8, 18, 9, 43, 46, 360886) now.year Out[34]: 2017 now.month...

发表了文章 • 2017-08-17 17:53 • 0 条评论

1
推荐
2402
阅读

Pandas手册(11)- groupby

这里,我们整理下pandas中关于groupby的使用,和SQL中一样,就是对数据进行聚合可以参考官方:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.groupby.htmlhttp://pandas.pydata.org/pandas-docs/stable/groupby.html1. groupby基本使用DataFrame.groupby(by=None, axis=0, level=None, as_in...

发表了文章 • 2017-08-16 11:44 • 0 条评论

1
推荐
1755
阅读

Pandas手册(10)- 数据转换

这里接着上一篇,继续记录下pandas中数据处理方面的函数1.  重复数据    结果集中,可能会有重复数据,有函数可以做去重操作#判断数据是否重复 DataFrame.duplicated(subset=None, keep='first') Return boolean Series denoting duplicate rows, optionally only considering certain columns #删...

发表了文章 • 2017-08-15 18:30 • 0 条评论

0
推荐
2168
阅读

Pandas手册(9)- 数据合并与连接

这里来看一下,pandas中数据转换与合并的使用方法,刚刚学习了一下,很好用,就跟SQL里面一样。1. 合并数据集    就是说,我们有2个数据集,想要将他们合并一下,就是SQL里面的关联查询,pandas里面用一个函数就行了DataFrame.merge(right, how='inner', on=None, left_on=None, right_on=None, left_ind...

发表了文章 • 2017-08-14 15:35 • 0 条评论

0
推荐
2426
阅读

Pandas手册(8)- 常见绘图

前面,我们大概了解了matplotlib中基本的绘图方式,现在,我们来看看在pandas中绘图的方式,pandas做好了封装,我们用起来会很方便的。Series.plot(kind='line', ax=None, figsize=None, use_index=True, title=None, grid=None, legend=False, style=None, logx=False, logy=False, loglog=False, xticks=None, yticks=...

发表了文章 • 2017-08-12 18:50 • 0 条评论

0
推荐
1729
阅读

Pandas手册(7)- pandas数据加载

这里整理下,pandas中数据加载的几个方法,前面,我们也有用过,read_csv,下面,我们整理下1.pandas读取数据方法pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=N...

发表了文章 • 2017-08-08 13:31 • 0 条评论

1
推荐
1967
阅读

Pandas手册(6)- pandas常用操作

这里整理下pandas常用的操作,为什么要写这个呢?有本书《利用Python进行数据分析》一边看一遍记录下。1. 重新索引(reindex)    就是重构一下索引,在重构的同时,我们可以做一些其他操作DataFrame.reindex(index=None, columns=None, **kwargs) Conform DataFrame to new index with optional filling l...

发表了文章 • 2017-08-07 17:01 • 0 条评论

1
推荐
2724
阅读

Pandas手册(5)- 用pandas完成excel中常见任务

发现了一篇很好的教程,介绍一些Excel中的常用操作,怎样在pandas中实现,很不错,这里学习,顺便分享下。原文地址:用Pandas完成Excel中常见的任务,这个是翻译的,再原文是:Common Excel Tasks Demonstrated in Pandas 好了,下面,我们开始学习下。1. 基础数据这个是从网上找的一个成绩单,拿了一部分数据首先呢,我...

发表了文章 • 2017-08-01 11:20 • 0 条评论

1
推荐
3097
阅读

Pandas手册(4)- 对数据进行筛选和排序

前几天看了篇教程:使用Pandas对数据进行筛选和排序里面主要介绍了,我们在使用Pandas时,对数据进行筛选和排序的介绍这里简单总结分享下自己。1. 排序    可能是版本的问题,原文中的sort函数没有了,变成了2个常用的函数 sort_index和sort_valueDataFrame.sort_index(axis=0, level=None, ascending=Tr...

发表了文章 • 2017-07-31 18:37 • 0 条评论

0
推荐
2256
阅读

Pandas手册(3)-DataFrame-Selection By Label/Position

1. 序    这里主要介绍下,在DataFrame中一些筛选的操作,常用的有下面这些熟练掌握上面的几个方法,操作DataFrame应该就足够了import pandas as pd import numpy as np d = {'one' : pd.Series([1., 2., 3.], index=['a', 'b', 'c']), 'two' : pd.Series([1., 2., 3., 4.], index=['a', 'b', 'c',...

发表了文章 • 2017-07-31 17:24 • 0 条评论

0
推荐
2976
阅读

Pandas手册(2)- DataFrame

1.序    DataFrame是2维的标签数组,可以把他当成电子表格(Excel),数据库里的表,a dict of Series。DataFrame初始化,也可以有不同的输入,在Series中呢,我们有一个index的概念,在DataFrame中,我们除了index,还有一个columns的概念index:行标签columns:列标签2. DataFrame初始化class pandas.D...

发表了文章 • 2017-07-31 11:54 • 0 条评论

1
推荐
3005
阅读

Pandas手册(1)- Series

要学习pandas了,,看官网上的资料还是很多的,就根据找到的资料简单总结下吧。这里也有很多同学分享的资料,这里都整理下,按照自己的理解整理下。1. 序    这里的主要内容,参考官方教程:http://pandas.pydata.org/pandas-docs/stable/dsintro.html#dsintropandas里面有3个基本的数据结构, &nbs...

发表了文章 • 2017-07-30 22:05 • 1 条评论