pandas

pandas

1
推荐
1118
浏览

pandas小册子(一)Series

pandas是python做数据处理与分析的常用包,基于NumPy数组构建的,使得python做数据预处理、清洗、分析工作变得更加快捷。pandas有两个主要数据结构:Series和DataFrame,分别对应一维数据表、二维数据表。(当然...

Max_Leo 发表了文章 • 2020-05-25 21:00

0
推荐
1399
浏览

python数据分析:Apply的使用

本文是《数据蛙三个月强化课》的第八篇总结教程,如果想要了解作者从转行后一直以来的思考,可以阅读谈谈转行数据分析以及工作心得。温馨提示:如果您已经熟悉apply函数的使用,大可不必再看这篇文章,或是之挑选...

DataFrog 发表了文章 • 2019-08-28 21:41

0
推荐
1204
浏览

使用Pandas进行用户群组分析

本文是《数据蛙三个月强化课》的第八篇总结教程,如果想要了解数据蛙社群,可以阅读给DataFrog社群同学的学习建议。温馨提示:如果您已经熟悉用户群组分析知识,大可不必再看这篇文章,或是只挑选部分文章想有个自...

DataFrog 发表了文章 • 2019-08-28 21:37

0
推荐
1182
浏览

python的数据分析:pandas的分组聚合

本文是《数据蛙三个月强化课》的第一篇总结教程,如果想要了解数据蛙社群,可以阅读给DataFrog社群同学的学习建议。温馨提示:如果您已经熟悉pandas,大可不必再看这篇文章,或是之挑选部分文章数据分析的过程分组...

DataFrog 发表了文章 • 2019-08-28 21:22

0
推荐
1527
浏览

pandas札记13——全美婴儿案例分析

知识点在全美婴儿名字案例中,使用到的方法有:按照sex分组按照births属性求和:groupby("sex").births.sum()concat()用法:第一个参数以列表形式添加pivot_table透视表制作image.png直接添加某列属性diff:group...

皮大大 发表了文章 • 2019-08-19 23:35

0
推荐
1312
浏览

机器学习札记8——感知机

感知机Perceptron导读感知机是二分类的线性分类模型,输入是实例的特征向量(每个属性),输出是实例的类别。感知机对应于输入空间中将实例划分为正负两类的分离超平面,属于判别模型。目的:找出将训练数据进行...

皮大大 发表了文章 • 2019-08-19 23:27

0
推荐
1769
浏览

机器学习札记7——K近邻(一文看懂KNN)

本篇札记对机器学习中K近邻算法(KNN)的基础、原理、实例、超参数以及scikit-learn中的使用和调参等各种知识进行汇总,学习完本篇札记基本上会了KNN算法。图片发自简书AppKNN基础k-近邻算法(k-nearest neighbor...

皮大大 发表了文章 • 2019-08-19 23:17

0
推荐
1011
浏览

pandas札记12_数据聚合和分组运算

Pandas中提供了灵活的分组功能,通过groupby实现,对数据进行切片、切块、合并等操作计算分组摘要:计数、平均值、标准差,用户自定义函数组内变换或者其他运算,规格化、线性回归、排名或选取子集等计算透视表、...

皮大大 发表了文章 • 2019-08-08 11:54

0
推荐
1674
浏览

Matplotlib札记6_数据可视化

本篇札记主要是整理于《利用Python进行数据分析-第二版》的第九章,本章中讲解了可视化的工具:matplotlib和seaborn。导入库import numpy as np import pandas as pd import matplotlib.pyplot as plt import se...

皮大大 发表了文章 • 2019-08-06 16:13

0
推荐
1060
浏览

pandas札记11_数据规整

import numpy as np import pandas as pd import matplotlib.pyplot as plt 层次化索引hierarchical indexing数据分散在不同的文件或者数据库中层次化索引在⼀个轴上拥有多个(两个以上)索引级别低维度形式处理...

皮大大 发表了文章 • 2019-08-06 10:38

0
推荐
1442
浏览

pandas札记10_数据清洗工作

数据处理之前需要对数据进行清理工作,包含:缺失值的去除drop缺失值的填充fillna删除重复数据duplicated()和drop_duplicates()数据转换索引重命名数据离散化或面元化缺失值的去除pandas处理缺失值pandas默认的处...

皮大大 发表了文章 • 2019-08-02 14:55

0
推荐
1341
浏览

pandas札记9_读取数据及数据库连接

import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline 读取文件将表格型数据读取为DF对象的函数read_csv:默认分隔符是逗号read_table:默认分隔符是制表符('\t')read_...

皮大大 发表了文章 • 2019-08-02 14:54

0
推荐
1157
浏览

pandas札记8_索引对象、重新排序索引和行列索引

import numpy as np import pandas as pd import matplotlib.pyplot as plt Index索引对象负责管理轴标签和元数据构建S和DF 的时候,数组和其他序列的标签会被转换成IndexIndex对象是不可变的,用户不能修改允许...

皮大大 发表了文章 • 2019-07-30 12:52

0
推荐
1295
浏览

pandas札记7_协方差、相关系数

import numpy as np import pandas as pd import pandas_datareader.data as web all_data = {ticker: web.get_data_yahoo(ticker) for ticker in ['AAPL', 'IBM', 'MSFT', 'GOOG']} price = pd.Data...

皮大大 发表了文章 • 2019-07-30 12:48

0
推荐
1185
浏览

pandas札记6_数据读取、存储

import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline 读取文件将表格型数据读取为DF对象的函数read_csv:默认分隔符是逗号read_table:默认分隔符是制表符('\t')read_...

皮大大 发表了文章 • 2019-07-30 12:45

1
推荐
1118
浏览

pandas小册子(一)Series

pandas是python做数据处理与分析的常用包,基于NumPy数组构建的,使得python做数据预处理、清洗、分析工作变得更加快捷。pandas有两个主要数据结构:Series和DataFrame,分别对应一维数据表、二维数据表。(当然...

Max_Leo 发表了文章 • 2020-05-25 21:00

0
推荐
1399
浏览

python数据分析:Apply的使用

本文是《数据蛙三个月强化课》的第八篇总结教程,如果想要了解作者从转行后一直以来的思考,可以阅读谈谈转行数据分析以及工作心得。温馨提示:如果您已经熟悉apply函数的使用,大可不必再看这篇文章,或是之挑选...

DataFrog 发表了文章 • 2019-08-28 21:41

0
推荐
1204
浏览

使用Pandas进行用户群组分析

本文是《数据蛙三个月强化课》的第八篇总结教程,如果想要了解数据蛙社群,可以阅读给DataFrog社群同学的学习建议。温馨提示:如果您已经熟悉用户群组分析知识,大可不必再看这篇文章,或是只挑选部分文章想有个自...

DataFrog 发表了文章 • 2019-08-28 21:37

0
推荐
1182
浏览

python的数据分析:pandas的分组聚合

本文是《数据蛙三个月强化课》的第一篇总结教程,如果想要了解数据蛙社群,可以阅读给DataFrog社群同学的学习建议。温馨提示:如果您已经熟悉pandas,大可不必再看这篇文章,或是之挑选部分文章数据分析的过程分组...

DataFrog 发表了文章 • 2019-08-28 21:22

0
推荐
1527
浏览

pandas札记13——全美婴儿案例分析

知识点在全美婴儿名字案例中,使用到的方法有:按照sex分组按照births属性求和:groupby("sex").births.sum()concat()用法:第一个参数以列表形式添加pivot_table透视表制作image.png直接添加某列属性diff:group...

皮大大 发表了文章 • 2019-08-19 23:35

0
推荐
1312
浏览

机器学习札记8——感知机

感知机Perceptron导读感知机是二分类的线性分类模型,输入是实例的特征向量(每个属性),输出是实例的类别。感知机对应于输入空间中将实例划分为正负两类的分离超平面,属于判别模型。目的:找出将训练数据进行...

皮大大 发表了文章 • 2019-08-19 23:27

0
推荐
1769
浏览

机器学习札记7——K近邻(一文看懂KNN)

本篇札记对机器学习中K近邻算法(KNN)的基础、原理、实例、超参数以及scikit-learn中的使用和调参等各种知识进行汇总,学习完本篇札记基本上会了KNN算法。图片发自简书AppKNN基础k-近邻算法(k-nearest neighbor...

皮大大 发表了文章 • 2019-08-19 23:17

0
推荐
1011
浏览

pandas札记12_数据聚合和分组运算

Pandas中提供了灵活的分组功能,通过groupby实现,对数据进行切片、切块、合并等操作计算分组摘要:计数、平均值、标准差,用户自定义函数组内变换或者其他运算,规格化、线性回归、排名或选取子集等计算透视表、...

皮大大 发表了文章 • 2019-08-08 11:54

0
推荐
1674
浏览

Matplotlib札记6_数据可视化

本篇札记主要是整理于《利用Python进行数据分析-第二版》的第九章,本章中讲解了可视化的工具:matplotlib和seaborn。导入库import numpy as np import pandas as pd import matplotlib.pyplot as plt import se...

皮大大 发表了文章 • 2019-08-06 16:13

0
推荐
1060
浏览

pandas札记11_数据规整

import numpy as np import pandas as pd import matplotlib.pyplot as plt 层次化索引hierarchical indexing数据分散在不同的文件或者数据库中层次化索引在⼀个轴上拥有多个(两个以上)索引级别低维度形式处理...

皮大大 发表了文章 • 2019-08-06 10:38

0
推荐
1442
浏览

pandas札记10_数据清洗工作

数据处理之前需要对数据进行清理工作,包含:缺失值的去除drop缺失值的填充fillna删除重复数据duplicated()和drop_duplicates()数据转换索引重命名数据离散化或面元化缺失值的去除pandas处理缺失值pandas默认的处...

皮大大 发表了文章 • 2019-08-02 14:55

0
推荐
1341
浏览

pandas札记9_读取数据及数据库连接

import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline 读取文件将表格型数据读取为DF对象的函数read_csv:默认分隔符是逗号read_table:默认分隔符是制表符('\t')read_...

皮大大 发表了文章 • 2019-08-02 14:54

0
推荐
1157
浏览

pandas札记8_索引对象、重新排序索引和行列索引

import numpy as np import pandas as pd import matplotlib.pyplot as plt Index索引对象负责管理轴标签和元数据构建S和DF 的时候,数组和其他序列的标签会被转换成IndexIndex对象是不可变的,用户不能修改允许...

皮大大 发表了文章 • 2019-07-30 12:52

0
推荐
1295
浏览

pandas札记7_协方差、相关系数

import numpy as np import pandas as pd import pandas_datareader.data as web all_data = {ticker: web.get_data_yahoo(ticker) for ticker in ['AAPL', 'IBM', 'MSFT', 'GOOG']} price = pd.Data...

皮大大 发表了文章 • 2019-07-30 12:48

0
推荐
1185
浏览

pandas札记6_数据读取、存储

import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline 读取文件将表格型数据读取为DF对象的函数read_csv:默认分隔符是逗号read_table:默认分隔符是制表符('\t')read_...

皮大大 发表了文章 • 2019-07-30 12:45