以下出现的数据纯属虚构。
一 IO
- 导入excel数据:
import pandas as pd
import numpy as np
import os
os.chdir("E:\\test")
#导入excel数据
xs = pd.read_excel("源数据.xlsx","Sheet1")#第一个参数为工作薄名字(别忘了后缀名哦),第二个参数为工作表名字
2.导出为excel数据:
二 基本操作:
默认查看5行
可以给head()传入查看行数的参数:
#获取索引为4的行的值
#获取城市列的值:
或
#删除行:
#删除列:
#选取业绩>=20000的行
#选取行列子集(选取索引为30和36,列名为省份,城市,姓名,业绩的行列子集数据):
业绩列格式化为2位小数:
#按行索引排序(默认升序)
xs.sort_index()
#按列索引降序排序
xs.sort_index(asix=1,ascending=False)
#按照列名进行排序,如有多个排序列名,以列表形式传入:
(实例:按照业绩(列名)降序排序,如果业绩相同,按照日期(列名)进行降序排序,并选取前十名):
记录下学习过程,加深理解。