pandas常用函数3

  • A+
所属分类:数据科学

pandas常用函数3

数据重塑与轴向转换

层次化索引

Series层次化索引

levels对应每一层索引的名字,labels第一层的0123分别代表abcd,第二层的012分别代表123,每一层的个数都是series的元素的个数,即对应series的每一个元素,那么第一个元素的index为(0,0),即(a,1),最后一个元素的index为(3,2),即(d,3)

每一个元素的index都为元祖

s['a','c'] #选取几个一级索引

s[:,1]  #选取所有为1的二级索引

s[:,1:2]

报错:(slice(None, None, None), slice(1, 3, None))

s['a':'c',1]

报错:(slice('b', 'c', None), 1)

s['a', 3]  #选取一个值

3

转换为DataFrame

s.unstack()

pandas常用函数3

设置index名称

交换内外层index

DataFrame层次化索引

可以对index和columns设置层次化索引,设置方法与series相同,设置名称、交换index也相同,stack()转换为层次化索引的Series。

把列变成索引

取消层次化索引

选取列

选取行

关于索引更多的例子:参考

行列转换

数据分组,分组运算

只会对数值变量进行分组运算

传入多个分组变量

离散化处理

x:需要离散化处理的数组、Series、DataFrame对象

bins: 分组依据,为数字时:根据x的范围,平均分组(不是根据x中元素的数量,均分成几等份)

right: True时为左开右闭区间,False时为左闭右开区间。

labels: 设置标志

include_lowest: 是否包含bins的最小值

合并数据集

append

merge

pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)

how: inner交集 outer并集 left以左表为key right:右表

on: 联结键

left_index:使用索引(行标签)从左综合作为联结键

suffixes: 后缀 如果一行数据在左表 右表都存在,则加后缀

concat

许龙涛

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: