pandas透视表有它独有的魅力。怎么用,这里有一篇好文,看完就会有一定的了解。
http://python.jobbole.com/81212/
再来一些常用的api:
1,pandas.eval DataFrame.eval 处理同一行两列之间的数据算法。eg: df.eval(“total = t1+ t2”, inplace=True)。total,t1,t2分别为列名
2,两个dataFrame中两个字段关联取交集或非,除了使用merge,还可以使用isin方法。先用isin收集,再df[isin]。eg:
guize = df1[‘uid’].isin(df2[‘uid’]) ,df1中和df2相同的uid的交集。
非交集用 ~guize
最终: df = df1[guize] , df = df1[~guize]
3,df之间直接等于,是引用赋值。其中一个改变了,另外一个也改变了。可以通过copy方法,或df[:]来重新建立一个另外的df,来打开同一个引用的枷锁。
4,fillna方法,可以将DataFrame中,对应列中是NaN的替换成其他值。eg:df.fillna(value={‘cost:0’}, inplace= True)
也可以使用replace方法: df[“cost”].replace(“NaN”, 0, True)
5,astype方法,将DataFrame中的数据转换类型。eg:df[“uid”] = df[“uid”].astype(int)
6,del方法比较广泛。可以删除DataFrame中的某一列。eg: del df[“name”] 删除了df中name这一列。