11月 042016
 

在pandans中,时间的计算以及转换,有它自己独有一套API.对时间的数据类型也很讲究。比如打印出来都一样,可能它是字符串类型,也可能是pandas.tslib.Timestamp类型。字符串中,你没法去比较时间的大小,也没法做时间的计算。两个时间差多少小时,多少分这些。往往,一般都是需要先转化。将字符串转换成Timestamp类型。再做计算或比较。
Continue reading »

11月 042016
 

我们在做merge的时候,如果两个DataFrame中存在相同的列名,merge会自动给相同的列名加上后缀。然后,你对需要的数据进行切割。如果所需要的数据中列名还带着个后缀,是很不舒服的。这个时候,你会想重命名列名。这个是一种场景。在其他场景,你也许也想重命名列名的。总之,就是想重命名列名。

通过DataFrame的rename方法,可以实现列名的改变。也可以使用columns属性来操作(直接赋值的方式)。其实,当对个别列重命名,当然是rename最好了。
Continue reading »

10月 272016
 

对DataFrame的各种处理太多太多。这里,只记录一点点,以便熟悉和记忆。利用where特性,去除特殊的行或赋值。利用lambda表达式和函数,更详细的处理行的情况。这些不仅仅对DataFrame操作,对其他对象该有该种行为的一样有效果。下边列出代码和输出。
Continue reading »

10月 232016
 

用ci框架做项目的时候,访问都会带上index.php,这样很影响美观。强迫症的实在受不了。蓝瘦,香菇。

办法总是有的。不过,不仅要去掉index.php.还要css,js这些不受影响。下边是我阿里云服务器的配置情况。配置完后,重启nginx服务器。再将ci项目中的config文件里的index.php配置成空字符串,然后访问站点。 Continue reading »

10月 212016
 

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.groupby.html
****************************************************************************************************
DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, **kwargs)
****************************************************************************************************
pandas提供了一个灵活高效的groupby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。根据一个或多个键(可以是函数、数组或DataFrame列名)拆分pandas对象。计算分组摘要统计,如计数、平均值、标准差,或用户自定义函数。
执行groupby后,返回的是一个GroupBy对象,它实际上还没有进行任何计算,只是含有一些有关分组键。 Continue reading »

10月 212016
 

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.query.html

****************************************************************************************************
DataFrame.query(expr, inplace=False, **kwargs) 通过表达式来查询DataFrame的列
expr,描述表达式(字符串),如果用到其他变量,请变量前加@
inplace,查询是否修改作用原DF或返回查询DF(默认False,返回查询DF。若为True,修改原DF,不返回值)
kwargs,不定参数
**************************************************************************************************** Continue reading »

网站地图