10月 272016
 

对DataFrame的各种处理太多太多。这里,只记录一点点,以便熟悉和记忆。利用where特性,去除特殊的行或赋值。利用lambda表达式和函数,更详细的处理行的情况。这些不仅仅对DataFrame操作,对其他对象该有该种行为的一样有效果。下边列出代码和输出。
Continue reading »

10月 232016
 

用ci框架做项目的时候,访问都会带上index.php,这样很影响美观。强迫症的实在受不了。蓝瘦,香菇。

办法总是有的。不过,不仅要去掉index.php.还要css,js这些不受影响。下边是我阿里云服务器的配置情况。配置完后,重启nginx服务器。再将ci项目中的config文件里的index.php配置成空字符串,然后访问站点。 Continue reading »

10月 212016
 

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.groupby.html
****************************************************************************************************
DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, **kwargs)
****************************************************************************************************
pandas提供了一个灵活高效的groupby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。根据一个或多个键(可以是函数、数组或DataFrame列名)拆分pandas对象。计算分组摘要统计,如计数、平均值、标准差,或用户自定义函数。
执行groupby后,返回的是一个GroupBy对象,它实际上还没有进行任何计算,只是含有一些有关分组键。 Continue reading »

10月 212016
 

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.query.html

****************************************************************************************************
DataFrame.query(expr, inplace=False, **kwargs) 通过表达式来查询DataFrame的列
expr,描述表达式(字符串),如果用到其他变量,请变量前加@
inplace,查询是否修改作用原DF或返回查询DF(默认False,返回查询DF。若为True,修改原DF,不返回值)
kwargs,不定参数
**************************************************************************************************** Continue reading »

10月 202016
 

有这样一个场景。你得到一个归属地,归属地包含省市地区,并且这个归属地信息是连续在一起的。当你想分别得到省,市,地区呢。人工,头脑分析,熟悉的地方,你估计可以分开。但在代码的世界里,怎么分开呢。在python中有个很好用的库,jiaba。结巴啊。

先看一个列子。

“工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作”分开一个一个的词组。

seg_list = jieba.cut("工信处女干事每月经过下属科室都要亲口交代24口
             交换机等技术性器件的安装工作
", cut_all=False) print("Default Mode: " + " - ".join(seg_list))
Default Mode: 工信处 - 女干事 - 每月 - 经过 - 下属 - 科室 - 
都 - 要 - 亲口 - 交代 - 24 - 口 - 交换机 - 等 -
技术性 - 器件 - 的 - 安装 - 工作

Continue reading »

10月 202016
 

python太灵活,api太多,还很简洁。能记住一个是一个。那开始吧。

********************************************************************************************
DataFrame.drop_duplicates, 删除DF中,某列或某几列存在相同值的行(可以留重复的第一行,或最后一行,或都不留)
subset中是目标key的list(list中如果有多个key,必须多个key同时满足),取与删除,keep表示留的对象,可以留最后一个,或第一个或都不留
inplace为true表示原DF也跟着改变了
http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.drop_duplicates.html
******************************************************************************************** Continue reading »

网站地图