有这样一个场景。你得到一个归属地,归属地包含省市地区,并且这个归属地信息是连续在一起的。当你想分别得到省,市,地区呢。人工,头脑分析,熟悉的地方,你估计可以分开。但在代码的世界里,怎么分开呢。在python中有个很好用的库,jiaba。结巴啊。
先看一个列子。
将“工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作”分开一个一个的词组。
seg_list = jieba.cut("工信处女干事每月经过下属科室都要亲口交代24口
交换机等技术性器件的安装工作", cut_all=False) print("Default Mode: " + " - ".join(seg_list))
Default Mode: 工信处 - 女干事 - 每月 - 经过 - 下属 - 科室 -
都 - 要 - 亲口 - 交代 - 24 - 口 - 交换机 - 等 -
技术性 - 器件 - 的 - 安装 - 工作