数据分析和一个工具OpenRefine【Python】

数据分析和一个工具OpenRefine

1、在阅读《Python网络数据采集》第七章的时候看到的案例,记录细节分析。

2、来简单体会下他的作用,根据书上的例子,我选定了之前程序得到的csv文件,导入后,的界面如下图:

可以看到Programming language,的栏目,这里要从77行中,筛选出同时有3种语言技能的,先在上面的下拉三角点开,使用text filter,然后配合RE表达式: .+,.+,.+ 输入到左侧,即可:

3、此软件关于正则表达式的使用,可参考此网址:

https://github.com/OpenRefine/OpenRefine/wiki/General-Refine-Expression-Language