火车采集器V9版已采数据批量内容替换功能介绍

内容纲要

我们在实际采集过程中可能会经常遇到,数据采集完了发现某个数据处理没设置或者设置的不对,需要重新设置重新采集,但数据量又比较大,重新采集比较耗时。

那我们就可以使用数据替换功能。

 

首先要在任务中右键选择本地编辑数据,如上图

然后右侧出现上图,点击右下角替换

 

然后可以选择要替换的标签和区域,第一种是手工输入单条替换,可以使用正则进行替换。参照上图

第二种是批量多条内容替换,意思就是内容中有多个不同的内容需要替换,如A换成B,C换成D,E换成F……那我们可以选择同义词词库,需要对词库进行编辑,点击笔形图标进行设置

  

如上图,一行一个,前面是要被替换的内容,后面是要替换成的内容,中间必须使用英文逗号分隔

 

设置好后进行保存,然后点执行,在这里提醒大家如果数据量比较多,这个替换过程有点慢,如果想要快的替换方式,可以使用下面这种方法

在刚才点替换的旁边 有个SQl,点击出现上图,通过SQL语句进行替换,不需要自己写,只要直接点击上图中的 蓝色替换字 就会自动生成SQl语句,然后我们进行修改即可,上图中地区是内容所在标签名,10024是要被替换的内容,福建是替换后的内容,设置好后,点执行即可。

来源: