采集一个几万数据的站,有部分内容没采集发布好,
现在重新采集的话,之前已经采集发布好的内容,会重复吗?
比如图片和文字内容,会重复吗
山东省网友说:之前的已入库了吧,不会发布重复的了吧
山东省网友说:之前的入了,现在我想把火车头之前采集的内容全部删了,但是网站内容的不删,然后全部重新采集发布一遍,不知道会不会重复内容
福建省网友说:如果删除库里的重新采集那就算新的了吧,除非设置了不允许重复标题,不然都算新的重新发布吧……看看别的大佬咋说吧
安徽省网友说:没采集好? 如果是没采集成功 重新采集一遍就可以了
如果采集成功 但内容不理想(如没过滤好 或没获取到想要的内容) 那就不好弄了
发布的时候 如果网站程序有检测重复标题的功能 还可以杜绝重复 如果没有就白费
建议重新采集 网站清空数据
山东省网友说:标题一样会覆盖吧
山西省网友说:大佬,如果部分内容,没发布成功,我点击了停止键,怎么从新全部发布一遍啊
四川省网友说:正常重发就行了 火车头数据库会记录已发布 和未发布
江苏省网友说:火车头如果不清空 自带库的采集任务的话,是不会重复的,火车头会自带排除掉 同样链接的内容不采集 ,已经发布的也不会在发布,但是 如果你清空的火车头的采集任务
然后再采集了一次,就会全部重复发布一次