flyzy博客
分享便宜VPS与网络优惠
搬瓦工

请教下火车头高手,关于采集!

采集一个几万数据的站,有部分内容没采集发布好,
现在重新采集的话,之前已经采集发布好的内容,会重复吗?
比如图片和文字内容,会重复吗

山东省网友说:之前的已入库了吧,不会发布重复的了吧

山东省网友说:之前的入了,现在我想把火车头之前采集的内容全部删了,但是网站内容的不删,然后全部重新采集发布一遍,不知道会不会重复内容

福建省网友说:如果删除库里的重新采集那就算新的了吧,除非设置了不允许重复标题,不然都算新的重新发布吧……看看别的大佬咋说吧

安徽省网友说:没采集好? 如果是没采集成功  重新采集一遍就可以了
如果采集成功 但内容不理想(如没过滤好 或没获取到想要的内容) 那就不好弄了
发布的时候 如果网站程序有检测重复标题的功能 还可以杜绝重复  如果没有就白费
建议重新采集 网站清空数据

山东省网友说:标题一样会覆盖吧

山西省网友说:大佬,如果部分内容,没发布成功,我点击了停止键,怎么从新全部发布一遍啊

四川省网友说:正常重发就行了  火车头数据库会记录已发布 和未发布

江苏省网友说:火车头如果不清空 自带库的采集任务的话,是不会重复的,火车头会自带排除掉 同样链接的内容不采集 ,已经发布的也不会在发布,但是 如果你清空的火车头的采集任务

然后再采集了一次,就会全部重复发布一次

赞(0) 打赏
关注我们
未经允许不得转载:flyzy博客 » 请教下火车头高手,关于采集!
分享到: 更多 (0)

这是一种鼓励

支付宝扫一扫打赏

微信扫一扫打赏