在第一期【院长帮帮忙】栏目露面的站点是编织汇(),该站点通过反馈中心反馈页面内容迟迟不被抓取,经百度工程师追查,原来是因为页面上的无用时间信息——没有想到是不是?同学们快来看看这个案例吧。也想让院长帮助追查吗?快来看看这里!
站点求助:现象
编织汇网站内容发布后几个礼拜都未曾收录。案例如下:
(教程详细页面举例)
(用户页面举例)
(编织花样页面举例)
我们已将这些url放入sitemap,并使用了百度统计的集成的JS推荐,但是未曾有改善。
站点求助:自查
根据反馈中心的回复,使用抓取异常工具诊断:未发现异常
院长出手,内部追查
工程师结论: spider抓取很及时,但因为该网站没有设置内容产出时间,网站底部却有个老旧时间日期,导致spider误以为网页内容老旧(具体策略较复杂,在此不做赘述)。建议增加页面内容产生时间,去掉没有必要的时间信息