假设一下,当你畅游在网络的海洋里时,一个一个页面找寻着你要的吃鸡攻略,感觉马上就要找到的时候,然后点开页面时发现是404,或者该页面内容已过期时,你什么感觉?暴不暴躁?相信这样的情况大家多多少少的都遇到过,站点中存在内容失效、死链等低质问题,这些低质内容的存在会影响用户浏览百度搜索时的体验。同时,大量低质页面的存在会影响搜索引擎对网站的收录及评价,会对网站中其他有价值内容造成收录、排序造成影响。
所以为了保证用户和网站自身的权益,大家要及时对网站中的低质内容进行处理。
一、协议死链
打开的页面无法访问,或者看到的页面是一些HTTP协议状态明确表示的死链,如401、403、404、500、503等。
二、内容死链
页面可以正常打开,但页面内容无任何有价值信息,如页面不存在、内容已转移、帖子删除、网站要备案、空间被关闭等。
三、空白页
网站页面无任何有效内容。
四、资源失效
某一个内容质量和浏览体验都较好的专题页或中间页,点击页面内容出现下游资源不能使用或已失效。
五、过期信息页面
商品、团购等下架、无货;招聘、交易类信息过期,无法再满足用户需求。
网站低质内容解决处理方案
及时发现网站中垃圾页面,做404处理,并前往百度搜索资源平台_死链提交工具进行死链数据提交:
a)利用百度搜索资源平台_抓取异常工具查看近一个月产生的协议死链
b)使用相关爬虫软件,爬取全站所有链接,分析页面状态,提取死链
c)在网站运营中,将删除的低质页面如空白页、资源失效页、过期信息等,通过手动或自动方式保留URL