已经被搜索引擎收录的404页面如何处理?
各位运营网站的站长相信都遇过这样的问题:网站系统升级或更换,难免留下旧的页面。不删除这些页面造成文件目录系统混乱不易维护,删除这些文件将产生404找不到页面的错误。如果数据量大,而且有过精心经营,这些页面可能已经被搜索引擎收录,每天都还带来大量流量。这时候需要设置好404问题。
自定义404错误虽然简单,但是搜索了网上很多方案都难称完美。必须同时满足下面两条:
一:不管以哪种途径访问不存在的页面都必须正常显示自定义后的404页面;
二:必须保证搜索引擎蜘蛛访问的时候返回404状态码而不是200状态码。
今天,我的网站上海市精神科医院(http://www.021jcyy.com/)遇到了旧站删除造成大量404页面的问题。我搜索了网上的一些资料,大体解决方案如下(这里以IIS为例):
一、跳转到指定文件(效果分析:能保证返回404但浏览器访问时90%不显示该页面,除非经过多次刷新,不信大家可以试下);
二、跳转到URL(效果分析:能保证用户访问时正常显示,但是返回的是200状态码,你得保证内容随机变化否则难免被K)
网上一直强调一定要设置成跳转到指定文件,可没有一个站长有提到这样设置,从搜索引擎点入访问根本就无法正常显示自定义的404页面。我觉得要完美解决这个问题可从跳转到URL考虑。两个思路:
一:跳转到URL,编写随机生成内容系统直接返回200代码。这类相当于SEO们的搜索引擎欺骗。不做垃圾站的同志还是不走此路。
二:跳转到URL,保证正常显示页面,再判断访客,如果是搜索引擎蜘蛛直接返回404.
自定义404错误虽然简单,但是搜索了网上很多方案都难称完美。必须同时满足下面两条:
一:不管以哪种途径访问不存在的页面都必须正常显示自定义后的404页面;
二:必须保证搜索引擎蜘蛛访问的时候返回404状态码而不是200状态码。
今天,我的网站上海市精神科医院(http://www.021jcyy.com/)遇到了旧站删除造成大量404页面的问题。我搜索了网上的一些资料,大体解决方案如下(这里以IIS为例):
一、跳转到指定文件(效果分析:能保证返回404但浏览器访问时90%不显示该页面,除非经过多次刷新,不信大家可以试下);
二、跳转到URL(效果分析:能保证用户访问时正常显示,但是返回的是200状态码,你得保证内容随机变化否则难免被K)
网上一直强调一定要设置成跳转到指定文件,可没有一个站长有提到这样设置,从搜索引擎点入访问根本就无法正常显示自定义的404页面。我觉得要完美解决这个问题可从跳转到URL考虑。两个思路:
一:跳转到URL,编写随机生成内容系统直接返回200代码。这类相当于SEO们的搜索引擎欺骗。不做垃圾站的同志还是不走此路。
二:跳转到URL,保证正常显示页面,再判断访客,如果是搜索引擎蜘蛛直接返回404.