详解:noarchive、noindex与nofollow的区别
在建立网站的时候,有时候需要保护自己的隐私我们不希望蜘蛛抓取我们的页面,就用了noindex,而很多时候没有那么严格会知识不希望被被人在搜索引擎上搜索看到,于是用到noarchive,但是有时候这两者都不需要限制,而是限制我们网站的站外链接不想给传递权重,那么nofollow可以帮助你!
noarchive、noindex与nofollow共同点:均是Meta元标记
它们都是Meta元标记,是内嵌在网页中,它给搜索引起传递你的网站一些信息需要被隐藏,从而达到保护网站隐私的行为。比如:针对雅虎,<head>标记对里写上<meta name=”robots” content=”noodp“>可防止搜索引擎调用ODP上面的描述性语句。
noarchive、noindex与nofollow不同点:表达含义不同
nofollow: 不允许追踪抓取页面上的链接。
noarchive: 不允许搜索引起给网页建立快照(但没限制是否抓取)。
noindex: 不允许搜索引擎蜘蛛抓取网页。
noarchive、noindex与nofollow写法:限制robots行为
不允许所有机器人追踪页面链接:<meta name=”robots” content=”nofollow“>
不允许某一个搜索引起的机器人追踪页面链接,如限制百度蜘蛛:<meta name=”Baiduspider” content=”nofollow“>
noarchive、noindex的写法同nofollow一样,只需要替换即可表达不同意义。
其他,组合表达的写法:
允许所有机器人抓取本页内容,但不建立快照并且不允许追踪此页面上的链接继续索引:<meta name="robots" content="index,nofollow,noarchive">
这样根据自己的意愿还可以组合多种表达方式来限制机器人的行为。
各大搜索引起对noarchive、noindex与nofollow支持度:
Google完全支持词三个标签,但Google并非100%遵守; 百度完全支持noarchive与nofollow,但对noindex支持不良好,并且并非100%遵守。
针对不支持和不良好支持标签的补救措施有二:
补救措施一:采用robots.tx文件限制 更多robots知识参见《Robots.txt要怎么写 Robots.txt的写法问题》。
补救措施二:服务器禁止访问
在服务器上设定搜索引擎所在的ip段禁止访问即可,这个需要技术支持,这个方法比较好的地方在于直接禁止搜索引擎的访问,除了HTTP请求头,几乎不耗费流量,也是禁止搜索引擎收录的最好方法。缺点在于你不可能得到Google的所有IP段,这个就得靠收集了。
综述:
对于noarchive、noindex与nofollow的区别介绍就到此结束,在做优化的时候这些都是常用到的meta标签,熟记这些标签,以便在以后的工作中能得心应手地使用,让我们的工作效率有所提高是很要必要的。
2016 年 2 月 28 日 上午 1:02 9F
[gbz饿晕] 刚来这里,慢慢探索中。
2016 年 1 月 28 日 上午 8:05 8F
大家顶啊,这么好的文章,博主辛苦了
2016 年 1 月 22 日 上午 5:08 7F
好东东,谢谢博主
2016 年 1 月 4 日 上午 1:55 6F
顶……叹为观止…..
2015 年 12 月 30 日 下午 11:13 5F
差役:“大人,上海外滩一男子暴尸树上,死因不明。”
元芳:“大人,这尸体是自己吊上去的还是被人挂上去的?”
狄仁杰:“依你之见呢?”
元芳:“回大人,小人认为,和谐盛世枯木逢春,这——应该是树上结的~”
2015 年 1 月 15 日 上午 8:14 4F
西安名老中医www.mlzy120.com
2014 年 9 月 17 日 下午 10:11 3F
还有前面那2个,不过很少用
2014 年 9 月 17 日 下午 12:34 2F
总结的不错。
2014 年 9 月 16 日 下午 8:20 1F
学习了