小心别让robots.txt阻挡了链接的抓取
May 21, 2009 Views
Comments 0
我们知道有很大一部分的站长寻找一种不让蜘蛛在自己网站上爬行自己网页的方法,也同样通过使用robot.txt文件做到了这点。虽然这确实是一个很好的实践行为,但问题也同样呈现出来:在对使用robot.txt阻止Google/Yahoo!/MSN或者一些其他的搜索引擎的蜘蛛爬行时的疑惑!下面的简要的说明:
通过Robots.txt来阻止抓取:一些URL地址不想被访问,但是仍然可以抓取并出现在搜索引擎的结果页面。
通过META标签的NoIndex来阻止:可以访问,但是不想被抓取,在搜索结果中也不想被列出来。
...
阅读全文SEO推广