商来宝
  • 供应
  • 求购
  • 企业
  • 展会
  • 资讯

微信公众号

商来宝微信公众号
当前位置: 首页 » 行业资讯 » 电商资讯 »解析网站写入Robots.txt文件之后会被搜索引擎蜘蛛收录的原因

解析网站写入Robots.txt文件之后会被搜索引擎蜘蛛收录的原因

放大字体  缩小字体 发布日期:2022-08-24 09:40:39 来源: 作者:用户82537    浏览次数:1    
摘要

有些基于SEO的东西总是容易被忽略,比如Robots.txt文件。在seo优化的文章中多次提到了关于Robots.txt文件的重要性。网站优化的诊断方法之一是检查文档是否制作,是否标准化。如上文所述,如果搜索引擎蜘蛛被禁止进入网站的Robots.txt协议文件,无论你如何优化它,它都不会被收录在内。   Robots.txt协议文件写入   如果您将Robots.txt协议文件添加到您的网站并设...

有些基于SEO的东西总是容易被忽略,比如Robots.txt文件。在seo优化的文章中多次提到了关于Robots.txt文件的重要性。网站优化的诊断方法之一是检查文档是否制作,是否标准化。如上文所述,如果搜索引擎蜘蛛被禁止进入网站的Robots.txt协议文件,无论你如何优化它,它都不会被收录在内。  

Robots.txt协议文件写入  

如果您将Robots.txt协议文件添加到您的网站并设置禁止搜索引擎蜘蛛的说明,您的网站内容将不会被爬行,但可能会被收录(索引)。  

有些人可能会有疑问,搜索引擎蜘蛛爬行网址页面,页面需要呈现蜘蛛的内容反馈,才有可能被收录。所以,如果内容被禁止,会被收录在内吗?那是什么意思?黔优网在这里没有解释这个问题。

为什么Robots.txt协议文件禁止之后会被搜索引擎蜘蛛收录?  

这里有一个认知错误,也可能是惯性逻辑思维的错误思维。每个人都认为蜘蛛不能捕获内容,也不能收录其中。事实上,爬行、抓取和索引是不同的概念。很多人在学习SEO时,经常混淆一些SEO的概念,导致后续的SEO优化过程中性能不佳。 

 

或者首先,Robots.txt协议文件在做什么?因为它是一个协议,它必须是一个双方都同意和接受的规则。这A和B自然是网站和搜索引擎(或搜索引擎蜘蛛)之间的协议。Robots.txt协议文件将被放置在根目录中,蜘蛛会在次进入网站时访问该文件,然后查看协议中是否有任何页面无法爬行,如果被禁止,则不会再次爬行。  

Robots.txt协议文件的意义

如果一个页面想要被搜索引擎索引(包括),它应该被爬行器爬行和爬行。由于未对其进行爬网,因此将理所当然地不包括此页。这样的想法是错误的,可以索引而不必抓取。例如,淘宝是一个典型的案例,该网站添加了一个禁止协议,终被收录。原因是百度从其他渠道平台推荐的外部链接中了解到了这个网站。虽然禁止爬行,但可以通过标题和推荐链接的数据判断与此页面相对应的内容信息。

 
举报 收藏 0
免责声明
• 
转载请注明原文出处:https://www.51slb.com/news/0133b5dcdd.html 。本文仅代表作者个人观点,与商来宝平台无关,请读者仅做参考,如文中涉及有违公德、触犯法律的内容,请向我们举报,作者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们处理。
 

(c)2022-2032 www.51slb.com 商来宝 All Rights Reserved 成都蓝兴网络科技有限公司

蜀ICP备2021023313号