Google Search是一款全自动搜索引擎,使用称为Web Crauls的软件,定期探索Internet以查找可以添加到索引中的页面。实际上,搜索结果中显示的大多数页面并未手动发送索引,而是在使用Web Crauls研究Internet时自动找到并自动添加。本文档详细说明了Google中的搜索在您的网站上下文中的工作方式。了解此过程将有助于您纠正扫描错误,在索引中获取页面并在搜索Google时优化网站显示。
寻找更少技术性的东西吗?查看网站 搜索如何工作谁从用户的角度解释了搜索的工作方式。
在介绍搜索引擎的详细信息之前,重要的是要注意,Google不接受更频繁的网站扫描或搜索结果中更高位置的付款。如果有人声称相反,请知道这不是真的。
Google不能保证该站点将在搜索结果中扫描,索引或显示,即使其页面与Google Search Essential相对应。
在Google中进行搜索是在三个阶段进行的,并非所有页面都经过每个页面:
第一阶段是在Internet上搜索页面。由于没有所有网页中的中央注册表,因此Google一直在寻找新的和更新的页面,以将其添加到其著名页面列表中。此过程称为“搜索URL”。由于Google已经访问了它们,因此已经知道一些页面。当Google从众所周知的页面上提取链接到新页面时,还会发现其他页面。例如,如果网站类别是指博客上的一篇新文章。您也可以发送页面列表(站点地图),以便Google可以索引它们。
Google找到URL页面后,他可以访问此页面以了解其包含的内容。为此,使用了大量计算机,可以在Internet上扫描数十亿页。执行此任务的程序称为GoogleBot(也称为Crauler,Robot,Bot或Spider)。 GoogleBot使用该算法来确定要扫描哪些页面,您需要从每个站点下载多少页。 Googlebot还以不超载网站服务器的方式进行调整,经常扫描它们。该机制取决于服务器的响应(例如,HTTP 500错误表明您需要减慢过程)。
但是,GoogleBot并不总是扫描它找到的所有页面。由于网站设置的禁令禁止通过robots.txt文件扫描,或者是由于需要授权访问,因此Kraler可能无法提供某些页面。
在Crailin期间,Google还使用Chrome浏览器的当前版本呈现页面并执行JavaScript,这有助于了解页面上显示哪些内容。这很重要,因为许多站点依赖JavaScript来显示内容,并且不渲染Google可能看不到重要数据。
扫描页面后,Google试图了解此页面在说什么。此阶段称为索引,它包括文本内容的处理和分析以及元素(例如标签)
在索引期间,Google确定该页面是否是Internet上另一页的重复。如果页面相似,则选择一个规范版本,该版本将显示在搜索结果中。这很重要,因为具有相同内容的不同页面可以在不同的上下文中表示(例如,在移动设备或搜索特定版本的页面时)。规范的页面是Google选择的最相关的页面。
Google还考虑了有关规范页面及其内容的各种信号,这些信号在搜索中发出页面时可以使用。例如,它可以是页面的语言,绑定内容的国家以及用户页面的便利性。
如果页面没有通过索引过程,这是可能的,这是由于内容的质量较低或安装了元右禁止索引。重要的是要了解,并非所有Google流程都将被索引的所有页面。
Google不接受付款来提高搜索结果中的职位,所有这些都会自动发生。当用户输入请求时,系统会扫描索引并返回页面,根据Google,该页面是最相关的请求。为了评估相关性,使用了各种因素,例如用户位置,语言和设备(例如,移动或桌面)。
例如,搜索“自行车维修”将向巴黎和香港的用户显示不同的结果。这也取决于哪个内容在特定条件下最相关。
此外,根据请求,页面上显示的搜索元素也更改。例如,请求“自行车维修”可以提取本地结果,而“现代自行车”请求是显示图像,但不是本地结果。
有时,Google搜索控制台可能会报告该页面已索引,但没有出现在搜索结果中。这可能是由于几个因素造成的:
注意,我们一直在努力改善我们的算法。关注博客之后的更改 Google搜索中心。
如果您对优化网站搜索有疑问,可以通过e -mail与seo.com联系 info@seo.computer 或通过whatsapp按数字 +79202044461。
ID 160