该网站的一般合唱器用于搜索信息并创建Google搜索引擎。它们还用于产品和分析师的特定任务。这些爬行者总是遵循机器人。该站点主要的Kralers的技术特征适用于将军Kraler。
通常,该网站的一般小木馆与特殊的GoogleBot.json设施中列出的IP地址一起工作,而反向DNS检查到其宿主NS对应于爬网 - *** - *** - *** - *** - ***。 Googlebot.com或*** - *** - ***。地理爬网 - *** - *** - *** - ***。 geo.googlebot.com。
该列表显示了网站的一般小屋,他们的HTTP检查中的用户代理行,对应于Robots.txt指令的用户代理令牌,以及受每个Kraler的Cruting设置影响的产品。一些Kralers具有几个用户代理令牌,足以比较其中一个以应用规则。该列表并不详尽,仅包括最常见的请求以及提出问题的请求。
注意:可以伪造HTTP请求中的用户代理行。建议检查访问者是否真的是Google搜索引擎网站的挑战者。
HTTP检查中的用户代理行有Googlebot的两种主要类型 - 智能手机和台式设备。智能手机的示例:Mozilla/5.0(Linux; Android)AppleWebkit/... Chrome/...移动Safari/...(兼容; GoogleBot/2.1; ...)。用于桌面设备-Mozilla/5.0 AppleWebkit/...(兼容; GoogleBot/2.1; ...)。
少于Mozilla/5.0(兼容; GoogleBot/2.1; ...)等选项,或者只是GoogleBot/2.1(...)。
Robots.txt使用Googlebot令牌来管理该网站的爬网。
Googlebot设置会影响Google搜索产品,包括搜索,发现,图像和新闻搜索,视频和新闻。
行用户代理:Googlebot-image/1.0。
robots.txt中的令牌:googlebot-image。
在Google搜索结果中,该网站的这个Kraler的管理层反映在搜索图像,发现,视频内容以及徽标和Phavicons的显示中。
字符串用户代理:GoogleBot-Video/1.0。
robots.txt中的令牌:googlebot-video。
该网站的这种crauls会影响搜索与视频内容相关的视频和产品的功能。
该网站的此爬网不使用单独的HTTP用户代理。使用不同的Googlebot用户代理行执行新闻内容的crauling。
robots.txt中的令牌:googlebot-news。
CRAWLING设置会影响Google新闻服务,包括新闻和移动应用程序。
用户代理行用于台式机和移动设备,指示StoreBot-Google。
robots.txt中的token:storebot- google。
该站点用于收集用于交易产品的数据,例如在搜索Google的“购买”部分。
台式机和移动设备的USR代理线包含Google-InfectionTool。
robots.txt上的令牌:Google-InspectionTool。
该站点用于测试搜索结果,不影响Google搜索的一般结果。
行用户代理:Mozilla/...(兼容; Google Meter)用于移动设备和桌面设备。
robots.txt上的令牌:googleother。
该站点用于各种单个或内部任务,而不影响Google搜索结果。
用户代理行:Google Meter-image/1.0。
robots.txt中的令牌:Google Meter-image。
该网站的Crowler被优化用于收集图像而不影响特定的Google产品。
用户代理行:Google Meter-Video/1.0。
robots.txt中的令牌:Google Meter-Video。
用于收集视频文件而不影响搜索结果。
用户代理系列包含Google-loudvertexbot。
robots.txt中的令牌:google-cloudvertexbot。
它用于与Ai-Agent的构建有关的Kraling,并且不会影响Google的搜索结果。
它没有单独的HTTP字符串用户代理。 robots.txt中的令牌:google-扩展。
允许网站的所有者控制内容用于培训AI模型的内容,而不会影响搜索Google的排名。
用户代理行中的Chrome/W.X.Y.Z的名称是一个模板,该模板指示网站Crauls使用的Chrome浏览器的版本。版本编号随时间更新。
当用户代理在日志中搜索或过滤时,建议使用该版本的替换标志而不是准确的数字。
有任何疑问,您可以通过电子邮件与Seo Seo.com.computer联系 info@seo.computer 或通过WhatsApp +79202044461。
ID 141