Os coradores gerais do site são usados para procurar informações e criar mecanismos de pesquisa do Google. Eles também são usados para tarefas específicas de produtos e analistas. Esses rastreadores sempre seguem as regras robots.txt com desvio automático. As características técnicas dos principais kralers do site se aplicam ao General Kraler.
Como regra, os chuletos gerais do site trabalham com os endereços IP listados na instalação especial do GoogleBot.json, e as verificações de DNS reversas para seus hostemams correspondem a Crawl-***-***-***-***. Googlebot.com ou ***-***-***. Geo-crawl-***-***-***-***. Geo.googlebot.com.
A lista mostra as cabanas gerais do site, suas linhas agentes de usuário nas verificações HTTP, correspondendo aos tokens agentes do usuário para diretivas robots.txt, bem como produtos que são influenciados por configurações de aumento de cada kraler. Alguns Kralers têm vários tokens-agentes do usuário-é suficiente para comparar um deles para aplicar as regras. A lista não é exaustiva, inclui apenas os pedidos mais comuns e aqueles em que as perguntas vieram.
ATENÇÃO: A linha agente do usuário na solicitação HTTP pode ser falsificada. Recomenda -se verificar se o visitante é realmente um Chuler do site do Google Search Engine.
As linhas de agente de usuário nas verificações HTTP do GoogleBot têm dois tipos principais para smartphones e para dispositivos de mesa. Exemplo para smartphones: Mozilla/5.0 (Linux; Android) Applewebkit/... Chrome/... Safari móvel/... (Compatível; GoogleBot/2.1; ...). Para dispositivos de mesa - Mozilla/5.0 AppleWebkit/... (Compatível; GoogleBot/2.1; ...).
Menos comumente, existem opções como Mozilla/5.0 (compatível; GoogleBot/2.1; ...) ou apenas GoogleBot/2.1 (...).
O robots.txt usa o GoogleBot Token para gerenciar esse rastreador do site.
As configurações do GoogleBot afetam os produtos de pesquisa do Google, incluindo pesquisa, descoberta, pesquisa de imagens e notícias, vídeo e notícias.
Usuário de linha: GoogleBot-Image/1.0.
Token in robots.txt: GoogleBot-Image.
O gerenciamento de crauling por este kraler do site é refletido na busca de imagens, descoberta, conteúdo de vídeo e exibição de logotipos e phavicons nos resultados da pesquisa do Google.
O agente de usuário da String: Googlebot-Video/1.0.
Token in robots.txt: googlebot-video.
Este Crauls do Site afeta as funções de busca de vídeos e produtos relacionados ao conteúdo de vídeo.
Este rastreador do site não usa um agente de usuário HTTP separado. Crauling de conteúdo de notícias é realizado usando diferentes linhas agentes do usuário do Googlebot.
Token in robots.txt: GoogleBot-News.
As configurações de Crowling afetam o Google News Services, incluindo notícias e aplicativos móveis.
As linhas de agente de usuário são para dispositivos de mesa e móveis indicando StoreBot-Google.
Token in robots.txt: StoreBot- Google.
Este site é usado para coletar dados para produtos de negociação, como a seção de compras na busca pelo Google.
As linhas USR-Agent para dispositivos de mesa e móveis contêm Google-InfectionTool.
Token em robots.txt: Google-InspeçãoTool.
Este site é usado para testar os resultados da pesquisa e não afeta os resultados gerais da pesquisa do Google.
Linhas de agente de usuário: Mozilla/... (compatível; Googleometer) para dispositivos móveis e de mesa.
Token em robots.txt: GoogleOther.
Este site é usado para várias tarefas únicas ou internas, sem afetar os resultados da pesquisa do Google.
Linha agente do usuário: Googleometer-Image/1.0.
Token in robots.txt: Googleometer-Image.
Crowler do site é otimizado para coletar imagens sem afetar produtos específicos do Google.
Linha agente do usuário: Googleometer-video/1.0.
Token in robots.txt: Googleometer-video.
Usado para coletar arquivos de vídeo sem afetar os resultados da pesquisa.
A linha agente do usuário contém Google-cloudvertexbot.
Token in robots.txt: google- cloudvertexbot.
É usado para a KRALing relacionado à construção de AI-Agents e não afeta os resultados da pesquisa do Google.
Ele não possui uma string http separada-agente. Token in robots.txt: google- estendido.
Permite que os proprietários do site controlem o uso do conteúdo para treinar modelos de IA sem afetar a classificação na busca pelo Google.
A designação Chrome/W.X.Y.Z nas linhas agentes do usuário é um modelo que indica a versão do navegador Chrome usado pelos Crauls do site. O número da versão é atualizado com o tempo.
Ao pesquisar ou filtrar por agente de usuário em logs, é recomendável usar sinais de substituição para a versão em vez de um número preciso.
Para qualquer dúvida, você pode entrar em contato com seo seo.computer por e -mail info@seo.computer Ou através do WhatsApp +79202044461.
Id 141