Introdução ao robots.txt para o seu site no Google

Introdução ao robots.txt para o seu site no Google

O arquivo robots.txt informa aos mecanismos de pesquisa quais URLs em seu site podem estar disponíveis para a indexação. Este arquivo é usado principalmente para evitar sobrecarregar seu site com solicitações; Não é um meio de excluir uma página da web dos resultados da pesquisa do Google. Se você deseja excluir uma página dos resultados da pesquisa no Google, use o Noindex Methag ou proteja a página com uma senha.

Se você usar o CMS, como Wix ou Blogger, talvez não precise (ou impossível) editar o arquivo robots.txt diretamente. Em vez disso, seu CMS pode fornecer uma página de configurações de pesquisa ou outro mecanismo para especificar mecanismos de pesquisa, se sua página deve ser digitalizada.

Se você deseja ocultar ou abrir uma de suas páginas para os mecanismos de pesquisa, procure instruções para alterar a visibilidade da página nos mecanismos de pesquisa no seu CMS (por exemplo, procure "Wix ocultar uma página dos mecanismos de pesquisa").

O que é um arquivo robots.txt e como ele é usado para o seu site do Google?

O arquivo robots.txt é usado principalmente para controlar o tráfego dos mecanismos de pesquisa no seu site e, geralmente, para excluir o arquivo da indexação do Google, dependendo do tipo de arquivo:

Como robots.txt afeta diferentes tipos de arquivos para o seu site do Google

Páginas da web

Você pode usar o arquivo robots.txt para páginas da web (, PDF ou outros formatos que o Google pode ler) para controlar o tráfego de indexação se você acha que seu servidor será sobrecarregado com solicitações do robô de pesquisa do Google ou para evitar as páginas pré-longa ou duplicar no seu site.

Aviso: Não use o arquivo robots.txt como uma maneira de ocultar uma página da web (incluindo PDF e outros formatos de texto suportados pelo Google) a partir dos resultados da pesquisa do Google.

Se outras páginas se referirem à sua página com texto descritivo, o Google poderá indexar o URL sem visitar a página. Se você deseja excluir completamente a página dos resultados da pesquisa, use outros métodos, como proteção de senha ou noindex metatheg.

Se sua página da web estiver bloqueada no arquivo robots.txt, seu URL ainda poderá aparecer nos resultados da pesquisa, mas a descrição não será exibida nos resultados. Arquivos de mídia, vídeos, PDF e outros arquivos incorporados na página bloqueada também não serão digitalizados se não forem mencionados em outras páginas permitidas para a indexação. Se você vir esse resultado de pesquisa para sua página e deseja corrigi -la, exclua robots.txt. Se você deseja ocultar completamente a página da pesquisa no Google, use outro método.

Arquivos de mídia

Você pode usar o arquivo robots.txt para controlar a indexação de tráfego e impedir a aparência de imagens, arquivos de vídeo e áudio nos resultados da pesquisa do Google. Isso não impedirá os links para seus arquivos de mídia de outras páginas ou usuários.

  • Saiba mais sobre como impedir a aparência das imagens no Google.
  • Saiba mais sobre como excluir ou limitar os arquivos de vídeo da aparência no Google.

Arquivos de recursos

Você pode usar o arquivo robots.txt para bloquear arquivos de recursos, como imagens, scripts ou estilos insignificantes, se você acha que as páginas sem esses recursos não serão alteradas significativamente. No entanto, se a ausência desses recursos complicar a indexação do Google Robot, não os bloquear, caso contrário, o Google não poderá analisar corretamente as páginas que dependem desses recursos.

Compreendendo as restrições no arquivo robots.txt para o seu site do Google

Antes de criar ou editar o arquivo robots.txt, você deve entender as restrições neste método de bloqueio de URL. Dependendo de seus objetivos e da situação, pode ser necessário considerar outros mecanismos para garantir que seus URLs não sejam encontrados na Internet.

  • As regras do arquivo robots.txt não podem ser suportadas por todos os mecanismos de pesquisa. As instruções no arquivo robots.txt não podem afetar à força o comportamento dos robôs; Depende se o robô deve seguir estas instruções. Embora o Googlebot e outros Crauls respeitados da Web sigam as regras do arquivo robots.txt, outros Kralers podem não fazer isso. Portanto, se você deseja salvar informações de segurança dos Crauls, é melhor usar outros métodos de travamento, por exemplo, proteger os arquivos com uma senha.
  • Crawles diferentes podem interpretar a sintaxe de maneiras diferentes. Apesar do fato de que o Dear Web Crauls siga as regras do arquivo robots.txt, cada Kraler pode interpretar essas regras de maneira diferente. Você deve conhecer a sintaxe correta para se referir a diferentes crawers da web, pois alguns deles podem não entender certas instruções.
  • A página proibida no arquivo robots.txt ainda pode ser indexada se houver links de outros sites para ele. Embora o Google não digitalize e indexe o conteúdo bloqueado no robots.txt, ele ainda pode encontrar e indexar o URL proibido se houver links de outras páginas na Internet. Como resultado, o endereço da URL e, possivelmente, outros dados publicamente disponíveis, como o texto dos links para a página, ainda podem aparecer nos resultados da pesquisa do Google. Para impedir completamente a aparência do seu URL nos resultados da Pesquisa do Google, use a proteção de senha, o NoIndex Methag ou exclua a página.

Atenção: A combinação de várias regras para kraling e indexação pode causar um conflito entre as regras. Descubra como combinar regras de kraling com indexação e exibição.

Criação ou atualização do arquivo robots.txt para o seu site do Google

Se você decidir que precisa de um arquivo robots.txt, descubra como criá -lo. Se o arquivo já existir, descubra como atualizá -lo.

Informações recomendadas para o seu site no Google

Criação e envio do arquivo robots.txt para o google

O arquivo robots.txt deve estar na raiz do seu site. Descubra como criar um arquivo robots.txt, consulte Exemplos e estude as regras do arquivo robots.txt.

Enviando o arquivo robots.txt atualizado para o google

Usando o relatório robots.txt, você pode verificar facilmente se o Google pode processar seus arquivos robots.txt. Siga estas etapas para enviar arquivos robots.txt atualizados para o Google.

Como o Google interpreta a especificação do arquivo robots.txt

Explore os detalhes das várias regras para o arquivo robots.txt e como o Google interpreta a especificação do arquivo robots.txt.

Se você tiver dúvidas sobre o arquivo robots.txt para o seu site do Google ou outros aspectos do SEO, entre em contato com a empresa de SEO "Seo.computer" por e -mail: info@seo.computer ou através do WhatsApp: +79202044461.

Id 25

Envie uma solicitação e forneceremos uma consulta sobre SEO promoção do seu site