Este artigo descreve em detalhes como o código de status HTTP diferente, bem como erros de rede e DNS, afetam a visibilidade do site no mecanismo de pesquisa do Google. As respostas do servidor mais comuns e os principais tipos de erros que o bot de pesquisa pode encontrar ao percorrer seu site são considerados. Códigos e protocolos mais raros não são considerados. Todos os problemas descritos causam erros ou avisos apropriados nos relatórios de indexação do seu site no console de pesquisa do Google.
As funções experimentais dos protocolos HTTP e FTP não são suportadas se o texto não for indicado de outra forma.
O código de status HTTP é as respostas do servidor que o cliente é abordado, seja um navegador ou um robô de pesquisa ao solicitar uma página do site. Cada código tem um determinado valor, mas geralmente o processo de processamento é semelhante. Por exemplo, vários códigos indicam um encaminhamento, mas o resultado é um sucesso no URL final.
O Console de Pesquisa do Google registra erros de códigos da faixa 4xx e 5xx, bem como para redirecionamentos sem sucesso (3xx). Se o servidor retornar o código 2xx, o conteúdo da página poderá ser aceito para indexação, mas não há garantia.
Abaixo está uma tabela com o código de status HTTP principal, que geralmente é encontrado ao digitalizar o site e sua influência na indexação no Google.
Tais códigos significam a transmissão bem -sucedida do conteúdo que o Google pode processar para indexação. No entanto, se a página contiver um erro, por exemplo, conteúdo vazio ou mensagem de erro, o Google poderá classificá -lo como um erro suave 404.
200 (ok) - A página é carregada com sucesso, o conteúdo é transferido para o sistema de indexação. A indexação é possível, mas não garantida.
201 (criado), 202 (aceito) - O GoogleBot espera que o conteúdo obtenha um tempo limitado, após o que envia dados disponíveis para indexação. O tempo de espera depende do tipo de agente.
204 (sem conteúdo) - O GoogleBot informa ao sistema de indexação que não há conteúdo. No relatório de indexação, isso pode parecer um erro suave 404.
O Googlebot pode atravessar uma cadeia de no máximo 10 redirecionamentos. Se o limite for excedido e o conteúdo não for recebido, o erro de redirecionamento estará no relatório de indexação. O número de transições depende do tipo de Googlebot.
Todo o conteúdo do URL redistério é ignorado e apenas o URL final é aceito para indexação. Para arquivos robots.txt com códigos 3xx, regras especiais são usadas.
301 (movido para sempre) - O Googlebot segue o redirecionamento e considera o URL final o principal, passando com o peso da página.
302 (movido temporariamente) - O Googlebot segue o redirecionamento, mas o sinal para a canonalidade é mais fraco.
303, 304 (não mudou) - O Google relata que o conteúdo não mudou em relação à última visita e não indexa novamente.
307, 308 - Da mesma forma, 302 e 301, respectivamente, mas semanticamente diferentes. Para o seu site, use o código certo para melhor compatibilidade com outros clientes.
As páginas com respostas 4xx não são consideradas para indexação e, se já estiverem no índice, elas serão removidas. O conteúdo dessas páginas é completamente ignorado.
400 (solicitação incorreta) E o outro 4xx, exceto 429, significa que não há conteúdo e o URL é excluído do índice. A frequência de ignorar essas páginas é gradualmente reduzida.
Não use 401 e 403 para limitar a frequência de desvio - esses códigos não afetam a velocidade de varredura. Para restringir o desvio, use configurações especiais.
401 (não autorizado), Assim, 403 (proibido), Assim, 404 (não encontrado), Assim, 410 (excluído), Assim, 411 (comprimento necessário)
429 (muitos pedidos) - O Google percebe esse código como um sinal de sobrecarga do servidor, pertencente a erros do servidor.
Os erros de 5xx e 429 causam uma diminuição temporária na velocidade de ignorar o local. Os URLs indexados já estão preservados, mas com erros constantes serão removidos do índice.
As páginas de 5xx não são levadas em consideração ao indexação. Para robots.txt, existem regras separadas com 5xx.
500 (erro interno do servidor) - O Google reduz a frequência do site ignorando, dependendo do número de erros.
502 (Bad Gateway), 503 (o serviço não está disponível) - Ações semelhantes para restringir a varredura.
O erro SOFT 404 ocorre se a página retornar o status de 200, mas contiver uma mensagem de erro ou conteúdo vazio. Isso pode ser causado por problemas técnicos, por exemplo, a ausência de arquivos incluídos ou uma página de pesquisa vazia.
Tais páginas criam uma experiência ruim do usuário e são excluídas da indexação do Google. O relatório do console de pesquisa exibe um aviso sobre um erro 404 suave.
As opções de solução dependem da situação e do resultado desejado:
Retorne o status HTTP 404 ou 410 para uma página sem substituição, para que os mecanismos de pesquisa saibam que ele precisa ser removido do índice. Configure a página 404 do usuário com dicas úteis e navegação para visitantes.
O usuário 404 deve retornar o código 404 para evitar a indexação dessas páginas.
Configure um redirecionamento constante 301 para uma nova página com um conteúdo semelhante para que os usuários e os mecanismos de pesquisa mudem corretamente para informações relevantes. Verifique a resposta correta através da ferramenta de verificação de URL.
Talvez o Googlebot não possa carregar corretamente a página devido à falta de recursos, erros no código ou bloqueios. Use a ferramenta de teste de URL para visualizar o desenho da página e o código HTTP. Problemas com o carregamento de recursos, como scripts e imagens, podem levar a um erro 404 leve.
Os principais motivos são bloqueios no robots.txt, muitos recursos na página, erros de servidor, download lento ou arquivos muito grandes.
Os erros de rede e DNS afetam rapidamente negativamente a posição do site na pesquisa. O Googlebot, ao detectar tempo limite, descarrega de conexão ou problemas com o DNS, começa a reduzir a frequência de desvio, pois ele entende que o servidor não lida com a carga.
Como o conteúdo não é obtido com esses erros, o Google não pode indexar as páginas e as páginas indexadas anteriormente que se tornaram indisponíveis são removidas da pesquisa em alguns dias. Nos relatórios do console de pesquisa, existem erros correspondentes.
Se você não controlar o servidor, recomendamos que você entre em contato com seu provedor de hospedagem ou CDN.
Erros de rede podem ocorrer antes do processamento da solicitação pelo servidor ou no processo de digitalização. A ausência de código HTTP complica o diagnóstico. Para eliminar erros no tempo e a conexão Redefinir:
Os problemas podem estar associados à sobrecarga de interfaces de rede ou fechamento inadequado de portas, o que leva à perda de pacotes e descarga de conexões.
Na maioria das vezes, os erros de DNS são causados por solicitações inadequadas de configuração ou bloqueio no nível do firewall. Para diagnosticar as seguintes etapas:
Para qualquer dúvida para melhorar a indexação do seu site no Google, recomendamos que você entre em contato com a empresa de SEO CEO por e -mail info@seo.computer Ou através do WhatsApp +79202044461.
Id 70