Cómo los errores de código de estado HTTP, red y DNS afectan la indexación del sitio en Google

Cómo los errores de código de estado HTTP, red y DNS afectan la indexación del sitio en Google

Este artículo describe en detalle cómo el código de estado HTTP diferente, así como los errores de red y DNS afectan la visibilidad del sitio en el motor de búsqueda de Google. Se consideran las respuestas del servidor más comunes y los principales tipos de errores que el bot de búsqueda puede encontrar cuando camina por su sitio. No se consideran más códigos y protocolos raros. Todos los problemas descritos causan errores o advertencias apropiadas en los informes de indexar su sitio en la consola de búsqueda de Google.

Las funciones experimentales de los protocolos HTTP y FTP no son compatibles si el texto no se indica de lo contrario.

El estado del sitio HTTP y su impacto en la indexación de Google

El código de estado HTTP son las respuestas del servidor que se aborda el cliente, ya sea un navegador o un robot de búsqueda al solicitar una página del sitio. Cada código tiene un cierto valor, pero a menudo el proceso de procesamiento es similar. Por ejemplo, varios códigos indican un reenvío, pero el resultado es un éxito en la URL final.

Google Search Console registra errores para códigos del rango 4xx y 5xx, así como para redireccionamientos sin éxito (3xx). Si el servidor devuelve el código 2xx, el contenido de la página puede aceptarse para la indexación, pero no hay garantía.

A continuación se muestra una tabla con el código de estado HTTP principal, que se encuentra con mayor frecuencia al escanear el sitio y su influencia en la indexación en Google.

2xx (respuestas exitosas del servidor del sitio en Google)

Dichos códigos significan la transmisión exitosa del contenido que Google puede procesar para la indexación. Sin embargo, si la página contiene un error, por ejemplo, contenido vacío o mensaje de error, Google puede clasificarlo como un error suave 404.

200 (OK) - La página se carga correctamente, el contenido se transfiere al sistema de indexación. La indexación es posible, pero no garantizada.

201 (creado), 202 (aceptado) - Googlebot espera que el contenido obtenga un tiempo limitado, después de lo cual envía datos disponibles para la indexación. El tiempo de espera depende del tipo de agente.

204 (sin contenido) - GoogleBot le dice al sistema de indexación que no hay contenido. En el informe de indexación, esto puede parecer un error suave 404.

3xx (reenvío y procesamiento del sitio en Google)

Googlebot puede cruzar una cadena de un máximo de 10 redirecciones. Si se excede el límite y el contenido no se recibe, el error de redirección estará en el informe de indexación. El número de transiciones depende del tipo de GoogleBot.

Se ignora todo el contenido de la URL de los redistros, y solo se acepta la URL final para la indexación. Para archivos robots.txt con códigos 3xx, se utilizan reglas especiales.

301 (movido para siempre) - Googlebot sigue la redirección y considera la URL final de la principal, pasándola en el peso de la página.

302 (movido temporalmente) - Googlebot sigue la redirección, pero la señal a la canonicidad es más débil.

303, 304 (no cambió) - Google informa que el contenido no ha cambiado desde la última visita y no se indexa nuevamente.

307, 308 - Del mismo modo 302 y 301, respectivamente, pero semánticamente diferente. Para su sitio, use el código correcto para una mejor compatibilidad con otros clientes.

4xx (errores y consecuencias del cliente del sitio para la indexación en Google)

Las páginas con respuestas 4xx no se consideran para la indexación, y si ya están en el índice, se eliminan. El contenido de tales páginas se ignora por completo.

400 (solicitud incorrecta) Y el otro 4xx, excepto 429, significa que no hay contenido, y la URL se excluye del índice. La frecuencia de omitir tales páginas se reduce gradualmente.

No use 401 y 403 para limitar la frecuencia de desvío: estos códigos no afectan la velocidad de escaneo. Para restringir el bypass, use configuraciones especiales.

401 (no autorizado), 403 (prohibido), 404 (no encontrado), 410 (eliminado), 411 (longitud requerida)

429 (demasiadas solicitudes) - Google percibe este código como un signo de sobrecarga del servidor, perteneciente a errores del servidor.

5xx (errores del sitio del servidor y su impacto en la indexación en Google)

Los errores de 5xx y 429 causan una disminución temporal en la velocidad de evitar el sitio. Las URL ya indexadas se conservan, pero con errores constantes se eliminarán del índice.

Las páginas de 5xx no se tienen en cuenta al indexar. Para robots.txt, hay reglas separadas con 5xx.

500 (error interno del servidor) - Google reduce la frecuencia de omisión del sitio dependiendo del número de tales errores.

502 (Bad Gateway), 503 (el servicio no está disponible) - Acciones similares para restringir el escaneo.

Errores suaves 404 en el sitio en Google

El error suave 404 ocurre si la página devuelve el estado de 200, pero contiene un mensaje de error o contenido vacío. Esto puede ser causado por problemas técnicos, por ejemplo, la ausencia de archivos incluidos o una página de búsqueda vacía.

Dichas páginas crean una experiencia de usuario deficiente y están excluidas de la indexación de Google. El informe de la consola de búsqueda muestra una advertencia sobre un error de 404 suave.

Cómo solucionar los errores de 404 suaves para su sitio en Google

Las opciones de solución dependen de la situación y del resultado deseado:

  • La página y el contenido se eliminan por completo.
  • La página o contenido se transfieren a otra URL.
  • La página y el contenido están disponibles y deben indexarse.
Si se eliminan la página y el contenido

Devuelva el estado HTTP 404 o 410 para una página sin reemplazo para que los motores de búsqueda sepan que debe eliminarse del índice. Configure la página 404 del usuario con consejos útiles y navegación para visitantes.

  • Informe claramente que la página no se encuentra utilizando un lenguaje comprensible y amigable.
  • Mantenga el estilo y la navegación de su sitio.
  • Agregue enlaces a secciones populares o página principal.
  • Considere la posibilidad de comentarios para mensajes sobre enlaces rotos.

El usuario 404 debe devolver el código 404 para evitar indexar tales páginas.

Si la página o el contenido se mueven

Configure una redirección constante 301 a una nueva página con un contenido similar para que los usuarios y los motores de búsqueda cambien correctamente a la información relevante. Verifique la respuesta correcta a través de la herramienta de verificación de URL.

Si la página y el contenido aún están disponibles

Quizás Googlebot no pudo cargar correctamente la página debido a la falta de recursos, errores en el código o bloqueos. Use la herramienta de prueba de URL para ver el dibujo de la página y el código HTTP. Los problemas con la carga de recursos, como scripts e imágenes, pueden conducir a un error de 404 leve.

Las razones principales son los bloqueos en robots.txt, demasiados recursos en la página, errores del servidor, descarga lenta o archivos demasiado grandes.

Errores de red y sitio de DNS y su impacto en la indexación de Google

Los errores de red y DNS afectan rápidamente negativamente la posición del sitio en la búsqueda. Googlebot, al detectar tiempos de espera, descargas de conexión o problemas con DNS, comienza a reducir la frecuencia de desvío, ya que entiende que el servidor no hace frente a la carga.

Dado que el contenido no se obtiene con tales errores, Google no puede indexar páginas, y las páginas indexadas previamente que no se han disponibles se eliminan de la búsqueda en unos pocos días. En los informes de la consola de búsqueda hay errores correspondientes.

Si no controla el servidor usted mismo, le recomendamos que se comunique con su alojamiento o proveedor de CDN.

Cómo depurar errores del sitio web de la red para mejorar la indexación en Google

Los errores de red pueden ocurrir antes del procesamiento de la solicitud por el servidor o en el proceso de escaneo. La ausencia de código HTTP complica el diagnóstico. Para eliminar los errores en el tiempo de espera y el restablecimiento de la conexión:

  • Verifique la configuración y los registros de Logwall. Excluir direcciones IP de bloqueo del robot de búsqueda.
  • Analice el tráfico de red utilizando herramientas especializadas para detectar mal funcionamiento en los componentes de la red.
  • Si no identifica el problema usted mismo, comuníquese con su proveedor de alojamiento.

Los problemas pueden asociarse con la sobrecarga de interfaces de red o el cierre incorrecto de los puertos, lo que conduce a la pérdida de paquetes y la descarga de conexiones.

Cómo diagnosticar y corregir errores del sitio DNS para una indexación exitosa en Google

La mayoría de las veces, los errores de DNS son causados por solicitudes incorrectas o de bloqueo a nivel de firewall. Para diagnosticar los siguientes pasos:

  • Verifique las reglas del firewall y asegúrese de que el robot de búsqueda de IP no esté bloqueado, y las consultas UDP y TCP están permitidas.
  • Verifique la relevancia de los registros DNS A y CNAME, asegúrese de que la corrección de la IP y los nombres especificados.
  • Asegúrese de que todos los servidores DNS se indiquen correctamente y funcionen correctamente.
  • Si recientemente se han realizado cambios en el DNS, tenga en cuenta el tiempo para la distribución de actualizaciones y, si es necesario, limpie el caché DNS.
  • Si controla su propio servidor DNS, asegúrese de su trabajo estable y la ausencia de sobrecargas.

Para cualquier pregunta para mejorar la indexación de su sitio en Google, le recomendamos que se comunique con la compañía SEO CEO por correo electrónico info@seo.computer O a través de whatsapp +79202044461.

ID 70

Envíe una solicitud y le brindaremos una consulta. en SEO promoción de su sitio web