Revisión de Google Crauls y Frinters (Agentes de usuario) para su sitio web de Google

Revisión de Google Crauls y Frinters (Agentes de usuario) para su sitio web de Google

Google usa Kraler y chalecos para realizar varias acciones para sus productos, tanto automáticamente como a solicitud del usuario. Crowler (a veces también llamado "robot" o "araña") es un nombre común para un programa que se utiliza para detectar y escanear automáticamente los sitios web. Los thets actúan como un programa similar a WGET, y generalmente realiza una sola solicitud en nombre del usuario. Los productos de Google se pueden dividir en tres categorías:

Kraler ordinario para su sitio de Google

Kraler convencional utilizado para productos de Google (por ejemplo, Googlebot) siempre siga las reglas de robots.txt para escaneo automático.

Kraler especial para su sitio en Google

Kraler especial es similar a los comunes, pero se utilizan en productos específicos donde existe un acuerdo entre el sitio escaneado y el producto de Google con respecto al proceso de escaneo. Por ejemplo, ADSBOT ignora los robots globales.txt agente de usuario con la resolución del propietario del sitio.

Veters activados por el usuario para su sitio en Google

Los usuarios son parte de las funciones de producto y producto cuando el usuario final inicia la solicitud. Por ejemplo, el verificador del sitio de Google funciona a solicitud del usuario.

Características técnicas de Google Crawler y textura para su sitio de Google

Google Craolers y Veters están diseñados para funcionar simultáneamente en miles de máquinas para aumentar el rendimiento y la escalabilidad a medida que Internet crece. Para optimizar el uso del ancho de banda, estos clientes se distribuyen de acuerdo con muchos centros de datos en todo el mundo, por lo que se encuentran más cerca de los sitios a los que pueden ser contactados. Por lo tanto, las visitas de varias direcciones IP se pueden indicar en sus registros. Google Egress se lleva a cabo principalmente con direcciones IP en los Estados Unidos. Si Google encuentra que el sitio bloquea las solicitudes de los Estados Unidos, puede intentar escanear desde direcciones IP ubicadas en otros países.

Protocolos de programas compatibles para su sitio en Google

Google Craolers and Veters admite HTTP/1.1 y HTTP/2. Craolers utilizará la versión del protocolo, que proporciona el mejor rendimiento de escaneo, y pueden cambiar entre protocolos dependiendo de las estadísticas de las sesiones de escaneo anteriores. Por defecto, Google Kraler usa el protocolo HTTP/1.1. Escanear a través de HTTP/2 puede guardar recursos informáticos (por ejemplo, CP, RAM) tanto para su sitio como para GoogleBot, pero de lo contrario no ofrece ventajas específicas para el sitio (por ejemplo, esto no afecta la calificación en la búsqueda de Google). Para rechazar escaneo a través de HTTP/2, configure el servidor para que responda con el estado 421 cuando Google intente acceder a su sitio a través de HTTP/2. Si esto no es posible, puede enviar un mensaje al equipo de escaneo (aunque esta es una decisión temporal).

La infraestructura de Google Croilers también admite escaneo a través de FTP (como se define en RFC959 y sus actualizaciones) y FTP (como se define en RFC4217 y sus actualizaciones), sin embargo, escanear a través de estos protocolos es raro.

Métodos de compresión de contenido compatibles para su sitio web de Google

Google Craolers y los probadores admiten los siguientes métodos de compresión del contenido (codificación): GZIP, Deflate y Brotli (BR). La codificación de contenido compatible para cada agente de usuario de Google se indica en el encabezado de codificación de aceptación para cada solicitud que realicen. Por ejemplo: Aceptar-Ending: GZIP, Desinflar, Br.

Velocidad de escaneo y carga de alojamiento para su sitio en Google

Nuestro objetivo es escanear tantas páginas de su sitio como sea posible en cada visita sin sobrecargar el servidor. Si su sitio tiene dificultades para servir solicitudes de Google, puede reducir la velocidad de escaneo. Tenga en cuenta que enviar el estado HTTP incorrecto a Google Kraolers puede afectar cómo se mostrará su sitio en los productos de Google.

Coaching HTTP para su sitio de Google

La infraestructura de Google Kraler admite los espectáculos HTTP heurísticos, según lo determinado por el estándar de caché HTTP, en particular a través de los titulares ETAG e IF-None-Match, así como a través de los últimos encabezados de ropa de cama modificados e si no modificados.

Nota: Se recomienda establecer los valores de ETAG y el último modificado, independientemente de las preferencias de Google Cruls. Estos encabezados también son utilizados por otras aplicaciones como CMS.

Si tanto los campos ETAG como los últimos modificados están presentes en los encabezados de retorno, Google Kraler usa el valor ETAG, como lo requiere el estándar HTTP. Para Google Croilers, recomendamos usar ETAG en lugar de los últimos modificados para indicar las preferencias del almacenamiento en caché, ya que ETAG no tiene problemas con el formateo de fechas.

Otras directivas del almacenamiento en caché HTTP no son compatibles.

Crowlers separados y los veteros de Google pueden o no usar el almacenamiento en caché dependiendo de las necesidades del producto con el que están asociados. Por ejemplo, GoogleBot admite almacenamiento en caché cuando las URL de escaneo repetidas para la búsqueda de Google, y StoreBot-Google admite almacenamiento en caché solo bajo ciertas condiciones.

Para implementar la codificación HTTP para su sitio, comuníquese con su proveedor de alojamiento o proveedor del sistema de administración de contenido.

Etag e If-None-Match para su sitio de Google

La infraestructura de Google Craul admite ETAG e IF-None-Match, según lo determinado por el estándar de caché HTTP. Obtenga más información sobre el encabezado ETAG y su solicitud IF-None-Match.

Último modificado e si se modifica para su sitio en Google

La infraestructura de Google Kraler admite la última modificada e si modificada, según lo determine el estándar de caché HTTP, con las siguientes reservas:

  • La fecha en el último encabezado modificado debe formatearse de acuerdo con el estándar HTTP. Para evitar problemas con el análisis, recomendamos usar el siguiente formato de fecha: "Día de la semana, DD Mon Yyyy HH :MM :SS TimeZone ". Por ejemplo," Vie, 4 de septiembre de 1998 19:15:56 GMT ".
  • Aunque esto no es necesario, considere la posibilidad de instalar el campo Max-Age en el título de control de caché para ayudar al rastreador a determinar cuándo nuevamente escanear una URL específica. Establezca el valor máximo de la edad en el número esperado de segundos durante los cuales el contenido permanecerá sin cambios. Por ejemplo, Cache-Control: Max-Age = 94043.

Obtenga más información sobre el último encabezado modificado y su solicitud si modifica en el síndrome.

Verificación de Google Craolers and Frinders para su sitio de Google

Google Craules se identifican de tres maneras:

  • Solicitud HTTP USR-Agent.
  • Dirección IP de la fuente de consulta.
  • Fuente de IP DNS-HotMeum inversa.

Descubra cómo usar estos datos para verificar el cólera de Google y los frinces.

Si tiene preguntas sobre SEO o necesitará ayuda, comuníquese con nuestro SEO Companion por correo electrónico info@seo.computer o a través de whatsapp: +79202044461.

ID 61

Envíe una solicitud y le brindaremos una consulta. en SEO promoción de su sitio web