Introducción a robots.txt para su sitio en Google

Introducción a robots.txt para su sitio en Google

El archivo Robots.txt le dice a los motores de búsqueda qué URL en su sitio puede estar disponible para su indexación. Este archivo se utiliza principalmente para evitar sobrecargar su sitio con solicitudes; No es un medio excluir una página web de los resultados de la búsqueda de Google. Si desea excluir una página de los resultados de búsqueda en Google, use el Methag noindex o proteja la página con una contraseña.

Si usa CMS, como WIX o Blogger, es posible que no necesite (o imposible) editar el archivo robots.txt directamente. En cambio, su CMS puede proporcionar una página de configuración de búsqueda u otro mecanismo para especificar motores de búsqueda, ya sea que su página debe ser escaneada.

Si desea ocultar o abrir una de sus páginas para los motores de búsqueda, busque instrucciones para cambiar la visibilidad de la página en los motores de búsqueda en su CMS (por ejemplo, busque "Wix ocultar una página de los motores de búsqueda").

¿Qué es un archivo robots.txt y cómo se usa para su sitio de Google?

El archivo Robots.txt se usa principalmente para controlar el tráfico de los motores de búsqueda en su sitio, y generalmente para excluir el archivo de la indexación de Google, dependiendo del tipo de archivo:

Cómo robots.txt afecta diferentes tipos de archivos para su sitio de Google

Páginas web

Puede usar el archivo Robots.txt para páginas web (, PDF u otros formatos que Google puede leer) para controlar el tráfico de indexación si cree que su servidor estará sobrecargado con solicitudes del robot de búsqueda de Google, o para evitar las páginas previas o duplicadas en su sitio.

Advertencia: No use el archivo robots.txt como una forma de ocultar una página web (que incluye PDF y otros formatos de texto compatibles con Google) de los resultados de la búsqueda de Google.

Si otras páginas se refieren a su página con texto descriptivo, Google puede indexar la URL sin visitar la página. Si desea excluir completamente la página de los resultados de búsqueda, use otros métodos, como la protección de contraseñas o el noindex Metatheg.

Si su página web está bloqueada en el archivo Robots.txt, su URL aún puede aparecer en los resultados de la búsqueda, pero la descripción no se mostrará en los resultados. Los archivos multimedia, los videos, el PDF y otros archivos integrados en la página bloqueada tampoco se escanearán si no se mencionan en otras páginas que están permitidas para la indexación. Si ve este resultado de la búsqueda para su página y desea solucionarla, elimine Robots.txt. Si desea ocultar la página por completo de la búsqueda en Google, use otro método.

Archivos multimedia

Puede usar el archivo robots.txt para controlar la indexación de tráfico y evitar la apariencia de imágenes, video y archivos de audio en los resultados de la búsqueda de Google. Esto no evitará enlaces a sus archivos multimedia de otras páginas o de usuarios.

  • Obtenga más información sobre cómo evitar la apariencia de imágenes en Google.
  • Obtenga más información sobre cómo eliminar o limitar los archivos de video de la apariencia en Google.

Archivos de recursos

Puede usar el archivo Robots.txt para bloquear archivos de recursos, como imágenes, scripts o estilos insignificantes, si cree que las páginas sin estos recursos no cambiarán significativamente. Sin embargo, si la ausencia de estos recursos complica la indexación del robot de Google, no los bloquee, de lo contrario, Google no podrá analizar correctamente las páginas que dependen de estos recursos.

Comprender las restricciones en el archivo robots.txt para su sitio de Google

Antes de crear o editar el archivo Robots.txt, debe comprender las restricciones en este método de bloqueo de URL. Dependiendo de sus objetivos y la situación, es posible que deba considerar otros mecanismos para asegurarse de que sus URL no se encuentren en Internet.

  • Robots.txt Las reglas del archivo no pueden ser compatibles con todos los motores de búsqueda. Las instrucciones en el archivo robots.txt no pueden afectar por la fuerza el comportamiento de los robots; Depende de si el robot debe seguir estas instrucciones. Aunque Googlebot y otros crauls web respetados siguen las reglas de archivo robots.txt, otros Kralers pueden no hacer esto. Por lo tanto, si desea guardar información de seguridad de los crauls web, es mejor usar otros métodos de bloqueo, por ejemplo, proteger los archivos con una contraseña.
  • Diferentes gayos pueden interpretar la sintaxis de diferentes maneras. A pesar del hecho de que los queridos crauls web siguen las reglas del archivo robots.txt, cada kraler puede interpretar estas reglas de manera diferente. Debe conocer la sintaxis correcta para referirse a diferentes rastreadores web, ya que algunos de ellos pueden no entender ciertas instrucciones.
  • La página prohibida en el archivo robots.txt aún se puede indexar si hay enlaces de otros sitios. Aunque Google no escaneará e indexará el contenido bloqueado en robots.txt, aún puede encontrar e indexar la URL prohibida si hay enlaces de otras páginas en Internet. Como resultado, la dirección de URL y, posiblemente, otros datos disponibles públicamente, como el texto de los enlaces a la página, aún pueden aparecer en los resultados de la búsqueda de Google. Para evitar completamente la aparición de su URL en los resultados de la búsqueda de Google, use la protección de contraseña, noindex methag o elimine la página en absoluto.

Atención: La combinación de varias reglas para el kraling e indexación puede causar un conflicto entre las reglas. Descubra cómo combinar las reglas de Kraling con indexación y pantalla.

Creación o actualización del archivo robots.txt para su sitio de Google

Si decide que necesita un archivo robots.txt, descubra cómo crearlo. Si el archivo ya existe, descubra cómo actualizarlo.

Información recomendada para su sitio en Google

Creación y envío del archivo robots.txt a Google

El archivo Robots.txt debe estar en la raíz de su sitio. Descubra cómo crear un archivo robots.txt, consulte ejemplos y estudie las reglas del archivo robots.txt.

Enviar el archivo Robots.txt actualizado a Google

Usando el informe Robots.txt, puede verificar fácilmente si Google puede procesar sus archivos robots.txt. Siga estos pasos para enviar archivos actualizados de robots.txt a Google.

Cómo Google interpreta la especificación del archivo robots.txt

Explore los detalles de las diversas reglas para el archivo robots.txt y cómo Google interpreta la especificación del archivo robots.txt.

Si tiene preguntas sobre el archivo robots.txt para su sitio de Google u otros aspectos de SEO, puede comunicarse con la compañía de SEO "SEO.CuPUTER" por correo electrónico: info@seo.computer o a través de whatsapp: +79202044461.

ID 25

Envíe una solicitud y le brindaremos una consulta. en SEO promoción de su sitio web