Cómo evitar que la información editada ingrese a Google para su sitio
Al publicar documentos e imágenes en Internet, puede publicar accidentalmente la información que desea ocultar. Es especialmente importante considerar que algunos formatos de documentos pueden contener información oculta que será visible para los motores de búsqueda.
Dado que los motores de búsqueda indexan el material disponible públicamente en la red, incluidas las imágenes, el contenido que no se ha editado por completo, se puede encontrar a través de la búsqueda en Google. Las tecnologías, como leer desde la pantalla, pueden hacer que dicha información "oculta" sea más asequible y los métodos de reconocimiento de imágenes populares, como el reconocimiento de símbolos ópticos (OCR), le permiten encontrar este contenido.
A pesar del hecho de que un cambio en el tamaño de la fuente, el uso del color del texto que coincide con el fondo, o ocultando el texto con la imagen puede hacer que sea invisible para el ojo humano, tales métodos no evitan la indexación por parte de los motores de búsqueda, y se puede encontrar información oculta.
Del mismo modo, algunos tipos de documentos pueden contener información que no es visible a primera vista. Por ejemplo, pueden incluir el historial de cambios en el documento, lo que permite a los usuarios ver el texto que fue editado o oculto. En algunos casos, se conserva la versión completa de la imagen, incluidas las piezas que fueron cortadas o ocultas. Además, los metadatos del documento pueden contener información sobre personas que editaron o vieron el archivo.
Todos estos datos pueden permanecer en el documento incluso después de su exportación o conversión a otro formato. Si necesita eliminar la información del archivo, es importante eliminarlo por completo antes de que el archivo esté disponible públicamente.
Aquí hay algunas mejores prácticas para la edición correcta de la información en documentos que no desea indexar y estar disponible a través de Google Search.
Edición y exportación adecuada de imágenes antes de integrarlas en el documento
La búsqueda de Google indexa las imágenes que se encuentran en Internet, tanto las de las páginas web como las que están integradas en varios formatos de documentos. Las imágenes integradas en los documentos a menudo se editan utilizando solo los instrumentos de edición del documento en sí. Esto puede conducir al hecho de que los datos ocultos no se eliminarán al indexar la imagen por separado del documento. Por lo tanto, es mejor editar imágenes antes de integrarse en el documento, y no después de eso. En particular:
- Recorte información innecesaria sobre las imágenes antes de su inserción en los documentos. Algunos instrumentos de edición de documentos (por ejemplo, procesadores de texto o medios para crear diapositivas) pueden guardar imágenes originales e incircunciadas en la versión pública del documento, así que asegúrese de verificar la documentación de la herramienta.
- Elimine completamente u oculte el texto u otras partes de la imagen que no deben ser visibles, ya que los sistemas OCR pueden convertir el texto en la imagen en el texto para la búsqueda.
- Elimine todos los metadatos innecesarios de las imágenes.
Después de seguir estas recomendaciones, exporte o guarde imágenes actualizadas en formatos fijos o "suavizados" como PNG o WebP. Esto evitará la inclusión de partes no deseadas de la imagen en un documento público.
Cómo eliminar el texto no deseado antes de convertirse en un formato público para su sitio
Antes de crear un documento público, elimine todos los datos que no deben mostrarse en su versión final. Vaya a un formato que no preserva la historia de los cambios. Aquí hay algunas recomendaciones adicionales:
- Use herramientas especiales de edición de archivos si necesita ocultar la información. Por ejemplo, evite el uso de rectángulos negros para ocultar el texto, ya que esto puede conducir al hecho de que el texto seguirá siendo en un documento público.
- Consulte el documento de metadatos en el archivo final.
- Siga las mejores prácticas para editar documentos dependiendo del formato (por ejemplo, PDF, imagen, etc.).
- Considere la información en la URL o el nombre del archivo. Incluso si parte del sitio se bloquea usando robots.txt, la URL se puede indexar en los motores de búsqueda (sin su contenido). Use Heshi en parámetros de URL en lugar de direcciones o nombres de correo electrónico.
- Piense en el uso de la autenticación para limitar el acceso a los datos editados. Agregue el meta noindex a la página de entrada para bloquear la indexación.
- Antes de la publicación, asegúrese de que el sitio se verifique en la consola de búsqueda de Google para que pueda eliminar rápidamente los materiales no deseados si es necesario.
Qué hacer si los documentos con edición inadecuada se indexaron a Google Search
- Elimine el documento activo del sitio o el lugar de su publicación.
- Use la herramienta de eliminación en la consola de búsqueda de Google para un sitio confirmado para eliminar los documentos de la búsqueda. Si necesita eliminar varios documentos, use el prefijo de URL. Para los sitios confirmados, la eliminación de URL generalmente toma menos de un día. Esto evitará la aparición de un documento en los resultados de búsqueda.
- Coloque el documento editado correctamente bajo la nueva URL. Por lo tanto, la nueva versión del documento se indexará y la versión anterior no caerá en la búsqueda (ya que la actualización de URL en el índice de Google puede llevar algún tiempo). Actualice todos los enlaces a documentos.
- Póngase en contacto con otros sitios que también pueden publicar documentos con edición incorrecta y pídales que eliminen estos documentos. Solicite usar la herramienta de eliminación de la consola de búsqueda en su cuenta, o use la herramienta de contenido obsoleto para actualizar los resultados de la búsqueda de Google.
- Deje que las consultas para la eliminación caduquen (esto sucederá después de que la URL se actualice en el índice de búsqueda de Google o después de 6 meses).
Si tiene preguntas, puede comunicarse con la compañía SEO.COMPUTER SEO en el correo electrónico info@seo.computer o a través de whatsapp por número +79202044461.
ID 18