Как не допустить попадания отредактированной информации в поиск Гугл (Google) для вашего сайта

Как не допустить попадания отредактированной информации в поиск Гугл (Google) для вашего сайта

При публикации документов и изображений в интернете можно случайно опубликовать информацию, которую вы хотели скрыть. Особенно важно учитывать, что некоторые форматы документов могут содержать скрытую информацию, которую будет видно поисковым системам.

Так как поисковые системы индексируют общедоступный материал в сети, включая изображения, контент, который не был полностью отредактирован, может быть найден через поиск в Гугл (Google). Технологии, такие как системы чтения с экрана, могут сделать такую «скрытую» информацию более доступной, а популярные методы распознавания изображений, такие как оптическое распознавание символов (OCR), позволяют находить этот контент.

Несмотря на то, что изменение размера шрифта, использование цвета текста, совпадающего с фоном, или скрытие текста изображением может сделать его невидимым для человеческого глаза, такие методы не предотвращают индексирование поисковыми системами, и скрытая информация может быть найдена.

Аналогично, некоторые типы документов могут содержать информацию, которая не видна на первый взгляд. Например, они могут включать историю изменений документа, позволяя пользователям увидеть текст, который был отредактирован или скрыт. В некоторых случаях сохраняется полная версия изображения, включая части, которые были обрезаны или скрыты. Кроме того, в метаданных документа может содержаться информация о людях, которые редактировали или просматривали файл.

Все эти данные могут остаться в документе даже после его экспорта или конвертации в другой формат. Если нужно удалить информацию из файла, важно полностью удалить ее до того, как файл станет общедоступным.

Вот несколько лучших практик по правильному редактированию информации в документах, которые вы не хотите, чтобы индексировались и становились доступными через Гугл (Google) Search.

Правильное редактирование и экспорт изображений перед их встраиванием в документ

Поиск Гугл (Google) индексирует изображения, найденные в интернете, как те, что находятся на веб-страницах, так и те, которые встроены в различные форматы документов. Изображения, встроенные в документы, часто редактируются с использованием только инструментов редактирования самого документа. Это может привести к тому, что скрытые данные не будут удалены при индексации изображения отдельно от документа. Поэтому лучше редактировать изображения до их встраивания в документ, а не после этого. В частности:

  • Обрезайте ненужную информацию на изображениях перед их вставкой в документы. Некоторые инструменты редактирования документов (например, текстовые процессоры или средства создания слайдов) могут сохранить оригинальные, необрезанные изображения в публичной версии документа, поэтому обязательно проверьте документацию инструмента.
  • Полностью удаляйте или скрывайте текст или другие части изображения, которые не должны быть видны, так как системы OCR могут преобразовать текст на изображении в текст для поиска.
  • Удаляйте все ненужные метаданные из изображений.

После того как вы следуете указанным рекомендациям, экспортируйте или сохраняйте обновленные изображения в неподвижных или «сглаженных» форматах, таких как PNG или WEBP. Это предотвратит включение нежелательных частей изображения в публичный документ.

Как правильно удалить нежелательный текст перед конвертацией в публичный формат для вашего сайта

Перед тем как создать публичный документ, удалите все данные, которые не должны быть отображены в его финальной версии. Перейдите к формату, который не сохраняет историю изменений. Вот несколько дополнительных рекомендаций:

  • Используйте специальные инструменты для редактирования файлов, если необходимо скрыть информацию. Например, избегайте использования черных прямоугольников для скрытия текста, так как это может привести к тому, что текст все равно останется в публичном документе.
  • Проверьте метаданные документа в итоговом файле.
  • Следуйте лучшим практикам редактирования документов в зависимости от формата (например, PDF, изображение и т.д.).
  • Учитывайте информацию в URL или имени файла. Даже если часть сайта блокируется с помощью robots.txt, URL могут быть проиндексированы в поисковиках (без их содержания). Используйте хэши в URL-параметрах вместо email-адресов или имен.
  • Подумайте об использовании аутентификации для ограничения доступа к отредактированным данным. Добавьте meta-метку noindex на страницу входа, чтобы заблокировать индексацию.
  • Перед публикацией убедитесь, что сайт верифицирован в Гугл (Google) Search Console, чтобы можно было быстро удалить нежелательные материалы в случае необходимости.

Что делать, если документы с неправильным редактированием были проиндексированы в Гугл (Google) Search

  • Удалите активный документ с сайта или места его публикации.
  • Используйте инструмент удаления в Гугл (Google) Search Console для подтвержденного сайта, чтобы удалить документы из поиска. Если необходимо удалить несколько документов, используйте префикс URL. Для подтвержденных сайтов удаление URL обычно занимает менее суток. Это предотвратит появление документа в поисковой выдаче.
  • Разместите корректно отредактированный документ под новым URL. Таким образом, новая версия документа будет индексироваться, а старая версия не попадет в поиск (так как обновление URL в индексе Гугл (Google) может занять некоторое время). Обновите все ссылки на документы.
  • Свяжитесь с другими сайтами, которые могут также размещать документы с неправильным редактированием, и попросите их удалить эти документы. Попросите использовать инструмент удаления в их аккаунте Search Console, или воспользуйтесь инструментом Outdated Content для того, чтобы обновить результаты поиска Гугл (Google).
  • Позвольте запросам на удаление истечь (это произойдет после того, как URL будут обновлены в поисковом индексе Гугл (Google) или через 6 месяцев).

Если у вас возникнут вопросы, вы можете связаться с SEO-компанией "seo.computer" по адресу электронной почты info@seo.computer или через WhatsApp по номеру +79202044461.

id 18

Отправьте заявку и мы предоставим консультацию на SEO продвижение вашего сайта