Для того чтобы избавиться от дублирующихся страниц, важно их правильно выявить, что порой бывает трудоемким процессом. В этом поможет специализированная программа для поиска дублей, которая позволяет обнаружить страницы, схожие между собой на 70-80%. В этой статье представлена подробная инструкция по поиску дублей.
Перейдите в раздел «Конфигурации» и выберите пункт «Content». Затем откройте опцию для поиска дублей страниц — «Duplicates».
В открывшемся окне активируйте опцию «Enable Near Duplicates». Далее установите порог схожести для поиска дубликатов, который в пределах 80-90% считается оптимальным. Можно задать значение ниже, чтобы получить более точные результаты.
После настройки запускаем парсинг сайта. Перейдите в раздел «Content», где в верхнем углу выберите строку «Near Duplicates». В открывшемся списке будут отображены страницы, отсортированные по степени схожести. Ссылки расположены по убыванию схожести, начиная с 100%.
Кликнув на ссылку, можно отправить ее в нижнее окно и, при необходимости, проверить все параметры страницы. Повторное нажатие позволит открыть подробные настройки, где можно увидеть схожие элементы и выявить причины дублирования.
Если сайт слишком большой, и поиск займет много времени, можно повысить порог схожести. Для этого в меню выбираем «Crawl Analytics», затем нажимаем «Configure» в выпадающем списке.
Проверьте, установлен ли флажок напротив пункта «Content», чтобы был активен анализ контента. Если флажок отсутствует, поставьте его и нажмите «Start» для продолжения работы.
Результаты можно проверить в разделе «Near Duplicates». В этом случае будут отображены только те страницы, которые имеют более высокую степень схожести.
Причины дублирования страниц часто связаны с наличием одинаковых элементов на многих страницах, таких как шапка сайта или блоки с популярными товарами. Чтобы проверить только уникальные части контента, перейдите в раздел «Content» и выберите пункт «Area» в выпадающем списке.
В открывшемся окне вы увидите два режима — «Include» (Включить) и «Exclude» (Исключить), где можно настроить поиск по тегам, классам или ID блоков.
Для примера, чтобы исключить блок с популярными товарами, вставьте класс или тег этого блока и выберите опцию «Exclude».
Теперь возвращайтесь в раздел «Crawl Analytics» и проверьте результаты анализа. Если все параметры настроены верно, исключенные блоки больше не будут учитываться при проверке дублей.
Если у вас возникли вопросы, не стесняйтесь написать в SEO студию на email info@seo.computer.
id 6149