Afin de se débarrasser des pages en double, il est important de les identifier correctement, ce qui peut parfois demander beaucoup de travail. Un programme spécialisé pour trouver les doublons vous y aidera, ce qui vous permettra de détecter les pages qui sont similaires à 70 à 80 % les unes aux autres. Cet article fournit des instructions détaillées pour rechercher les doublons.
Allez dans la section « Configurations » et sélectionnez « Contenu ». Ensuite, ouvrez l'option de recherche des pages en double - « Doublons ».
Dans la fenêtre qui s'ouvre, activez l'option « Activer les quasi-doublons ». Ensuite, définissez le seuil de similarité pour la recherche de doublons, qui est considéré comme optimal entre 80 et 90 %. Vous pouvez définir la valeur ci-dessous pour obtenir des résultats plus précis.
Après la configuration, nous commençons à analyser le site. Accédez à la section « Contenu », où dans le coin supérieur sélectionnez la ligne « Près des doublons ». La liste qui s'ouvre affichera les pages triées par degré de similitude. Les liens sont classés par ordre décroissant de similarité, en commençant par 100 %.
En cliquant sur le lien, vous pouvez l'envoyer vers la fenêtre inférieure et, si nécessaire, vérifier tous les paramètres de la page. En cliquant à nouveau, vous ouvrirez les paramètres détaillés, où vous pourrez voir les éléments similaires et identifier les raisons de la duplication.
Si le site est trop volumineux et que la recherche prendra beaucoup de temps, vous pouvez augmenter le seuil de similarité. Pour ce faire, sélectionnez « Crawl Analytics » dans le menu, puis cliquez sur « Configurer » dans la liste déroulante.
Vérifiez que la case à côté de « Contenu » est cochée pour que l'analyse du contenu soit active. Si la case est manquante, cochez-la et cliquez sur « Démarrer » pour continuer.
Les résultats peuvent être vérifiés dans la section « Près des doublons ». Dans ce cas, seules les pages présentant un degré de similitude plus élevé seront affichées.
Les raisons des pages en double sont souvent liées à la présence d'éléments identiques sur de nombreuses pages, comme l'en-tête du site ou des blocs avec des produits populaires. Pour vérifier uniquement des éléments de contenu uniques, accédez à la section « Contenu » et sélectionnez « Zone » dans la liste déroulante.
Dans la fenêtre qui s'ouvre, vous verrez deux modes - « Inclure » et « Exclure », dans lesquels vous pouvez configurer la recherche par balises, classes ou ID de bloc.
Par exemple, pour exclure un bloc contenant des produits populaires, insérez la classe ou la balise de ce bloc et sélectionnez l'option « Exclure ».
Revenez maintenant à la section Crawl Analytics et vérifiez les résultats de l'analyse. Si tous les paramètres sont correctement configurés, les blocs exclus ne seront plus pris en compte lors de la vérification des doublons.
Si vous avez des questions, n'hésitez pas à écrire au studio SEO à info@seo.computer.
ID 6149