Google Search est un moteur de recherche entièrement automatisé qui utilise des logiciels connus sous le nom de Web Crauls qui explorent régulièrement Internet pour trouver des pages qui peuvent être ajoutées à l'index. En fait, la plupart des pages affichées dans les résultats de recherche n'ont pas été envoyées manuellement pour indexation, mais ont été trouvées et ajoutées automatiquement lors de l'étude d'Internet avec Web Crauls. Ce document explique en détail comment la recherche dans Google fonctionne dans le contexte de votre site. Connaître ce processus vous aidera à corriger les erreurs de numérisation, à obtenir des pages dans l'index et à optimiser l'affichage du site dans la recherche de Google.
Vous cherchez quelque chose de moins technique? Découvrez le site Comment fonctionne la rechercheQui explique comment la recherche fonctionne du point de vue de l'utilisateur.
Avant de plonger dans les détails du moteur de recherche, il est important de noter que Google n'accepte pas le paiement pour une analyse plus fréquente du site ou pour des positions plus élevées dans les résultats de recherche. Si quelqu'un revendique le contraire, sachez que ce n'est pas vrai.
Google ne garantit pas que le site sera analysé, indexé ou affiché dans les résultats de la recherche, même si ses pages correspondent à Google Search Essentials.
La recherche dans Google se déroule en trois étapes, et toutes les pages ne passent pas par chacune d'elles:
La première étape est la recherche de pages sur Internet. Puisqu'il n'y a pas de registre central de toutes les pages Web, Google recherche constamment des pages nouvelles et mises à jour pour les ajouter à sa liste de pages célèbres. Ce processus s'appelle la «recherche de l'URL». Certaines pages sont déjà connues car Google leur a déjà visité. D'autres pages sont trouvées lorsque Google extrait un lien d'une page bien connue à une nouvelle. Par exemple, si la catégorie du site fait référence à un nouvel article sur le blog. Vous pouvez également envoyer une liste de pages (carte du site) afin que Google puisse les indexer.
Dès que Google trouve la page URL, il peut visiter cette page pour comprendre ce qu'elle contenait. Pour cela, un grand nombre d'ordinateurs sont utilisés qui scannent des milliards de pages sur Internet. Le programme qui effectue cette tâche est appelé Googlebot (également connu sous le nom de Crauler, Robot, Bot ou Spider). Googlebot utilise l'algorithme pour déterminer les pages à numériser, à quelle fréquence et combien de pages vous devez télécharger à partir de chaque site. Googlebot est également réglé de manière à ne pas surcharger les serveurs des sites, les scannant trop souvent. Ce mécanisme dépend de la réponse des serveurs (par exemple, les erreurs HTTP 500 indiquent que vous devez ralentir le processus).
Cependant, Googlebot ne scanne pas toujours toutes les pages qu'elle trouve. Certaines pages peuvent ne pas être disponibles pour Kraler en raison des paramètres du site, par exemple, en raison d'une interdiction de numériser via le fichier robots.txt ou en raison de la nécessité d'autoriser l'accès.
Pendant Crailingin, Google rend également la page et effectue JavaScript, en utilisant la version actuelle du navigateur Chrome, qui aide à comprendre quel contenu est affiché sur la page. Ceci est important, car de nombreux sites dépendent de JavaScript pour afficher le contenu, et sans rendre Google peut ne pas voir de données importantes.
Une fois la page scannée, Google essaie de comprendre de quoi parle cette page. Cette étape est appelée indexation, et il comprend le traitement et l'analyse du contenu texte, ainsi que des métathegs, tels que des balises
Pendant l'indexation, Google détermine si la page est un double d'une autre page sur Internet. Si les pages sont similaires, une version canonique est sélectionnée, qui sera affichée dans les résultats de recherche. Ceci est important, car différentes pages avec le même contenu peuvent être représentées dans différents contextes (par exemple, sur des appareils mobiles ou lors de la recherche de versions spécifiques de pages). La page canonique est celle que Google a choisie comme la plus pertinente pour la recherche.
Google prend également en compte divers signaux sur la page canonique et son contenu qui peut être utilisé lors de l'émission d'une page dans la recherche. Par exemple, il peut s'agir de paramètres tels que la langue de la page, le pays auquel le contenu est lié et la commodité de la page pour l'utilisateur.
Si la page ne passe pas par le processus d'indexation, cela est possible, cela est dû à la faible qualité du contenu ou à l'installation d'indexation de la méta-droite. Il est important de comprendre que toutes les pages que Google ne seront pas indexées.
Google n'accepte pas le paiement pour augmenter les postes dans les résultats de la recherche, et tout cela se produit automatiquement. Lorsque l'utilisateur entre dans la demande, le système analyse l'index et renvoie les pages, qui, selon Google, sont la demande la plus pertinente. Pour évaluer la pertinence, divers facteurs sont utilisés, tels que l'emplacement, le langage et l'appareil de l'utilisateur (par exemple, mobile ou bureau).
Par exemple, la recherche de «réparation de vélos» montrera différents résultats à l'utilisateur à Paris et à Hong Kong. Cela dépend également du contenu le plus pertinent dans des conditions spécifiques.
De plus, selon la demande, les éléments de recherche affichés sur la page changent également. Par exemple, la demande de «réparation de vélos» peut retirer les résultats locaux, et la demande de «vélo moderne» est de montrer des images, mais pas des résultats locaux.
Parfois, la console de recherche Google peut signaler que la page a été indexée, mais elle n'apparaît pas dans les résultats de recherche. Cela peut être dû à plusieurs facteurs:
Attention, nous travaillons constamment pour améliorer nos algorithmes. Suivez les modifications suivant le blog Google Search Central.
Si vous avez des questions sur l'optimisation de la recherche de votre site, vous pouvez contacter SEO.Compter par e -mail info@seo.computer ou via WhatsApp par numéro +79202044461.
ID 160