Review van Google Crauls and Frinders (gebruikersagenten) voor uw Google -website

Review van Google Crauls and Frinders (gebruikersagenten) voor uw Google -website

Google gebruikt Kraler en Vesten om verschillende acties uit te voeren voor zijn producten, zowel automatisch als op verzoek van de gebruiker. Crowler (soms ook wel een "robot" of "spider" genoemd) is een veel voorkomende naam voor een programma dat wordt gebruikt om websites automatisch te detecteren en te scannen. Thets fungeren als een programma vergelijkbaar met WGet en voeren meestal een enkel verzoek uit namens de gebruiker. Google -producten kunnen worden onderverdeeld in drie categorieën:

Gewone kraler voor uw Google -site

Conventionele Kraler gebruikt voor Google -producten (bijvoorbeeld GoogleBot) volgt altijd Robots.txt -regels voor automatisch scannen.

Special Kraler voor uw site in Google

Special Kraler is vergelijkbaar met gewone, maar ze worden gebruikt in specifieke producten waar er een overeenkomst is tussen de gescande site en het Google -product met betrekking tot het scanproces. ADSBOT negeert bijvoorbeeld Global Robots.txt User-Agent met de resolutie van de site-eigenaar.

Veters geactiveerd door de gebruiker voor uw site in Google

De gebruiker's maken deel uit van het product- en productfuncties wanneer de uiteindelijke gebruiker het verzoek initieert. Google Site Verifier werkt bijvoorbeeld op verzoek van de gebruiker.

Technische kenmerken van Google Crawler en textuur voor uw Google -site

Google Craolers en Veters zijn ontworpen om tegelijkertijd aan duizenden machines te werken om de prestaties en schaalbaarheid te vergroten naarmate het internet groeit. Om het gebruik van de bandbreedte te optimaliseren, worden deze klanten gedistribueerd volgens veel datacenters over de hele wereld, zodat ze zich dichter bij de sites bevinden waarmee ze kunnen worden gecontacteerd. Daarom kunnen bezoeken van verschillende IP -adressen in uw logboeken worden aangegeven. Google Egress vindt voornamelijk plaats met IP -adressen in de Verenigde Staten. Als Google constateert dat de site verzoeken van de Verenigde Staten blokkeert, kan hij proberen te scannen van IP -adressen in andere landen.

Ondersteunde programmaprotocollen voor uw site in Google

Google Craolers and Veters ondersteunen HTTP/1.1 en HTTP/2. Craolers zullen de versie van het protocol gebruiken, dat de beste scanprestaties biedt en kan schakelen tussen protocollen, afhankelijk van de statistieken van eerdere scansessies. Google Kraler gebruikt standaard het HTTP/1.1 -protocol. Scan via HTTP/2 kan computerbronnen (bijvoorbeeld CP, RAM) opslaan voor zowel uw site als GoogleBot, maar anders biedt het geen specifieke voordelen voor de site (dit heeft bijvoorbeeld geen invloed op de rating in Google Search). Stel de server in om scannen via HTTP/2 te weigeren zodat deze reageert met Status 421 wanneer Google probeert uw site te openen via HTTP/2. Als dit niet mogelijk is, kunt u een bericht naar het scanteam sturen (hoewel dit een tijdelijke beslissing is).

De Google Croilers -infrastructuur ondersteunt ook scannen via FTP (zoals gedefinieerd in RFC959 en zijn updates) en FTPS (zoals gedefinieerd in RFC4217 en de updates ervan), maar scannen via deze protocollen is zeldzaam.

Ondersteunde inhoudscompressiemethoden voor uw Google -website

Google Craolers en testers ondersteunen de volgende methoden voor compressie van inhoud (codering): GZIP, Deflate en Brotli (BR). Ondersteunde inhoudscodering voor elke Google-gebruikersagent wordt aangegeven in de koptekst van acceptatie-coderen voor elk verzoek dat ze doen. Bijvoorbeeld: Accept-codering: gzip, deflate, br.

Scansnelheid en hosting load voor uw site in Google

Ons doel is om bij elk bezoek zoveel mogelijk pagina's van uw site te scannen zonder de server te overbelasten. Als uw site moeite heeft om verzoeken van Google te bedienen, kunt u de scansnelheid verminderen. Houd er rekening mee dat het verzenden van de verkeerde HTTP -status naar Google Kraolers kan beïnvloeden hoe uw site wordt weergegeven in Google -producten.

HTTP -coaching voor uw Google -site

De infrastructuur van Google Kraler ondersteunt de heuristische HTTP-shows, zoals bepaald door de HTTP-caching-norm, met name via de ETAG en IF-NOME-MATCH-koppen, evenals door de laatst gemodificeerde en als gemodificeerde en gemodificeerde en gemodificeerde linnenkoppen.

Opmerking: het wordt aanbevolen om de waarden van ETAG en laatst gemodificeerd in te stellen, ongeacht de voorkeuren van Google Cluls. Deze headers worden ook gebruikt door andere toepassingen zoals CMS.

Als zowel de ETAG- als de laatst gemodificeerde velden aanwezig zijn in de retourkoppen, gebruikt Google Kraler de ETAG-waarde, zoals de HTTP-standaard vereist. Voor Google Croilers raden we aan ETAG te gebruiken in plaats van het laatst gemodificeerd om de voorkeuren van caching aan te geven, omdat ETAG geen problemen heeft met datums opmaak.

Andere richtlijnen van HTTP -caching worden niet ondersteund.

Afzonderlijke Crowlers en Google Veters kunnen of kunnen geen caching gebruiken, afhankelijk van de behoeften van het product waarmee ze zijn geassocieerd. GoogleBot ondersteunt bijvoorbeeld caching wanneer herhaalde scan-URL's voor Google Search, en StoreBot-Google ondersteunt alleen onder bepaalde voorwaarden caching.

Om HTTP -codering voor uw site te implementeren, neemt u contact op met uw hostingprovider of leverancier van het Content Management System.

Etag en if-noMe-match voor uw Google-site

Google Craul-infrastructuur ondersteunt ETAG en IF-NOME-MATCH, zoals bepaald door de HTTP-cachingstandaard. Meer informatie over de ETAG-header en zijn IF-NOME-MATCH-verzoek.

Laatst gemodificeerd en als gemodificeerd-in plaats van uw site op Google

De infrastructuur van Google Kraler ondersteunt het laatst gemodificeerd en als gemodificeerd, zoals bepaald door de HTTP-caching-norm, met de volgende reserveringen:

  • De datum in de laatst gemodificeerde koptekst moet worden opgemaakt in overeenstemming met de HTTP-standaard. Om problemen met parsing te voorkomen, raden we aan het volgende datumformaat te gebruiken: "Weekdag, DD Mon yyyy HH :MM :SS TimeZone ". Bijvoorbeeld," vr, 4 september 1998 19:15:56 GMT ".
  • Hoewel dit niet nodig is, overweeg dan de mogelijkheid om het maximale leeftijdveld in de titel van de cache-control te installeren om de crawler te helpen bepalen wanneer je opnieuw een specifieke URL moet scannen. Stel de maximale leeftijdwaarde in in het verwachte aantal seconden waarin de inhoud ongewijzigd blijft. Bijvoorbeeld cache-control: max-leeftijd = 94043.

Meer informatie over de laatst gemodificeerde kop en het verzoek van IF-gemodificeerde-in-since.

Het controleren van Google Craolers en Frinders voor uw Google -site

Google Craules identificeren zichzelf op drie manieren:

  • HTTP usr-agent verzoek.
  • IP -adres van de querybron.
  • Omgekeerde DNS-hotmeum IP-bron.

Ontdek hoe u deze gegevens kunt gebruiken om Google Cholera en Frinders te controleren.

Als u vragen heeft over SEO of u hebt hulp nodig, neem dan per e -mail contact op met onze SEO -metgezel info@seo.computer of via WhatsApp: +79202044461.

ID 61

Stuur een aanvraag en wij zorgen voor een adviesgesprek op SEO promotie van uw website