Co to jest GoogleBot i jak wpływa to na twoją stronę Google

Co to jest GoogleBot i jak wpływa to na twoją stronę Google

GoogleBot to nazwa zwyczajowa dla dwóch rodzajów robotów internetowych używanych w wyszukiwarce Google:

  • Smartfon GoogleBot: robot mobilny, który symuluje użytkownika na urządzeniu mobilnym.
  • GoogleBot Desktop: robot komputerowy, który symuluje użytkownika na komputerze.

Możesz określić podtyp GoogleBot, patrząc na nagłówek HTTP USR-Agent. Jednak oba typy robotów są podporządkowane temu samemu tokenowi produktu (token użytkownika-agenta) w Robots.txt, więc nie możesz wybrać jednego z nich (smartfon GoogleBot ani Desktop GoogleBot) za pomocą Robots.txt.

W przypadku większości witryn Google wyszukiwanie przede wszystkim indeksów mobilna wersja treści. Dlatego większość żądań GoogleBot zostanie składana za pomocą robota mobilnego i mniejszości - za pomocą robota stacjonarnego.

Jak GoogleBot wchodzi w interakcje z Twoją witryną w Google

W przypadku większości witryn GoogleBot Twoja witryna nie powinna odwiedzać Twojej witryny więcej niż raz na kilka sekund. Jednak z powodu opóźnień można oczekiwać, że ten wskaźnik będzie nieco wyższy w krótkich odstępach czasu. Jeśli Twoja witryna nie ma czasu na radzenie sobie z żądaniami GoogleBot, możesz zmniejszyć prędkość obejścia.

GoogleBot może skanować pierwsze 15 mb plik lub obsługiwany plik tekstowy. Każdy zasób, który odnosi się, taki jak CSS lub JavaScript, jest ładowany osobno, a każde żądanie jest ograniczone tym samym limitem wielkości pliku. Po pierwszych 15 MB plik zatrzymuje skanowanie, a tylko te 15 MB pliku są przesyłane do indeksowania. Limit wielkości jest stosowany do danych nieskompresowanych. Inne roboty Google, takie jak GoogleBot Video i GoogleBot Image, mogą mieć inne ograniczenia.

Podczas podróży z adresów IP w USA strefa czasowa GoogleBot to czas Pacyfiku.

Inne cechy techniczne GoogleBot opisano w recenzji Google Robot.

Jak zablokować GoogleBot przed odwiedzaniem witryny w Google

GoogleBot znajduje nowe adresy URL dla objazdu przede wszystkim poprzez linki wbudowane w już odwiedzone strony. Ukrywanie witryny jest prawie niemożliwe bez publikowania linków do niej. Na przykład, gdy tylko ktoś przekroczy link z Twojej „tajnej” witryny do innej witryny, adres URL Twojej witryny „tajnej” może pojawić się w znaczniku polecającym i zostanie zachowany i opublikowany przez inną witrynę w jego dziennikach.

Jeśli chcesz zapobiec obejściem GoogleBot na swojej stronie, masz kilka opcji. Pamiętaj, że istnieje różnica między obejściem a indeksacją: Blokowanie GoogleBot od obejścia strony nie uniemożliwi pojawienia się adresu URL tej strony w wynikach wyszukiwania:

  • Aby zakazać GoogleBot, aby obejść stronę, użyj pliku Robots.txt.
  • Jeśli nie chcesz, aby Google indeksował stronę, użyj Noindex.
  • Aby całkowicie zablokować dostęp do strony zarówno dla robotów, jak i użytkowników, użyj innych metod, takich jak ochrona haseł.

Blokowanie GoogleBot wpływa na wyszukiwarkę Google (w tym odkrycie i wszystkie funkcje wyszukiwania Google), a także inne produkty, takie jak Google Images, Google Video i Google News.

Jak sprawdzić żądania GoogleBot dla Twojej witryny Google

Zanim zdecydujesz się zablokować GoogleBot, ważne jest, aby zrozumieć, że USR-Agent HTTP-Head używany przez GoogleBot jest często sfałszowany przez inne roboty. Dlatego ważne jest, aby sprawdzić, czy żądanie naprawdę pochodzi z Google. Najlepszym sposobem na potwierdzenie, że żądanie pochodzi z GoogleBot, jest wykonanie odwrotnego postu DNS na początkowym adresie IP żądania lub monitorowanie adresu IP za pomocą adresów IP GoogleBot.

Jeśli masz pytania dotyczące SEO lub potrzebujesz konsultacji, możesz skontaktować się z naszym towarzyszem SEO za pośrednictwem poczty elektronicznej info@seo.computer lub WhatsApp: +79202044461.

ID 59

Wyślij zapytanie, a my udzielimy konsultacji NA SEO promocja Twojej strony internetowej