W tym artykule szczegółowo opisano, w jaki sposób inny kod stanu HTTP, a także błędy sieci i DNS wpływają na widoczność witryny w wyszukiwarce Google. Rozważane są najczęstsze odpowiedzi serwera i główne typy błędów, które bot wyszukiwania może napotkać podczas chodzenia po witrynie. Rzadkie kody i protokoły nie są brane pod uwagę. Wszystkie opisane problemy powodują odpowiednie błędy lub ostrzeżenia w raportach indeksowania witryny w konsoli wyszukiwania Google.
Funkcje eksperymentalne protokołów HTTP i FTP nie są obsługiwane, jeśli tekst nie jest wskazany inaczej.
Kod stanu HTTP to odpowiedzi serwera, które klient jest adresowany, niezależnie od tego, czy jest to przeglądarka, czy robot wyszukiwania podczas żądania strony witryny. Każdy kod ma pewną wartość, ale często proces przetwarzania jest podobny. Na przykład kilka kodów wskazuje na przekazanie, ale wynik jest trafieniem w końcowym adresie URL.
Konsola Google Rejestruje błędy kodów z zakresu 4xx i 5xx, a także nieudanych przekierowań (3xx). Jeśli serwer zwróci kod 2xx, zawartość strony można zaakceptować do indeksacji, ale nie ma gwarancji.
Poniżej znajduje się tabela z głównym kodem stanu HTTP, który najczęściej występuje podczas skanowania witryny i ich wpływu na indeksowanie w Google.
Takie kody oznaczają udaną transmisję treści, którą Google może przetwarzać w celu indeksacji. Jeśli jednak strona zawiera błąd, na przykład pusta zawartość lub komunikat o błędzie, Google może sklasyfikować ją jako błąd miękki 404.
200 (OK) - Strona jest pomyślnie załadowana, zawartość jest przesyłana do systemu indeksowania. Indeksowanie jest możliwe, ale nie gwarantowane.
201 (utworzony), 202 (zaakceptowany) - GoogleBot oczekuje, że zawartość otrzyma ograniczony czas, po czym wysyła dostępne dane do indeksacji. Czas oczekiwania zależy od rodzaju agenta.
204 (bez zawartości) - GoogleBot mówi systemowi indeksowania, że nie ma zawartości. W raporcie indeksowym może to wyglądać jak błąd miękki 404.
GoogleBot może przekroczyć łańcuch maksymalnie 10 przekierowań. Jeśli limit zostanie przekroczony, a zawartość nie zostanie odebrana, błąd przekierowania będzie w raporcie indeksowym. Liczba przejść zależy od rodzaju GoogleBot.
Cała zawartość z adresu URL Redisters jest ignorowana, a tylko ostateczny adres URL jest akceptowany do indeksowania. W przypadku plików robots.txt z kodami 3xx używane są specjalne reguły.
301 (poruszyło się na zawsze) - GoogleBot śledzi przekierowanie i rozważa ostateczny adres URL głównego, przekazując go na wagę strony.
302 (tymczasowo przeniesiony) - GoogleBot śledzi przekierowanie, ale sygnał do kanonicznej jest słabszy.
303, 304 (nie zmieniło się) - Google donosi, że zawartość nie zmieniła się od ostatniej wizyty i nie indeksuje się ponownie.
307, 308 - Podobnie odpowiednio 302 i 301, ale semantycznie różne. Do swojej witryny użyj odpowiedniego kodu, aby uzyskać lepszą zgodność z innymi klientami.
Strony z odpowiedziami 4xx nie są brane pod uwagę do indeksacji, a jeśli są już w indeksie, są one usunięte. Treść takich stron jest całkowicie zignorowana.
400 (nieprawidłowe żądanie) A pozostałe 4xx, z wyjątkiem 429, oznacza, że nie ma treści, a adres URL jest wykluczony z indeksu. Częstotliwość omijania takich stron jest stopniowo zmniejszana.
Nie używaj 401 i 403, aby ograniczyć częstotliwość objazdu - kody te nie wpływają na prędkość skanowania. Aby ograniczyć obejście, użyj specjalnych ustawień.
401 (nieautoryzowany)W 403 (zabronione)W 404 (nie znaleziono)W 410 (usunięte)W 411 (wymagana długość)
429 (zbyt wiele żądań) - Google postrzega ten kod jako znak przeciążenia serwera, należącego do błędów serwera.
Błędy 5xx i 429 powodują tymczasowy spadek prędkości omijania miejsca. Już indeksowane adresy URL są zachowane, ale przy stałych błędach zostaną usunięte z indeksu.
Strony z 5xx nie są brane pod uwagę podczas indeksowania. W przypadku robots.txt istnieją osobne reguły z 5xx.
500 (błąd wewnętrzny serwera) - Google zmniejsza częstotliwość ominięcia witryny w zależności od liczby takich błędów.
502 (Bad Gateway), 503 (usługa nie jest dostępna) - Podobne działania w celu ograniczenia skanowania.
Błąd Soft 404 występuje, jeśli strona zwraca status 200, ale zawiera komunikat o błędzie lub pustą zawartość. Może to być spowodowane problemami technicznymi, na przykład brakiem dołączonych plików lub pustej strony wyszukiwania.
Takie strony tworzą słabe wrażenia użytkownika i są wykluczone z indeksyzacji Google. Raport z konsoli wyszukiwania wyświetla ostrzeżenie o błędach Soft 404.
Opcje rozwiązania zależą od sytuacji i pożądanego rezultatu:
Zwróć status HTTP 404 lub 410 dla strony bez wymiany, aby wyszukiwarki wiedzieli, że należy ją usunąć z indeksu. Skonfiguruj stronę użytkownika 404 z przydatnymi wskazówkami i nawigacją dla odwiedzających.
Użytkownik 404 musi zwrócić kod 404, aby uniknąć indeksowania takich stron.
Skonfiguruj ciągłe przekierowanie 301 na nową stronę z podobną treścią, aby użytkownicy i wyszukiwarki prawidłowo przełączają się na odpowiednie informacje. Sprawdź poprawną odpowiedź za pośrednictwem narzędzia sprawdzania adresu URL.
Być może GoogleBot nie może poprawnie załadować stronę z powodu braku zasobów, błędów w kodzie lub zamkach. Użyj narzędzia testowania adresu URL, aby wyświetlić rysunek strony i kod HTTP. Problemy z ładowaniem zasobów, takich jak skrypty i obrazy, mogą prowadzić do łagodnego błędu 404.
Główne powody to zamki w Robots.txt, zbyt wiele zasobów na stronie, błędy serwera, powolne pobieranie lub zbyt duże pliki.
Błędy sieciowe i DNS szybko negatywnie wpływają na pozycję witryny w wyszukiwaniu. GoogleBot, podczas wykrywania limitu czasu, zwolnień połączenia lub problemów z DNS, zaczyna zmniejszać częstotliwość objazdu, ponieważ rozumie, że serwer nie radzi sobie z obciążeniem.
Ponieważ treść nie jest uzyskiwana z takimi błędami, Google nie może indeksować stron, a wcześniej indeksowane strony, które stały się niedostępne, są usuwane z wyszukiwania za kilka dni. W raportach konsoli wyszukiwania występują odpowiednie błędy.
Jeśli sam nie kontrolujesz serwera, zalecamy skontaktowanie się z dostawcą hostingu lub CDN.
Błędy sieciowe mogą wystąpić przed przetwarzaniem żądania przez serwer lub w procesie skanowania. Brak kodu HTTP komplikuje diagnozę. Aby wyeliminować błędy w czasie wyjścia i resetować połączenie:
Problemy można powiązać z przeciążeniem interfejsami sieciowymi lub niewłaściwym zamknięciem portów, co prowadzi do utraty pakietów i rozładowania połączeń.
Najczęściej błędy DNS są spowodowane niewłaściwym ustawieniem lub blokowaniem żądań na poziomie zapory. Aby zdiagnozować następujące kroki:
W celu poprawy indeksowania Twojej witryny w Google zalecamy skontaktowanie się z firmą SEO CEO e -mailem info@seo.computer Lub przez WhatsApp +79202044461.
ID 70