In che modo il codice di stato HTTP, gli errori di rete e DNS influiscono sull'indicizzazione del sito in Google

In che modo il codice di stato HTTP, gli errori di rete e DNS influiscono sull'indicizzazione del sito in Google

Questo articolo descrive in dettaglio come il diverso codice di stato HTTP, nonché gli errori di rete e DNS influiscono sulla visibilità del sito nel motore di ricerca di Google. Le risposte al server più comuni e i principali tipi di errori che il bot di ricerca può incontrare quando si gira intorno al tuo sito sono considerati. Non sono considerati codici e protocolli più rari. Tutti i problemi descritti causano errori o avvertimenti appropriati nei rapporti di indicizzazione del tuo sito nella console di ricerca di Google.

Le funzioni sperimentali dei protocolli HTTP e FTP non sono supportate se il testo non è altrimenti indicato.

Stato del sito HTTP e il loro impatto sull'indicizzazione di Google

Il codice di stato HTTP è le risposte del server che il client è indirizzato, che si tratti di un browser o di un robot di ricerca quando si richiede una pagina del sito. Ogni codice ha un certo valore, ma spesso il processo di elaborazione è simile. Ad esempio, diversi codici indicano un inoltro, ma il risultato è un successo sull'URL finale.

Google Search Console Registra gli errori per i codici dall'intervallo 4xx e 5xx, nonché per reindirizzamenti senza successo (3xx). Se il server restituisce il codice 2xx, il contenuto della pagina può essere accettato per l'indicizzazione, ma non vi è alcuna garanzia.

Di seguito è riportata una tabella con il codice di stato principale HTTP, che si trova più spesso durante la scansione del sito e la loro influenza sull'indicizzazione in Google.

2xx (risposte riuscite al server del sito in Google)

Tali codici indicano la trasmissione riuscita del contenuto che Google può elaborare per l'indicizzazione. Tuttavia, se la pagina contiene un errore, ad esempio, contenuto vuoto o messaggio di errore, Google può classificarlo come un errore soft 404.

200 (OK) - La pagina viene caricata correttamente, il contenuto viene trasferito nel sistema di indicizzazione. L'indicizzazione è possibile, ma non garantita.

201 (creato), 202 (accettato) - Googlebot prevede che i contenuti ottengano un tempo limitato, dopodiché invia dati disponibili per l'indicizzazione. Il tempo di attesa dipende dal tipo di agente.

204 (nessun contenuto) - Googlebot dice al sistema di indicizzazione che non esiste un contenuto. Nel rapporto di indicizzazione, questo può sembrare un errore morbido 404.

3xx (inoltro e elaborazione del sito in Google)

Googlebot può attraversare una catena di un massimo di 10 reindirizzamenti. Se il limite viene superato e il contenuto non viene ricevuto, l'errore di reindirizzamento sarà nel rapporto di indicizzazione. Il numero di transizioni dipende dal tipo di Googlebot.

Tutto il contenuto dell'URL dei redister viene ignorato e solo l'URL finale è accettato per l'indicizzazione. Per i file robot.txt con codici 3xx, vengono utilizzate regole speciali.

301 (spostato per sempre) - Googlebot segue il reindirizzamento e considera l'URL finale il principale, passandolo sul peso della pagina.

302 (mosso temporaneamente) - Googlebot segue il reindirizzamento, ma il segnale alla canonica è più debole.

303, 304 (non è cambiato) - Google riporta che il contenuto non è cambiato dall'ultima visita e non indicizza più.

307, 308 - Allo stesso modo 302 e 301, rispettivamente, ma semanticamente diverso. Per il tuo sito, utilizzare il codice giusto per una migliore compatibilità con altri clienti.

4xx (errori client del sito e conseguenze per l'indicizzazione in Google)

Le pagine con le risposte 4xx non sono considerate per l'indicizzazione e se sono già nell'indice, vengono rimosse. Il contenuto di tali pagine è completamente ignorato.

400 (richiesta errata) E l'altro 4xx, tranne 429, significa che non vi è alcun contenuto e l'URL è escluso dall'indice. La frequenza di bypassare tali pagine è gradualmente ridotta.

Non utilizzare 401 e 403 per limitare la frequenza di deviazione: questi codici non influiscono sulla velocità di scansione. Per limitare il bypass, utilizzare le impostazioni speciali.

401 (non autorizzato), 403 (proibito), 404 (non trovato), 410 (cancellato), 411 (lunghezza richiesta)

429 (troppe richieste) - Google percepisce questo codice come un segno di sovraccarico del server, appartenente agli errori del server.

5xx (errori del sito server e il loro impatto sull'indicizzazione in Google)

Gli errori di 5xx e 429 causano una diminuzione temporanea della velocità di bypassare il sito. Gli URL già indicizzati sono conservati, ma con errori costanti verranno rimossi dall'indice.

Le pagine da 5xx non vengono prese in considerazione durante l'indicizzazione. Per robot.txt, ci sono regole separate con 5xx.

500 (errore interno del server) - Google riduce la frequenza del bypass del sito in base al numero di tali errori.

502 (Bad Gateway), 503 (il servizio non è disponibile) - Azioni simili per limitare la scansione.

Errori soft 404 sul sito in Google

L'errore Soft 404 si verifica se la pagina restituisce lo stato di 200, ma contiene un messaggio di errore o un contenuto vuoto. Ciò può essere causato da problemi tecnici, ad esempio l'assenza di file inclusi o una pagina di ricerca vuota.

Tali pagine creano una scarsa esperienza utente e sono escluse dall'indicizzazione di Google. Il rapporto della console di ricerca visualizza un avvertimento su un errore Soft 404.

Come correggere errori Soft 404 per il tuo sito in Google

Le opzioni di soluzione dipendono dalla situazione e dal risultato desiderato:

  • La pagina e il contenuto sono completamente rimossi.
  • La pagina o il contenuto vengono trasferiti a un altro URL.
  • La pagina e il contenuto sono disponibili e devono essere indicizzati.
Se la pagina e il contenuto vengono rimossi

Restituisci lo stato HTTP 404 o 410 per una pagina senza sostituzione in modo che i motori di ricerca sappiano che deve essere rimosso dall'indice. Imposta l'utente Pagina 404 con suggerimenti utili e navigazione per i visitatori.

  • Segnala chiaramente che la pagina non viene trovata usando una lingua comprensibile e amichevole.
  • Mantieni lo stile e la navigazione del tuo sito.
  • Aggiungi collegamenti a sezioni popolari o pagina principale.
  • Considera la possibilità di feedback per i messaggi sui collegamenti interrotti.

L'utente 404 deve restituire il codice 404 per evitare di indicizzare tali pagine.

Se la pagina o il contenuto vengono spostati

Imposta un reindirizzamento costante 301 su una nuova pagina con un contenuto simile in modo che gli utenti e i motori di ricerca passino correttamente alle informazioni pertinenti. Controllare la risposta corretta tramite lo strumento di controllo URL.

Se la pagina e il contenuto sono ancora disponibili

Forse Googlebot non è stato possibile caricare correttamente la pagina a causa della mancanza di risorse, errori nel codice o blocchi. Utilizzare lo strumento di test URL per visualizzare il disegno di pagina e il codice HTTP. I problemi con il carico di risorse, come script e immagini, possono portare a un lieve errore 404.

I motivi principali sono blocchi in robot.txt, troppe risorse sulla pagina, errori del server, download lento o file troppo grandi.

Errori del sito di rete e DNS e il loro impatto sull'indicizzazione di Google

Gli errori di rete e DNS influiscono rapidamente negativamente sulla posizione del sito nella ricerca. GoogleBot, quando si rileva timeout, scarichi di connessione o problemi con DNS, inizia a ridurre la frequenza di deviazione, poiché comprende che il server non affronta il carico.

Poiché il contenuto non è ottenuto con tali errori, Google non può indicizzare le pagine e le pagine precedentemente indicizzate che sono diventate non disponibili vengono rimosse dalla ricerca in pochi giorni. Nei rapporti della console di ricerca ci sono errori corrispondenti.

Se non controlli da solo il server, ti consigliamo di contattare il tuo provider di hosting o CDN.

Come eseguire il debug di errori del sito Web di rete per migliorare l'indicizzazione in Google

Gli errori di rete possono verificarsi prima dell'elaborazione della richiesta da parte del server o nel processo di scansione. L'assenza di codice HTTP complica la diagnosi. Per eliminare gli errori nel timeout e il ripristino della connessione:

  • Controllare i registri delle impostazioni e dei logwall. Escludi il blocco degli indirizzi IP del robot di ricerca.
  • Analizzare il traffico di rete utilizzando strumenti specializzati per rilevare malfunzionamenti nei componenti di rete.
  • Se non identifichi tu stesso il problema, contatta il tuo provider di hosting.

I problemi possono essere associati al sovraccarico di interfacce di rete o alla chiusura impropria delle porte, che porta alla perdita di pacchetti e alla scarica di connessioni.

Come diagnosticare e correggere gli errori del sito DNS per l'indicizzazione di successo in Google

Molto spesso, gli errori DNS sono causati da impostazioni improprie o bloccanti a livello di firewall. Per diagnosticare i seguenti passaggi:

  • Controlla le regole del firewall e assicurati che il robot di ricerca IP non sia bloccato e che siano consentite le query UDP e TCP.
  • Controlla la pertinenza dei record DNS A e CNAME, assicurarsi che la correttezza dell'IP e dei nomi specificati.
  • Assicurarsi che tutti i server DNS siano indicati correttamente e funzionino correttamente.
  • Se recentemente sono state apportate modifiche al DNS, prendere in considerazione il tempo per la distribuzione degli aggiornamenti e, se necessario, pulire la cache DNS.
  • Se controlli il tuo server DNS, assicurati del suo lavoro stabile e dell'assenza di sovraccarico.

Per qualsiasi domanda per migliorare l'indicizzazione del tuo sito su Google, ti consigliamo di contattare la società SEO Amministratore delegato tramite e -mail info@seo.computer O tramite WhatsApp +79202044461.

Id 70

Invia una richiesta e ti forniremo una consulenza SU SEO promozione del tuo sito web