Introduzione a robots.txt per il tuo sito in Google

Introduzione a robots.txt per il tuo sito in Google

Il file robots.txt indica ai motori di ricerca quali URL sul tuo sito possono essere disponibili per la loro indicizzazione. Questo file viene utilizzato principalmente per evitare di sovraccaricare il tuo sito con le richieste; Non è un mezzo per escludere una pagina Web dai risultati della ricerca di Google. Se si desidera escludere una pagina dai risultati di ricerca in Google, utilizzare il metag Noindex o proteggere la pagina con una password.

Se si utilizza CMS, come Wix o Blogger, potresti non aver bisogno (o impossibile) per modificare direttamente il file robots.txt. Invece, il CMS può fornire una pagina delle impostazioni di ricerca o un altro meccanismo per specificare i motori di ricerca, se la pagina deve essere scansionata.

Se vuoi nascondere o aprire una delle tue pagine per i motori di ricerca, cerca istruzioni per modificare la visibilità della pagina nei motori di ricerca nei tuoi CM (ad esempio, cerca "Wix nascondi una pagina dai motori di ricerca").

Cos'è un file robots.txt e come viene utilizzato per il tuo sito di Google?

Il file robot.txt viene utilizzato principalmente per controllare il traffico dei motori di ricerca sul tuo sito e di solito per escludere il file dall'indicizzazione di Google, a seconda del tipo di file:

Come robots.txt influisce su diversi tipi di file per il tuo sito Google

Pagine web

È possibile utilizzare il file robot.txt per le pagine Web (, PDF o altri formati che Google può leggere) per controllare il traffico dell'indicizzazione se ritieni che il tuo server sarà sovraccarico di richieste del robot di ricerca di Google o per evitare le pagine pre-lunghe o duplicate sul tuo sito.

Avvertimento: Non utilizzare il file robots.txt come modo per nascondere una pagina Web (inclusi PDF e altri formati di testo supportati da Google) dai risultati della ricerca di Google.

Se altre pagine si riferiscono alla tua pagina con testo descrittivo, Google può indicizzare l'URL senza visitare la pagina. Se si desidera escludere completamente la pagina dai risultati della ricerca, utilizzare altri metodi, come protezione da password o Metatheg Noindex.

Se la tua pagina Web è bloccata nel file robot.txt, il suo URL può ancora apparire nei risultati di ricerca, ma la descrizione non verrà visualizzata nei risultati. Anche i file multimediali, i video, il PDF e altri file integrati nella pagina bloccati non saranno scansionati se non sono menzionati in altre pagine consentite per l'indicizzazione. Se vedi questo risultato di ricerca per la tua pagina e desideri risolverlo, elimina robot.txt. Se vuoi nascondere completamente la pagina dalla ricerca in Google, usa un altro metodo.

File multimediali

È possibile utilizzare il file robot.txt per controllare l'indicizzazione del traffico e per prevenire l'aspetto di immagini, video e file audio nei risultati della ricerca di Google. Ciò non impedirà collegamenti ai file multimediali da altre pagine o dagli utenti.

  • Scopri di più su come prevenire l'aspetto delle immagini in Google.
  • Ulteriori informazioni su come eliminare o limitare i file video dall'aspetto in Google.

File di risorse

È possibile utilizzare il file robot.txt per bloccare i file di risorse, come immagini insignificanti, script o stili, se si ritiene che le pagine senza queste risorse non vengano modificate in modo significativo. Tuttavia, se l'assenza di queste risorse complica l'indicizzazione del robot Google, non bloccarle, altrimenti Google non sarà in grado di analizzare correttamente le pagine che dipendono da queste risorse.

Comprendere le restrizioni sul file robot.txt per il tuo sito Google

Prima di creare o modificare il file robots.txt, è necessario comprendere le restrizioni su questo metodo di bloccaggio URL. A seconda dei tuoi obiettivi e della situazione, potrebbe essere necessario considerare altri meccanismi per assicurarti che i tuoi URL non vengano trovati su Internet.

  • Le regole del file robots.txt potrebbero non essere supportate da tutti i motori di ricerca. Le istruzioni nel file robot.txt non possono influire con forza al comportamento dei robot; Dipende dal fatto che il robot debba seguire queste istruzioni. Sebbene GoogleBot e altri Craul Web rispettati seguano le regole dei file Robots.txt, altri kralar potrebbero non farlo. Pertanto, se si desidera salvare le informazioni di sicurezza dai artigianali, è meglio utilizzare altri metodi di blocco, ad esempio proteggere i file con una password.
  • Crawles diversi possono interpretare la sintassi in modi diversi. Nonostante il fatto che i cari Craul Web seguano le regole del file Robots.txt, ogni kraler può interpretare queste regole in modo diverso. Dovresti conoscere la sintassi corretta per fare riferimento a diversi crawer web, poiché alcuni di essi potrebbero non capire alcune istruzioni.
  • La pagina vietata nel file robot.txt può ancora essere indicizzata se ci sono collegamenti da altri siti ad esso. Sebbene Google non scansionerà e indicizzerà il contenuto bloccato in robot.txt, può comunque trovare e indicizzare l'URL proibito se ci sono collegamenti da altre pagine su Internet. Di conseguenza, l'indirizzo URL e, possibilmente, altri dati disponibili pubblicamente, come il testo dei collegamenti alla pagina, possono ancora apparire nei risultati della ricerca di Google. Per prevenire completamente l'aspetto dell'URL nei risultati della ricerca su Google, utilizzare la protezione da password, il metag Noindex o eliminare la pagina.

Attenzione: La combinazione di diverse regole per il kraling e l'indicizzazione può causare un conflitto tra le regole. Scopri come combinare le regole di Kraling con l'indicizzazione e la visualizzazione.

Creazione o aggiornamento del file robots.txt per il tuo sito Google

Se decidi di aver bisogno di un file robots.txt, scopri come crearlo. Se il file esiste già, scopri come aggiornarlo.

Informazioni consigliate per il tuo sito su Google

Creazione e invio del file robots.txt a Google

Il file robots.txt dovrebbe essere nella radice del tuo sito. Scopri come creare un file robots.txt, vedere esempi e studiare le regole del file robots.txt.

Invio del file robots.txt aggiornato a Google

Utilizzando il rapporto robot.txt, è possibile verificare facilmente se Google può elaborare i file robot.txt. Seguire questi passaggi per inviare file robot.txt aggiornati a Google.

Come Google interpreta la specifica del file robots.txt

Esplora i dettagli delle varie regole per il file robots.txt e come Google interpreta la specifica del file robots.txt.

Se hai domande sul file robots.txt per il tuo sito Google o altri aspetti della SEO, puoi contattare la società SEO "SEO.COMPUTER" tramite e -mail: info@seo.computer o tramite WhatsApp: +79202044461.

Id 25

Invia una richiesta e ti forniremo una consulenza SU SEO promozione del tuo sito web