I coreler generali del sito vengono utilizzati per cercare informazioni e creare motori di ricerca su Google. Sono anche utilizzati per compiti specifici di prodotti e analisti. Questi crawler seguono sempre le regole robot.txt con bypass automatico. Le caratteristiche tecniche dei principali kralar del sito si applicano al generale Kraler.
Di norma, i chuleti generali del sito funzionano con gli indirizzi IP elencati nella struttura speciale di Googlebot.json e i controlli DNS inversi ai loro hostemam corrispondono a Crawl-***-***-***-***. Googlebot.com o ***-***-***. Geo-crawl-***-***-***-***. Geo.googlebot.com.
L'elenco mostra le capanne generali del sito, le loro linee utente-agente nei controlli HTTP, corrispondenti ai token dell'agente utente per le direttive robot.txt, nonché prodotti che sono influenzati da impostazioni cronometri per ciascun kraler. Alcuni kralar hanno diversi token-agente-agente: è sufficiente confrontare uno di essi per applicare le regole. L'elenco non è esaustivo, include solo le richieste più comuni e quelle su cui sono arrivate le domande.
Attenzione: la linea dell'agente utente nella richiesta HTTP può essere falsificata. Si consiglia di verificare se il visitatore è davvero un Chuler del sito del motore di ricerca di Google.
Le righe di agente utente nei controlli HTTP per Googlebot hanno due tipi principali per smartphone e per dispositivi desktop. Esempio per gli smartphone: Mozilla/5.0 (Linux; Android) AppleWebKit/... Chrome/... Mobile Safari/... (compatibile; Googlebot/2.1; ...). Per dispositivi desktop - Mozilla/5.0 AppleWebKit/... (compatibile; Googlebot/2.1; ...).
Meno comunemente ci sono opzioni come Mozilla/5.0 (compatibile; Googlebot/2.1; ...) o solo Googlebot/2.1 (...).
Robots.txt utilizza GoogleBot Token per gestire questo crawler del sito.
Le impostazioni di GoogleBot influenzano i prodotti di ricerca di Google, tra cui ricerca, scoperta, ricerca di immagini e notizie, video e notizie.
Agent utente di linea: GoogleBot-Image/1.0.
Token in robots.txt: GoogleBot-Image.
La gestione artigianale di questo kraler del sito si riflette nella ricerca di immagini, scopri, contenuti video e visualizzazione di loghi e phaviconi nei risultati della ricerca di Google.
String User-Agent: GoogleBot-Video/1.0.
Token in robots.txt: Googlebot-Video.
Questo artigianato del sito influisce sulle funzioni della ricerca di video e prodotti relativi ai contenuti video.
Questo crawler del sito non utilizza un agente utente HTTP separato. Il telaio dei contenuti di notizie viene eseguito utilizzando diverse linee utente-agenti di Googlebot.
Token in robots.txt: GoogleBot-News.
Le impostazioni di Crowling influiscono sui servizi di Google News, comprese le notizie e le applicazioni mobili.
Le linee di agente utente sono per i dispositivi desktop e mobili che indicano Storebot-Google.
Token in robots.txt: Storebot- Google.
Questo sito viene utilizzato per raccogliere dati per i prodotti di trading, come la sezione Acquisti nella ricerca di Google.
Le linee USR-Agent per i dispositivi desktop e mobili contengono Google-InfectionTool.
Token su robots.txt: Google-ispectionTool.
Questo sito viene utilizzato per testare i risultati della ricerca e non influisce sui risultati generali della ricerca di Google.
Linee utente-agente: Mozilla/... (compatibile; Googleometer) per dispositivi mobili e desktop.
Token su robots.txt: Googleother.
Questo sito viene utilizzato per varie attività singole o interne, senza influire sui risultati della ricerca di Google.
Linea dell'agente utente: Image Googleometro/1.0.
Token in Robots.txt: Googleometer Image.
Crowler del sito è ottimizzato per la raccolta di immagini senza influire su specifici prodotti di Google.
Linea dell'agente utente: Googleometer-Video/1.0.
Token in robots.txt: Googleometer-Video.
Utilizzato per raccogliere file video senza influire sui risultati della ricerca.
La riga dell'agente utente contiene Google-Cloudvertexbot.
Token in robots.txt: Google- cloudvertexbot.
Viene utilizzato per Kraling relativo alla costruzione di agenti di aiuti e non influisce sui risultati di ricerca di Google.
Non ha una stringa HTTP separata agente utente. Token in robots.txt: Google-esteso.
Consente ai proprietari del sito di controllare l'uso dei contenuti per la formazione dei modelli di intelligenza artificiale senza influire sulla classifica nella ricerca di Google.
La designazione Chrome/W.X.Y.Z nelle linee dell'agente utente è un modello che indica la versione del browser Chrome utilizzato dai braccioli del sito. Il numero di versione viene aggiornato nel tempo.
Quando si cerca o si filtrano per agente utente nei registri, si consiglia di utilizzare i segni di sostituzione per la versione anziché un numero accurato.
Per qualsiasi domanda, è possibile contattare SEO SEO.COMPUTER via e -mail info@seo.computer O tramite WhatsApp +79202044461.
ID 141