Bazı arama robotları standart bir dizinleme sistemi tarafından değil, sitenizin sahiplerinin tarama terimleri konusunda özel bir anlaşmaya sahip olabileceği ayrı ürünler tarafından kullanılır. Örneğin, belirli bir robot küresel direktifleri atlayabilir robots.txt, izin varsa, tüm ajanlar (*) için belirtilir.
Bu tür uzmanlaşmış robotlar, sıradan arama motorlarından daha fazla IP bantlarıyla çalışır. Gerçek aralıklar özel amaçlı bir JSON dosyasında listelenmiştir. Ters DNS kayıtlarının bir tür türü vardır rate-limited-proxy-***-***-***-***.google.com.
Bu tür ajanların listesi aşağıda verilmiştir, kullanıcı ajanı satırları, için kullanılan değerler robots.txt Ve ortamlarının hizmet çalışması üzerindeki etkisinin bir açıklaması. Liste kapsamlı değil, ancak çoğunlukla günlüklerde görünen ve site sahipleri arasında sorular soran robotları içerir.
Kullanıcı ajanı: APIS-Hooogle
Robots.txt'de kayıt:user-agent: APIs-Google
Global Kuralları Yoksayıyor *.
user-agent: APIs-Google allow: /archive/1Q84 disallow: /archive/
Sitenize push mesajlarının teslimatını kontrol etmek için API hizmetleri tarafından kullanılır.
Kullanıcı ajanı: Adsbot-google-mobile
Robots.txt'de kayıt:user-agent: AdsBot-Google-Mobile
Ayrıca küresel kuralları görmezden gelir.
user-agent: AdsBot-Google-Mobile allow: /archive/1Q84 disallow: /archive/
Sitenizin sayfalarının mobil sürümlerinde reklam kalitesini analiz etmek için kullanılır.
Kullanıcı ajanı: Adsbot-google
Robots.txt'de kayıt:user-agent: AdsBot-Google
user-agent: AdsBot-Google allow: /archive/1Q84 disallow: /archive/
Robot, Sitenin sayfalarındaki reklamların etkinliğini ve uyumluluğunu kontrol eder.
Kullanıcı ajanı: MediaPartners-Google
Robots.txt'de kayıt:user-agent: Mediapartners-Google
Direktifin etrafında dolaşmak *.
user-agent: Mediapartners-Google allow: /archive/1Q84 disallow: /archive/
İlgili reklamcılığı ve sayfalara yerleştirilmesini seçmek için sitenizi ziyaret edin.
Kullanıcı ajanı: Google-Güvenlik
Robots.txt: Tamamen göz ardı edildi
Robot, sitenin sayfalarındaki kötü niyetli bağlantıları ve istismarları tanımlamaya hizmet eder. İtaat etmiyor robots.txtsadece güvenlik nedeniyle çalıştığı için.
Aşağıda, artık kullanılmayan, ancak kütüklerde bulunmadan veya tarama davranışını etkilemeden önce ajanlar bulunmaktadır.
Kullanıcı ajanı: Adsbot-Google-Mobile (modası geçmiş)
Robots.txt: Küresel kuralları görmezden geldim
Mobil cihazlardan açık sayfalarda reklamcılık kalitesini değerlendirmek için kullanıldı.
Kullanıcı ajanı: Duplexweb-google
Robots.txt: Yönergeyi görmezden gelebilir *
Otomatik hizmetler tarafından site sayfalarının içeriğiyle etkileşim kurmak için kullanılmıştır.
Kullanıcı ajanı: Google Favicon
Robots.txt: Kullanılmış standart jetonlar Googlebot-Image Ve Googlebot
Arama arabirimlerinde site simgesinin ekranından ve seçiminden sorumluydu.
Kullanıcı ajanı: Adsbot-Google-Mobile-Apps
Robots.txt: ADSBOT-Google'ın kurallarını izledi *
Reklam gereksinimlerine uygunluklarını değerlendirmek için Android uygulamalarının sayfalarını analiz etti.
Kullanıcı ajanı: Googleweblight
Robots.txt: Sadece bir kullanıcı isteği için aktif olduğu için kuralları görmezden geldim
Bu aracı, bir başlığın varlığını kontrol ederek yavaş bir bağlantı sırasında site sayfalarının basitleştirilmiş bir sürümünü sağladı no-transform.
Robots.txt, tarayıcılar yönetimi ve SEO-optimizasyon ile ayarlamanın tüm sorunları için iletişime geçebilirsiniz. SEO Şirketi SEO.computer:info@seo.computer Whatsapp: +7 920 204-44-61
ID: 86