Arama Motoru Google Siteniz İçin Robots.txt dosyasını nasıl analiz eder?

Google gibi arama motorlarının otomatik robotları, kaynağı gözden geçirmeden önce dosyaya başvurun robots.txtsitenizin kökünde bulunan. Bu dosya, hangi bölümlerin taranmasına izin verilen ve hangilerinin olmadığı talimatları içerir. Böyle bir protokolün farklı çalışan kullanıcı hizmetleri veya güvenlik araçları için geçerli olmadığını anlamak önemlidir.

Google siteniz için robots.txt dosyası nedir

Robotların kaynağın belirli bölümlerine erişimini sınırlamak için sitenizde bir dosya oluşturabilirsiniz robots.txtHer robot için kuralların reçete edildiği. Yapının örneği:

User-agent: *
Disallow: /includes/
User-agent: Googlebot
Allow: /includes/
Sitemap: https://example.com/sitemap.xml

Bu dosya, sitenin hangi bölümlerinin endekslenebileceğini ve hangisinin no. Sıfırdan öğrenmek için, temel iş ilkelerine aşina olmanız önerilir. robots.txt ve derlemesi için öneriler.

Google web sitenize bir robots.txt dosyası nereden gönderilir

Dosya kesinlikle sitenin kökünde olmalıdır (örneğin, https://ваш_сайт/robots.txt). Sadece yerleştirildiği alan, protokol ve bağlantı noktası kombinasyonu için çalışır. Podomeni, diğer bağlantı noktaları ve protokoller ayrı bir dosya gerektirir robots.txt.

Google için sitenizin robots.txt dosyasının doğru adreslerine örnekler

https://example.com/robots.txt - için çalışıyor https://example.com/Ama için değil http:// veya diğer alt alanlar.
https://www.example.com/robots.txt - Yalnızca kapaklar www.
ftp://example.com/robots.txt -Yalnızca FTP protokolü için başvururuz.

Google web sitenizdeki hata işlem ve HTTP yanıt kodları

Bir dosya almaya çalışırken cevap koduna bağlı olarak robots.txt, arama robotlarının davranışı değişiyor:

2xx Kodları - Dosya okunur ve kullanılır.
3xx Kodları - 5'ten fazla yönlendirme varsa, dosyaya erişilemez kabul edilir.
4xx kodları (429 hariç) - Yasakların olmadığına inanılmaktadır.
5xx Kodları - Sunucu hatalarıyla robot, sitenin sitesini geçici olarak durdurabilir.

Google, siteniz için robots.txt dosyasını nasıl önbelleğe alıyor

Robotlar, dosyanın içeriğini 24 saate kadar önbelleğe alabilir, ancak sorunlar (zaman aşımları, hatalar) durumunda son tarih artar. Başlıklar Cache-Control Ayrıca önbellekleme davranışını da etkiler.

Robots.txt dosya biçimi ve Google Sitesi için kodlama

Dosya, CR, CR/LF veya LF çizgilerinin bölücüleri ile UTF-8 kodlamasında olmalıdır. Yanlış semboller veya -Content yok sayılır. İzin verilen maksimum dosya boyutu 500 KIB, geri kalanı göz ardı edilir.

Sözdizimi ve Desteklenen Robots.txt Direktifleri Siteniz için Google'da

Her satır bir anahtar, kolon ve değerlerden oluşur. İşaretten sonra yorum eklemesine izin verilir #. Aşağıdaki alanlar desteklenir:

kullanıcı ajanı - Kuralların hangi robotun uygulanabilir olduğunu gösterir.
İzin vermek - İzin verilen yol.
İzin vermek - Yasak Yol.
Yer haritası - Site kartının tam adresi.

Tüm yollar sicile duyarlıdır ve /.

Kullanıcı ajanına göre açıklama: Sitenizin belirli robotlarının kurallarını Google'da nasıl belirtilir

Anlam user-agent Kayıt'a duyarlı değil. Belirli kuralları belirtmek için robotun tam adını kullanın, aksi takdirde küresel şablon kullanılır *.

Google'da Sitenizin Robots.txt dosyasında izin verilen yönerge ne yapar?

Robotların belirtilen yollarla erişimini sınırlar. Ancak, URL hala sayfa parçası olmadan arama sonuçlarında görünebilir.

İşlevlere İzin Ver: Google'daki sitenizin bölümlerine nasıl erişim sağlanır

Kısmen yasaklama kurallarına girseler bile, belirli yollara erişime izin verir.

Google siteniz için robots.txt'de site haritası nasıl belirtilir

Site kartına bağlantılar yayınlamasına izin verilir. Birkaç tane olabilir. Adres mutlak ve doğru olmalıdır. Ayrı olarak yasaklanmamışsa, tüm robotlar için geçerlidirler.

Robots.txt'de Gruplama Kuralları Siteniz Google'da

Bir dizi kural kümesi, kullanıcı ajanı satırlarını temel kuralların önünde birbiri ardına tekrar ederek birkaç kullanıcı aracısına uygulanabilir.

Google'da Sitenizin Robots.txt dosyasındaki kullanıcı aracısı için önceliklerin belirlenmesi

En spesifik kullanıcı ajanı seçilir. Birkaç tesadüf bulunursa, en uzun ve en doğru alınır. Genel Kurallar * Özel olanlarla birleştirilmedi.

Google'daki Sitede Robots.txt Kuralları Gruplama Örnekleri

Birkaç blok bir robota aitse, otomatik olarak birleştirilir. Site haritası gibi kalan çizgiler gruplama sırasında dikkate alınmaz.

Siteniz için Google'daki URL Rotaları ve Robots.txt Kuralları Nasıl Karşılaştırılır

Kuraldan gelen yol, sayfanın sayfası ile karşılaştırılır. Semboller Çalışıyor * (herhangi bir sembol, 0 veya daha fazla) ve $ (hattın sonu). Örnekler:

/ - Sitenin kökü ve yatırılan tüm URL'lerle çakışır.
/fish - başlayan tüm yollar /fish.
/fish/ - Sonunda sadece eğik çizgi belirtiliyor.
/*.php - Genişletme .php.
/*.php$ - Yalnızca .php ile bitenler.

Google için Sitenizdeki Robots.txt Dosyasında İzin Ver ve İzin Verme Kurallarının Önceliği

Çatışan kurallar aynı anda mevcutsa, yol boyunca daha uzun ve daha az kısıtlayıcı olan kullanılır. Yani, tartışmalı durumlarda, en doğru çözümleme kuralına öncelik verilir.

Siteniz için bir robots.txt dosyası oluşturma, kontrol etme veya kurma konusunda yardım almak istiyorsanız, SEO Ajansı ile iletişime geçin. CEO. E -postayla yazın: info@seo.computer Veya WhatsApp'ta: +7 920 204 44 61.

ID: 159