この記事では、異なるHTTPステータスコード、およびネットワークおよびDNSエラーがGoogle検索エンジンのサイトの可視性にどのように影響するかについて説明します。最も一般的なサーバーの回答と、サイトを回避するときに検索ボットが遭遇する可能性のあるエラーの主なタイプが考慮されます。よりまれなコードとプロトコルは考慮されていません。記載されているすべての問題は、Google検索コンソールでサイトをインデックス化するレポートに適切なエラーまたは警告を引き起こします。
HTTPおよびFTPプロトコルの実験機能は、テキストが特に示されていない場合、サポートされていません。
HTTPステータスコードは、サイトページをリクエストするときにブラウザであろうと検索ロボットであろうと、クライアントがアドレス指定するサーバーの回答です。各コードには特定の値がありますが、多くの場合、処理のプロセスが似ています。たとえば、いくつかのコードは転送を示していますが、結果は最終URLでヒットします。
Google Search Consoleは、4xxおよび5xxの範囲からのコード、および失敗したリダイレクト(3xx)のコードのエラーを記録します。サーバーが2xxコードを返す場合、ページの内容はインデックス作成に受け入れられますが、保証はありません。
以下は、メインのHTTPステータスコードを備えたテーブルです。これは、サイトをスキャンしたときとGoogleでのインデックス作成への影響を最もよく見られます。
このようなコードは、Googleがインデックス化のために処理できるコンテンツの送信が成功することを意味します。ただし、ページにエラーが含まれている場合、たとえば空のコンテンツやエラーメッセージが含まれている場合、Googleはソフトエラー404として分類できます。
200(OK) - ページが正常にロードされ、内容がインデックスシステムに転送されます。インデックス作成は可能ですが、保証されていません。
201(作成)、202(受け入れ) -GoogleBotは、コンテンツが限られた時間を取得することを期待しており、その後、インデックス化のために利用可能なデータを送信します。待ち時間はエージェントのタイプに依存します。
204(内容なし) -GoogleBotは、インデックスシステムに内容がないことを伝えます。インデックスレポートでは、これはソフトエラー404のように見える場合があります。
GoogleBotは、最大10のリダイレクトのチェーンを越えることができます。制限を超えてコンテンツが受信されない場合、リダイレクトエラーはインデックス化レポートにあります。移行の数は、GoogleBotのタイプによって異なります。
Redisters URLのすべてのコンテンツは無視され、最終URLのみがインデックス作成に受け入れられます。 3xxコードを備えたrobots.txtファイルの場合、特別なルールが使用されます。
301(永遠に移動) -GoogleBotはリダイレクトに従い、最終URLをメインと見なし、ページの重量に渡します。
302(一時的に移動) -GoogleBotはリダイレクトに従いますが、標準性への信号は弱くなります。
303、304(変更しなかった) -Googleは、コンテンツが前回の訪問から変更されておらず、再びインデックスを付けていないと報告しています。
307、308 - 同様に302と301もそれぞれ302と301ですが、意味的には異なります。サイトには、他の顧客との互換性を向上させるために、適切なコードを使用してください。
4xxの回答があるページはインデックス化の場合は考慮されておらず、既にインデックスにある場合は削除されます。そのようなページの内容は完全に無視されます。
400(誤ったリクエスト) 429を除く他の4xxは、コンテンツがないことを意味し、URLはインデックスから除外されます。そのようなページをバイパスする頻度は徐々に減少します。
迂回頻度を制限するために401と403を使用しないでください - これらのコードはスキャン速度に影響しません。バイパスを制限するには、特別な設定を使用します。
401(認可されていない)、 403(禁止)、 404(見つかりません)、 410(削除)、 411(必要な長さ)
429(リクエストが多すぎる) -Googleは、このコードをサーバーエラーに属するサーバーの過負荷の兆候として認識しています。
5xxと429の間違いは、サイトをバイパスする速度を一時的に減少させます。既にインデックス付きURLは保存されていますが、インデックスから一定のエラーが削除されます。
5xxのページは、インデックス作成時に考慮されていません。 robots.txtの場合、5xxの個別のルールがあります。
500(サーバー内部エラー) -Googleは、そのようなエラーの数に応じて、サイトバイパスの頻度を減らします。
502(悪いゲートウェイ)、503(サービスは利用できません) - スキャンを制限する同様のアクション。
ソフト404エラーは、ページが200のステータスを返すが、エラーメッセージまたは空の内容が含まれている場合に発生します。これは、たとえば、含まれているファイルや空の検索ページの欠如など、技術的な問題によって引き起こされる可能性があります。
このようなページは、ユーザーエクスペリエンスの低下を作成し、Googleのインデックスから除外されます。検索コンソールレポートには、ソフト404エラーに関する警告が表示されます。
ソリューションオプションは、状況と望ましい結果に依存します。
検索エンジンがインデックスから削除する必要があることを知っているように、交換のないページのHTTPステータス404または410を返します。訪問者のための便利なヒントとナビゲーションを備えたユーザーページ404を設定します。
ユーザー404は、そのようなページのインデックスを避けるためにコード404を返す必要があります。
ユーザーと検索エンジンが関連情報に正しく切り替わるように、同様のコンテンツを持つ新しいページに一定のリダイレクト301を設定します。 URLチェックツールを介して正しい応答を確認してください。
おそらく、GoogleBotは、リソースの不足、コード、またはロックのエラーのためにページを正しくロードできなかったでしょう。 URLテストツールを使用して、ページ図面とHTTPコードを表示します。スクリプトや画像などのリソースの負荷に関する問題は、軽度の404エラーにつながる可能性があります。
主な理由は、robots.txtのロック、ページ上のリソースが多すぎる、サーバーエラー、ダウンロードが遅い、または大きなファイルが大きすぎることです。
ネットワークおよびDNSエラーは、検索におけるサイトの位置に迅速に悪影響を及ぼします。 GoogleBotは、タイムアウト、接続の放電、またはDNSの問題を検出すると、サーバーが負荷に対処していないことを理解しているため、迂回頻度を減らし始めます。
コンテンツはそのようなエラーでは取得されないため、Googleはインデックスページをインデックスできず、以前に利用できなくなったインデックス付きページは数日で検索から削除されます。検索コンソールのレポートには、対応するエラーがあります。
自分でサーバーを制御しない場合は、ホスティングまたはCDNプロバイダーに連絡することをお勧めします。
ネットワークエラーは、サーバーによる要求の処理前またはスキャンプロセスで発生する可能性があります。 HTTPコードの欠如は診断を複雑にします。タイムアウトと接続のリセットのエラーを排除するには:
問題は、ネットワークインターフェイスの過負荷またはポートの不適切な閉鎖に関連する可能性があり、パッケージの損失と接続の排出につながります。
ほとんどの場合、DNSエラーは、ファイアウォールレベルでの不適切な設定またはブロック要求によって引き起こされます。次の手順を診断するには:
Googleでサイトのインデックス作成を改善するための質問については、SEO会社に連絡することをお勧めします 最高経営責任者(CEO) メールで info@seo.computer またはwhatsappを介して +79202044461。
ID 70