Google Search Console:ページインデックス作成の問題が検出されましたエラー

Last Updated:2023年08月08日| | 8のコメント

WordPress サイトや組織のサイトをGoogleサーチコンソールに登録すると、Googleが「新しいページインデックス作成の問題を検出しました」というメールが頻繁に飛びます。 この場合、そのインデックス作成の問題を確認して、問題が発生した場合は問題を修正してください。

ただし、多くの場合、インデックス作成から除外する必要があるURLである可能性があります。 次の記事を参照して、そのインデックス作成の問題が解決する必要がある問題であることを確認してください。

Google Search Console:ページインデックス作成の問題が検出されましたエラー

最近、Soft 404 の問題によりページのインデックス作成の問題が検出されたというメールが届きました。

Google Search Console:ページインデックス作成の問題が検出されましたエラー

このようなメールを受信したら、メールで「ページのインデックス作成のトラブルシューティング」ボタンをクリックして詳細情報を確認できます。

Googleサーチコンソールソフト404エラー

上記のような画面が表示されたら、URLセクションで問題のあるURLを確認できます。

まず、URLを実際にインデックスにする必要があるかどうかを判断します。 上の図ではhttp://example.kr/blog/674/から ソフト404 エラーが発生すると出てきます。 実際、このURLはないURLであり、インデックスにしてはいけません。 (実際にはないURLなので404エラーが発生することで正常な状態です。)

URLの上にマウスを置き、XNUMX番目のアイコン(新しいウィンドウで開く)をクリックすると、そのURLが新しいウィンドウで開きます。 このURLをインデックスにする必要がある場合は、XNUMX番目のアイコン(虫眼鏡の外観)をクリックしてURLを確認できます。

GoogleインストールコンソールのURLを確認する

「URLがGoogleに登録されていません」の状態になっている場合 索引作成要求を押してインデックス作成要求を行うことができます。

ちなみに、そのURLが正常なURLであるように見えても、次のような場合にはインデックスにならないのが正常です。

  • SSL証明書がインストールされている状態で http://example.com/1234/のようにhttpのアドレス。 これらのアドレスはhttpsアドレスにリダイレクトする必要があります。 (自動的にリダイレクトされない場合は、リダイレクトされるように設定してください。)
  • 通常の住所に見えても https://example.com/1234のように末尾にスラッシュ(/)がない場合でも通常無視すれば良いです。 これらの住所は https://example.com/1234/のようにスラッシュのあるURLにリダイレクトされるため、インデックスにはなりません。

参考までに Rank Math などのSEOプラグインや404監視プラグインを使用して404エラーを監視してリダイレクトを設定することができます。 これによりSEOを改善できます。

また、404ページがありませんエラーが発生したURLをGoogleサーチコンソールから削除要求を行うことができます。

Google 検索コンソール: インデックスが登録されていないページ

Googleインストールコンソールの インデックス作成 » ページで索引付けされていないページを確認できます。

索引付けされないページ

このサイトの場合、10万を超えるページがインデックスされていないページとして表示されています。

下にスクロールすると、「ページインデックスが作成されていない理由」セクションで、ページインデックスが作成されていない理由とそのページ数を確認できます。

ページインデックスが生成されない理由

第 WordPress ブログでは、さまざまな理由で多くのページが索引付けされていないことが示されています。

XNUMXつずつ見てみると、ほとんどのURLが索引付けされない理由があります。

リダイレクトを含むページ

リダイレクトを含むページをクリックすると、問題のあるURLが一覧表示されます。

リダイレクトを含むページ

私はいくつかの理由でリダイレクトを含むページ数が多いです。

  • 多言語サイトで構成し、途中で削除
  • SSL証明書の適用
  • 一部の記事のカテゴリの変更
  • AMPを適用して削除

具体的な例を挙げると、

  1. ①番URLは初めてこのブログが多言語で構成され、韓国語コンテンツのURLが /ja/カテゴリ_名前/テキスト/ 形式でした。 その後、多言語設定を削除しながらURLから/ ja /を削除し、リダイレクトを設定しました。
  2. 一意のアドレスを「一般」に設定すると、投稿URLが http://www.thewordcrakcker.com/?p=1234 形式で表示されます。 固有アドレスを別のオプションに設定すると、ベースURLにアクセスすると実際のURLにリダイレクトされます。
  3. ③番URLの場合、最後にトレーリングスラッシュ(Trailing Slash)が欠落しています。 これらのURLは、トレーリングスラッシュのあるURLにリダイレクトされます。
  4. AMPの削除後にリダイレクトを設定しました。
  5. 一部の記事はカテゴリが変更されました。 たとえば、https://www.thewordcracker.com/basic/hide-wordpress-login-page/にアクセスするとhttps://www.thewordcracker.com/intermediate/hide-wordpress-login-page/にリダイレクトされます。

ちなみにURLの末尾に付くスラッシュを「トレーリングスラッシュ」といいます。

  • URLの末尾にスラッシュ( '/')が付いていることは、そのURLリソースがディレクトリであることを意味します。
  • URLの末尾にスラッシュ( '/')がない場合、そのリソースはファイル(file)であることを意味します。

URLの末尾にスラッシュがない場合はまずファイルを探し、ファイルがない場合はディレクトリを探すとします。 ポストURLにトレーリングスラッシュがない場合は、スラッシュがついて正常なURLに接続されます。 この場合、リダイレクトが発生しながら(スラッシュのあるURLに接続するのに比べて)若干のディレイがあります。

適切な標準タグを含む代替ページ

このブログでは、「適切な標準タグを含む代替ページ」を理由に、インデックスにならないページが24,000を超えています。

適切な標準タグを含む代替ページ

詳細なURLを見ると、すべてインデックスにしてはいけない項目なので無視しても構いません。

/?s=は WordPressで検索実行時に付くパラメータです。 例: https://www.thewordcracker.com/?s=WordPress

ユーザーが選択した標準がない重複ページ

このサイトには、「ユーザーが選択した標準がない重複ページ」に対応するページが1万個以上です。

ユーザーが選択した標準がない重複ページ

実際、この記事を書いた理由がこの部分について扱いたかったからです。 この分類に対応するURLは、 /フィード/がつきます。

この WordPress サイトから GeneratePress テーマに変更した後、このような問題があるようで、最初はテーマに関連する問題なのではないかと疑われました。 しかし、もう少し見てみると、この問題は特定のテーマに関する問題ではありません。 WordPress 独自の機能だそうです。

/feed is the RSS feed of your site, and this is automatically generated by WordPress。 This can be also generated/modified through SEO plugins.

/ feedはサイトのRSSフィードで、 WordPressで自動的に生成され、SEOプラグインを通じて生成/修正が可能だそうです。

Yoast SEOプラグインでは、すべてのフィードURLに「noindex」タグを自動的に追加するそうです。

The Yoast plugin automatically adds a “noindex” tag to all feed URLs, since they don't provide useful content to your site and should not be in the search index. These type of URLs are not added to the sitemap by the plugin either。 However, it's normal that they are excluded from the index and should not be a cause for concern.
RSS feeds are automatically generated by WordPress. WordPress creates feeds for almost all items on a site, including posts, comments, etc...

RSSフィードは WordPressによって自動的に生成されます WordPressでは、ポスト、コメントなどサイトのほぼすべての項目に対してフィードを生成するとします。

そのため、URLの末尾に「/feed」が付く問題による「ユーザーが選択した標準がない重複ページ」の問題は無視しても構いません。

「NOINDEX」タグによって除外されました。

WordPressSEOプラグインを使用して、特定の項目にnoindexメタタグを追加できます。

「NOINDEX」タグによって除外されました。

検索結果ページ(/?s =検索語)​​は動的に生成されるページであるため、noindexを指定する必要があります。

参考までに robots.txtファイル管理者ページなど、特定のディレクトリ内のURLがクロールされないように指定することができます(以下の「robots.txtによってブロックされる」セクションを参照)。 例:

User-agent: *
Allow: /wp-content/uploads/
Disallow: /wp-admin/
Disallow: /readme.html

上記のように設定すると、/wp-admin/のURLはすべてインデックス作成から除外されます。

また、Yoast SEOやRank Math SEOなど、SEOプラグインで詳細にnoindexメタタグを指定できます。

索引にする必要がある項目がrobots.txtファイルまたはSEOプラグインによってnoindexが指定されている場合は、確認してnoindexを解放する必要があります。

上の図で /embed/ が最後につくURLはポストを Facebook, Twitter, Naver ブログ、 Naver カフェ、カトクなどに共有すると埋め込まれるページのようです。 このブログの埋め込みURLにはnoindexメタタグが追加されています。

埋め込みページのインデックスの有無は、正確にどこで制御されているのかわかりません。 Duplicate URL with “/embed/” at the end? 文を見るとSEOプラグインによって制御されそうだそうですね。

カテゴリ、タグなどのアーカイブページがインデックスされないように設定する方法

Rank MathやYoast SEOなどのSEOプラグインを使用すると、カテゴリページやタグページなど、特定のアーカイブページをインデックス化したりインデックス化したりしないように設定できます。

カテゴリ、タグなどのアーカイブページがインデックスされないように設定する方法
Rank Mathのカテゴリアーカイブロボットメタ設定

カテゴリページの場合 Rank Math 検索エンジン最適化 » タイトルとメタ » Post » カテゴリから カテゴリアーカイブロボットメタ オプションを有効にしてから、index、noindex、nofollowなどのロボットメタを指定できます。 タグページも同様に可能です。

通常はインデックスを選択してインデックスを作成することをお勧めします。 必要に応じて、「インデックスなし」(noindex)と「No follow」をチェックしてインデックスにならないようにすることができます。

カテゴリとタグについては、次の記事を参照してください。

ソフト404

削除されたページまたはポストにアクセスしようとすると、404エラーが発生します。

Soft 404 Googleサーチコンソールエラー

このブログでbbPressプラグインを使用してフォーラム掲示板を作成して削除したことがあります。 このため、まだ一部のフォーラムエントリがGoogleの検索結果に公開されているようです。

GoogleサーチコンソールでそのURLを 削除するように求めるすることができます。

robots.txtによってブロックされました

robots.txtによってブロックされました

robots.txtファイルを使用して、そのサイトでクローラーがアクセス(アクセス)できるファイルを制御できます。

WordPressでは、デフォルトでは、次のようにrobots.txtファイルが動的に自動的に生成され、適用されます。

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

Sitemap: https://example.com/wp-sitemap.xml

SEOプラグインを使用してrobots.txtファイルを作成して編集したり、FTP経由でrobots.txtファイルを直接アップロードしたりできます。

「robots.txtによってブロックされている」セクションで、インデックスが必要なURLがrobots.txtによってブロックされている場合は、robots.txtのルールを変更するようにします。

※ティーストーリーの場合、robots.txtファイルにアクセス/編集することはできず、次のようなrobots.txtファイルがすべてのティーストーリーブログに適用されます。

User-agent: *
Disallow: /guestbook
Disallow: /m/guestbook
Disallow: /manage
Disallow: /owner
Disallow: /admin
Disallow: /search
Disallow: /m/search

User-agent: bingbot
Crawl-delay: 20

組織のブログを運営している場合は、上記のrobots.txtルールでクロールを制限するURLが「robots.txtによってブロックされている」セクションに表示されます。 この記事ではrobots.txtファイルを修正する方法はありませんので、このエラーは無視してください。

参照


8のコメント

コメント

  1. こんにちは。今回 WordPressを始めましたが、インデックス申請後すぐに
    下記のように浮かんで検証中ならどうしたらいいですか..?お願いします。

    重複ページ、Googleがユーザーとは異なる標準を選択
    これらのページはインデックスに登録されていないか、Googleに公開されません。

    応答
  2. こんにちは記事は本当によく見ています! 今回問題が発生しました。 WordPress 訪問者が少しずつ増えているが、私が発行した文全部が順位圏で見えないほど下がりました。 理由も全くわかりません。 セキュリティも敷かれており、サイト自体の検索は出てくるからです。 私がその前にとった行動とは文をいくつか修正したことしかありませんでした。 このようにランキングが急落する場合にはどのような措置を取るべきでしょうか。

    応答
  3. Googleサーチコンソールに削除した投稿を検索結果に表示しないように一時的にURL削除申請をしました。問題が生じたと思います。
    Googleサーチコンソールで削除 - 一時削除エントリ - 新しいリクエストで一時的に削除したいURLを貼り付けた後、このURLのみを削除した後にリクエストを行いましたが、この方法は間違っていますか? 一時的にURLを削除するには6ヶ月待つ必要がありますが、あなたはこれについて知っている部分がありますか?

    応答
    • 特定のURLの削除を要求しても、他のURLも一緒に消えません。 私もたまに削除されたURLを削除要求をしますが、このため他の文がインデックスから消えたことはありませんでした。 他の原因で検索結果から消えたのではないでしょうか?

      応答
      • 迅速な回答ありがとうございます。 削除をリクエストしてから3週間経過したため、リクエストのキャンセルはできないようです。 現在は削除期限切れと浮いていますね。