Naver サーチアドバイザー収集の制限:リダイレクトされたページの問題

Last Updated:2023年02月15日| , | コメントを残す

Naver サーチアドバイザーでは、毎日50個のURLを収集することができます。 私はこのサイトとは異なります WordPress ブログに対してすべてのポストURLを抽出し、マクロプログラムで毎日50個ずつ収集要求をしています。 しかし、数日が過ぎて Naver ウェブマスターツールのサイト診断ページをチェックしてみると、 WordPress ブログで送信されたURLが収集保留になったことがわかりました。 もう少し詳しく見てみると、下の図に示すように「リダイレクトされたページ」エラーが表示されました。

Naver サーチアドバイザー収集の制限:リダイレクトされたページの問題

Naver サーチアドバイザー収集の制限:リダイレクトされたページの問題

同様の方法でURLを抽出して収集をリクエストしましたが、このブログではエラーは発生しませんでしたが、他のサイトではリダイレクトページの問題が表示されるかどうか疑問に思いました。

送信したURLを比較してみると、このブログの場合:

https://www.thewordcracker.com/blog/%eb%8c%80%ed%99%94%ed%98%95-ai-%ec%b1%97gpt-%ea%b8%b0%ed%9a%8c-%ed%98%b9%ec%9d%80-%ec%9c%84%ed%98%91/

上記と同じ形式であるのに対し、他のブログの URL は次のように最後に「/」が欠落していました。

https://example.com/글제목

通常、ブラウザからアドレスをコピーして貼り付けると、最後にスラッシュが貼り付けられます。

https://www.thewordcracker.com/

ずっと前に、アドレスの最後にスラッシュが付いている問題について調査を行ったことがあります。 技術的な部分に関連しているようです。 最後にスラッシュが付くと(こんなスラッシュを「トレーリングスラッシュ」あるいは「末尾のスラッシュ」と言います)、速度が少し速くなることをある海外ブログ記事で読んだ記憶があります。

ここでグーグルしてみると複雑に説明されている場合が多いのですが。 簡単に理解すれば、スラッシュの有無によってブラウザからディレクトリとして、あるいはファイルとして認識することになるという。

https://www.example.com/example/ -> 디렉터리
https://www.example.com/example -> 파일

ファイルではなくアドレスにトレーリングスラッシュを省略すると、ブラウザはファイルを見つけようとし、ファイルがない場合はディレクトリを確認することになるとします。

したがって、スラッシュを欠落すると、接続速度に若干の違いがある可能性があります。

Naver サーチアドバイザーがURL収集リクエストを行うときに末尾のスラッシュがない場合 Naverでは、スラッシュのあるバージョンにリダイレクトされると認識し、「リダイレクトされたページ」の問題を返すようです。

実際、URLの末尾にスラッシュをすべて追加してから収集を要求し、数日経って正常に収集され始めました。

Naver サーチアドバイザー収集依頼

上記のグラフでは、オレンジ色のバーが収集制限されたページ数を意味します。 URLに末尾のスラッシュを付けずに収集要求を行ったときにはすべて収集制限になりましたが、末尾のスラッシュを追加した後は収集制限項目が消えました。

すべてのURLの末尾にスラッシュを一括追加したい場合は、正規表現(正規表現)を使用すると簡単です。

Naver サーチアドバイザー収集の制限:リダイレクトされたページの問題2

上記のように設定して すべて交換をクリックすると、すべての行の末尾にスラッシュ(/)が追加されます。

URLにスラッシュを付けたり貼り付けたりしない問題の詳細 グーグルドキュメントを参照してみることができます。

参照


コメントを残す

コメント