at backyard

Color my life with the chaos of trouble.

Google Search ConsoleからURLのインデックス登録をリクエストしてもGoogleの検索結果に出てこない場合

インデックス登録をしたのにGoogle検索結果に出てこない

Google Search ConsoleからURLのインデックス登録をリクエストしてもGoogleの検索結果に出てこない場合がある。

このケースは時折、起きるときがある。

インデックス登録をリクエストすると、大抵は再度URL検査を行うと、既にGoogleのインデックス登録済みとなっているのだが、このようなケースでは再度URL検査をしても、インデックス登録がされていない状態となっているとGoogle Search Console上で告げられる。

Google Search Consoleの公開URLをテストで問題がないページでもインデックス登録が行われないケースがある

Google Search ConsoleではURL検査を行ったときに、公開URLをテスト という機能があり、実際に指定したURLのページに問題がないかを前もって確認することができるが、この確認の際に問題がないURLの場合でも(※)、検索結果に出てこないようなケースはある。
Googleでインデックス登録できる、と判定された場合でも、Googleのインデックス登録が行われないというケースだ。

f:id:shinshin86:20210428081437p:plain
Googleに登録できると表示されているが、この状態でも登録されない場合がある

ちなみに、このようなケースはGoogle側でも ある とドキュメントに記載されている。実際の記載は下記のページにある。

URL 検査ツール - Search Console ヘルプ

下記が上のページの引用となる。

有効なテスト結果が得られたページは、必ずインデックスに登録されますか?
いいえ、されません。このテストでは、Googlebot がインデックス登録のためにページにアクセスできることのみが確認されます。ライブテストの判定が有効または警告であったとしても、そのページがインデックス登録されるには、さらに他の条件を満たす必要があります。次に例を示します。 ページに手動による対策や法律に関する問題が含まれていないこと。 ページが、インデックスに登録された別のページと重複していないこと。固有のページであるか、同様のページセットの正規バージョンとして選択されている必要があります。 インデックス登録されるには、ページの品質が十分に高くなければいけません。

インデックス登録できると判定されたページなのに、実際のGoogleの検索結果に出てこない場合の原因

では、なぜGoogleの検索結果に出てこないかという話だが、まずは URLが重複しているとか、複数のURLでアクセスできるとか、そのような問題はない という前提でここは話をすすめる。
もしこのような問題が考えられる場合は、まずはそちらの問題を解消していく必要がある。

これらの問題については下記のドキュメントに記載されている。

developers.google.com

では、ここからが本題となる。
なお、ここからの内容は自身の主観も入り混じっていることに注意してほしい。

これまでこのようなケースをいくつか体験してきて、実際に原因を探った上でたどり着いた一つの仮説レベルである。

コンテンツが似ていることが原因!?

具体例を出して説明しようと思う。

下記の投稿は昨日書いたものだ。

shinshin86.hateblo.jp

たいていブログの投稿を行い、インデックス登録をリクエストすると、このブログの場合、早ければ数時間でGoogle検索結果に載る。

だが、こちらの記事は一晩経ってみても、Google 検索結果には載っていなかった。
そればかりか、再度URL検査をしてみても、インデックス登録されていない状態とGoogle Search Console上では表示されていた。

実際に上の記事に関連するワードで検索してみても、検索結果には出てこない。が、代わりに下記の記事がヒットしていた。

shinshin86.hateblo.jp

こちらの記事も先ほどの記事も、コンテンツの内容が似通ってはいる。

そしてGoogle検索に関するドキュメントではこのような場合、完成度が高いページの方を正規としてみなして、もう片方のページについては重複したページと判断する、というような記載が上に貼ったGoogleドキュメント内にある。
実際にその記述を下に引用する。

Googlebot は、サイトをインデックスに登録する際、各ページの主なコンテンツを特定しようとします。同一のサイト内に、同じものを扱っていると思われるページが複数見つかった場合、Googlebot では、最も完成度が高く有用であると判断したページを選び、そのページを正規と見なします。この正規ページが定期的に最も頻繁にクロールされることになり、重複したページについては、サイトに対する Google のクロールの負荷を削減するためにクロール頻度が下がります。

今回の場合、これらのブログ記事の一つのテーマとして ペラサイト というのが挙げられる。
このテーマで被っているために、インデックス登録されていないのではないか?と私は考えている。

コンテンツが被っている場合の対応策は?

この対応策についてだが、ひたすら待つしかなさそうというのが自身の結論である。

実際に何もせず待っていたら、いつの間にかインデックス登録されていたというケースがある。

shinshin86.hateblo.jp

こちらの記事も書いてから数日経っても、インデックス登録は行っても、後日URL検査を行うとインデックス登録されていない状態 となっていた。

諦めて放置していたが、するといつの間にかインデックス登録が完了してGoogleの検索結果に出てくるようになっていた。

というわけで、この問題については一旦放置で待ってみるというのも良いかもしれない。

実際のところ、コンテンツが似ているものでも、公開してから数時間でそれぞれのサイトが正常にインデックス登録されているケースもあるので、ここらへんはGoogleのシステムの他の要因で起きているのかもしれない。
(結局、これらのことは憶測の域を出ないな...とここまで書いていて思った)

もし同じような問題で悩んでいる方がいましたら、参考になれば幸いです。