サーチコンソールでfeed URLの意味と対策を詳しく解説

目次

はじめに

本記事の目的

本記事は、Googleサーチコンソールに表示される「/feed」などのRSSフィードURLについて、問題の見つけ方と対処法をわかりやすく整理したガイドです。特にサーチコンソールで「クロール済み – インデックス未登録」と表示されるfeed URLの意味や、検索結果に出さないための設定を中心に解説します。

誰に向けた記事か

  • ブログやサイトを運営している方
  • サーチコンソールに慣れていない方
  • feedが検索結果に表示されるのを避けたい方

本記事で学べること(章立て)

  1. feedがサーチコンソールに出る理由と意味
  2. feedを非表示にする方法やインデックスさせない設定
  3. 「クロール済み – インデックス未登録」がSEOに与える影響
  4. RSSフィードを逆に活用する方法
  5. GoogleのFeedfetcherの仕組みと注意点
  6. 運用方針のまとめとよくある質問

読み方の注意点

具体的な設定手順はサイトの種類(WordPressなど)で異なります。章ごとに実例を挙げますので、ご自身の環境に合わせて参照してください。

サーチコンソールで「/feed」URLが表示される理由とその意味

概要

Googleサーチコンソールの「ページ」→「クロール済み – インデックス未登録」に「/feed」や「/feed/」が並ぶことがあります。これはGoogleがRSS(フィード)を見つけてクロールしたが、検索結果に載せる必要はないと判断した状態です。

なぜ表示されるのか

  • 多くのCMS(例:WordPress)は自動で /feed を生成します。サイト内リンクやヘッダーのauto-discoveryからGoogleが辿ります。
  • フィードは記事本文の要約や全文を含むため、元ページと内容が重複しやすいです。重複は検索結果で価値が低いと見なされます。

これが意味すること

  • SEO上の重大な問題ではありません。フィードは主に読者や外部サービス向けの配信手段であり、検索順位を直接左右しません。
  • 「クロール済み – インデックス未登録」は単にインデックス対象外になったという状態表示です。通常は放置して問題ありません。

簡単なチェック方法

  • サーチコンソールで当該URLを「URL検査」し、HTTPステータスやコンテンツを確認します。フィードが200で返り、本文が記事とほぼ同じならGoogleが重複と判断した可能性が高いです。

次章では、フィードURLをサーチコンソールに表示させない具体的な方法を解説します。

feed URLをサーチコンソールで非表示・インデックスさせないための方法

以下では代表的な3つの対処法をやさしく説明します。

1. プラグインで無効化(WordPressなど)

WordPressなら「Disable Feeds」などの専用プラグインでフィード出力を止められます。止めると/feedにアクセスしても404やトップへのリダイレクトになるため、検索結果に出にくくなります。操作は簡単で初心者向けです。

2. functions.phpにコード追加してnoindexを付与

フィードを残しつつインデックスだけ防ぎたい場合は、HTTPヘッダーでX-Robots-Tagを付けると確実です。例:

add_action('template_redirect', function() {
  if (is_feed()) {
    header('X-Robots-Tag: noindex, nofollow', true);
  }
});

この方法は検索エンジンに明確に「インデックスしない」と伝えます。metaタグよりヘッダーの方が確実に働くことが多いです。

3. robots.txtでクロール除外設定

robots.txtに以下を追加するとクローラーの訪問を止められます:

User-agent: *
Disallow: /feed/
Disallow: /*/feed

ただしrobots.txtはクロールを止めるだけで、外部リンクなどでURLが知られていればインデックスされる場合があります。

設定後の注意点

設定変更は即時反映されません。検索エンジンが再クロールするまで時間がかかるため、Search ConsoleのURL削除ツールを一時的に使えますが、恒久対策としては上記のいずれか(特にX-Robots-Tagか出力停止)をおすすめします。

feed URLの「クロール済み – インデックス未登録」がSEOに与える影響

要点

Googleサーチコンソールでfeed(例:/feed)が「クロール済み – インデックス未登録」と表示されても、通常のSEOに悪影響はほとんどありません。Googleはフィードを検索結果に出す目的が薄く、意図的にインデックスしない処理を行うためです。

なぜ影響が小さいのか

  • フィードは主に配信・購読用のコンテンツで、検索向けのページとは用途が異なります。例:WordPressの /feed は記事本文の抜粋を配信します。
  • Googleは重複や短いコンテンツをインデックスしないことが多く、フィードは該当しやすいです。

実務での対応例

  • 放置で問題ありません。サイト本体(記事ページ)が正しくインデックスされているか確認してください。
  • 気になる場合はフィードに「noindex」ヘッダー(X‑Robots‑Tag: noindex)を付ける方法があります。これで検索インデックス対象外に明示できます。
  • 大規模サイトでフィードが大量にクロールされてサーバー負荷やクロール予算に影響する場合は、robots.txtで制御するかフィード配信を調整します。

注意点

フィードを完全にブロックすると一部の外部サービスや購読者に影響します。配信が必要な場合はnoindexで検索除外し、配信自体は維持する方法を検討してください。

逆にRSSフィードをGoogleサーチコンソールで活用する場合

なぜRSS/Atomを活用するか

RSSフィードはサイトの最新記事や更新情報を検索エンジンに素早く伝えます。XMLサイトマップと併用すると、サイト全体の構造はサイトマップで、更新情報はフィードで効率的に知らせられます。特に頻繁に更新するサイトで有効です。

Search Consoleでの登録方法(手順)

  1. フィードのURLを確認(例:https://example.com/feed/ または /feed.xml)。
  2. Search Consoleの「サイトマップ」へ移動。URL欄にフィードURLを入力して送信。
  3. 送信後は「送信済みサイトマップ」でステータスを確認。エラーや警告が出たら修正します。

プラグインや設定のポイント

WordPressなどではフィード関連プラグインが自動でnoindexやcanonicalを付与することがあります。これによりフィード自体が検索結果に出ないようにでき、重複コンテンツの問題を避けられます。プラグインの設定を確認して、フィードが意図した挙動になっているか確認してください。

モニタリングと注意点

Search Consoleでカバレッジや送信状況を定期的に確認します。フィードが頻繁に更新される場合、通知は早くなりますが、正しいURLで送信しているか、XMLが有効な形式かは必ずチェックしてください。

GoogleのFeedfetcherの仕組みと注意点

概要

GoogleのFeedfetcherはRSS/Atomフィード専用のクローラーです。サイトの更新情報を取得して、Googleのニュースや購読サービスなどで使われます。重要なのは、Feedfetcherの取得は検索インデックスには影響しない点です。フィード内の本文が検索結果に直接表示されることは基本的にありません。

動作のポイント

  • 取得頻度はフィードの更新頻度や過去の更新状況で決まります。更新が多ければ頻繁にアクセスします。例:活発なブログはより短い間隔でチェックされます。
  • HTTPの条件付きGET(If-Modified-Since / ETag)を使います。変化がなければサーバーは304で応答し、帯域を節約します。
  • 主なUser-Agentは「FeedFetcher-Google」です。サーバーログで確認できます。

制御方法と注意点

  • robots.txtで制御できます(例: User-agent: FeedFetcher-Google\nDisallow: /feed)。ただしブロックするとGoogle側の購読系サービスや一部の配信に影響します。
  • フィードに全文を載せると重複コンテンツを心配する場合があります。要約だけにする運用が有効です。

運用上は、ログでFetchパターンを見て必要ならrobots.txtやフィード内容を調整することをお勧めします。

feed URLの運用方針まとめ

運用方針の考え方

まず目的をはっきりさせます。RSSを利用しないなら削除、利用するが検索結果に出したくないならnoindex、クロール自体を止めたいならrobots.txtで制御します。目的ごとに対処を分けると管理が楽です。

利用しない場合(無効化)

WordPress等ならフィードを無効化するプラグインやテーマの設定を使います。不要なURLを公開しないことで誤検出や無駄なクロールを減らせます。

利用するがインデックスは不要な場合

ページヘッダーにを追加するか、SEOプラグインでフィードにnoindexを付けます。これでGoogleの検索結果から外せます。

クロール自体を止めたい場合

robots.txtに「Disallow: /feed」などを追加します。注意点として、robots.txtでブロックするとGoogleがそのURLの詳細を把握しにくくなります。

サーチコンソールに/feedが表示されても

/ feedが表示されても、主要ページのインデックスに影響することは通常ありません。重要なのはトップページや記事ページのインデックス状況を定期的に確認することです。

確認項目(実務チェック)

  • フィードを使うかどうかを決める
  • 無効化・noindex・robots.txtのどれを採るか決定
  • サーチコンソールで主要ページのインデックスを確認
  • 変更後に実際に反映されたかテストする

この流れで運用方針を決めると無駄な作業を避けられます。

feed関連でよくある質問

よくある疑問をQ&A形式でまとめます。短く具体例を添えて説明します。

Q1: feed URLが消えません。どうすればよいですか?

A: 多くはGoogleのクロールタイミングの問題で、時間を置けば消えます。急ぎの場合はサーチコンソールの「URL削除ツール」を使えますが、一時的な非表示になるだけで恒久対策になりません。確実に消したいときはサーバー側で該当URLを削除するか、HTTP 410を返す方法が安全です。

Q2: robots.txtやnoindexを使うべきですか?

A: RSSは購読や配信に使います。購読者や外部サービスに影響を与えたくないならnoindexやrobotsで制御します。ただしrobotsでブロックするとGoogleのFetch(例: Feedfetcher)が動作しなくなる場合があります。

Q3: XMLサイトマップとRSSはどちらを使う?

A: 使い分けが重要です。XMLサイトマップは全ページのインデックス状態を管理するために使い、RSSフィードは最新更新情報を配信するために使います。両方用意すると運用が安定します。

Q4: SEOへの影響はありますか?

A: 通常のRSS表示や一時的な「クロール済み–インデックス未登録」自体は大きな悪影響になりません。重要なのは公開したいページが正しくインデックスされているかを確認することです。

よかったらシェアしてね!
  • URLをコピーしました!

この記事を書いた人

目次