はじめに
概要
本資料は、Webサイトのサイトマップが表示されない、あるいはGoogle Search Consoleでサイトマップが取得できないときの原因と対処法を分かりやすくまとめたガイドです。技術的な背景を端的に説明し、実務で使える手順を示します。
対象読者
- 自分のサイトが検索に表示されにくいと感じている方
- サイト運営者やコンテンツ担当者、初心者のWeb管理者
目次(本資料で学べること)
- サイトマップの重要性(第2章)
- 表示されない主な原因(第3章)
- 原因別の具体的な対処法(第4章)
- Googleの処理待機の可能性(第5章)
読み方のポイント
章ごとに問題の切り分けと優先度を示します。まず第2章で“なぜサイトマップが重要か”を押さえてから、第3章・第4章で具体的な確認と対処を行ってください。専門用語は最小限にし、具体例を交えて説明します。
サイトマップの重要性
サイトマップとは何か
サイトマップはWebサイトのページ一覧を検索エンジンに伝えるファイルです。一般的にはXML形式で作成しますが、難しい操作は必要ありません。新しい記事や商品ページを検索エンジンに早く見つけてもらうために使います。
なぜ重要か
検索エンジンはサイト全体を巡回しますが、すべてのページを確実に発見できるわけではありません。サイトマップがあると、重要なページや更新日時を明示できます。その結果、新しいページがインデックスされやすくなり、検索結果に反映される可能性が高まります。
具体的な効果
- 新規ページの発見が早くなる
- ページの優先度や最終更新日を伝えられる
- 大規模サイトや階層が深いサイトで特に有効
注意点と簡単な対策
常に最新の状態に保ち、正規のURLのみを含めてください。サイトマップにエラーがあると検索エンジンが正しく読み取れません。Google Search Consoleなどに送信して、エラーを確認すると安心です。
サイトマップが表示されない10の主な原因
- URLの入力ミス
-
サイトマップのURLは正確に入力してください。拡張子が「.xml」か、先頭や末尾に余計なスペースがないかを確認します。
-
サイトマップファイルが存在しない
-
サーバー上にファイルが生成されているか確認します。例:/sitemap.xml が実際に存在するかを直接ブラウザで開いて確かめます。
-
HTTPとHTTPSの混在
-
サイトがHTTPSなら、サイトマップのURLもHTTPSで指定します。混在すると検出されないことがあります。
-
robots.txtによるブロック
-
robots.txtでサイトマップやページがブロックされていないか確認します。ファイル冒頭のSitemap行もチェックしてください。
-
ファイル形式が不適切
-
サイトマップはXML形式が基本です。HTMLやプレーンテキストでは正しく処理されません。
-
サーバーの応答が遅い
-
タイムアウトや頻繁なエラーがあるとクロールが途中で止まります。レスポンス時間やエラーログを確認しましょう。
-
認証が必要なページが含まれる
-
ログインが必要なURLをサイトマップに含めないでください。誰でもアクセスできる場所に配置します。
-
Googleクローラーのアクセス制限
-
ファイアウォールやセキュリティ設定でGooglebotが遮断されていないか確認します。IPやUA制限が原因になることがあります。
-
外部リンクの不具合
-
サイトマップ内のリンク先が404やリダイレクトだらけだと評価が下がります。リンク先の存在をチェックしてください。
-
キャッシュが古いまま
- ブラウザやサーバー、検索エンジン側のキャッシュで古い情報が残ることがあります。キャッシュをクリアして再送信してください。
原因別の具体的な対処法
URL関連のエラーへの対処
サイトマップのURLをブラウザに貼り付け、XMLが正しく表示されるか確認します。404や403が出る場合はURL誤りやアクセス制限が原因です。例: https://example.com/sitemap.xml を直接開いて確認します。問題が見つかったら正しいURLを使って再送信します。
robots.txtの修正
robots.txtでサイトマップや該当パスがブロックされていないか確認します。許可する一例:
User-agent: *
Allow: /
Sitemap: https://example.com/sitemap.xml
必要ならDisallow行を削除してファイルを更新します。
サーバーの状態確認と改善
XMLがタイムアウトや503で返る場合はサーバー負荷や設定の問題です。ホスティングのステータスを確認し、再起動やリソース増強を行ってください。修正後、時間を置いてから再送信します。
手動による対策の確認
Search Consoleの手動による対策(Manual Actions)やセキュリティ通知を確かめます。問題が記載されていれば指示に従い修正し、審査をリクエストしてください。
パーマリンク構造の最適化
WordPressでは「設定 > パーマリンク」を開き、現在の設定を確認してから一度保存してURL構造を再生成します。カスタム構造を使う場合はスラッシュや拡張子の誤りに注意します。
ブラウザキャッシュのクリア
ブラウザのキャッシュ表示で古いXMLが出ることがあります。Ctrl+F5やブラウザの履歴からキャッシュを消去して再確認してください。
Googleの処理待機の可能性
概要
「取得できませんでした」と表示されても、必ずしもサイトマップやページに重大な問題があるわけではありません。Google側の処理待機や反映の遅延で一時的に取得できないと出る場合があります。
なぜ処理待機が起きるのか
- クローラーの処理待ち:多数のサイトやURLを処理するため順番待ちになります。
- 再クロールの間隔:一度クロールしたページでも再確認まで時間がかかることがあります。
- 一時的なシステム負荷:Google側で負荷が高いと応答が遅れます。
待つ間にできること
- 24〜72時間ほど時間を置いて再確認してください。短時間で解決することが多いです。
- サイトマップを再送信する:Search Consoleから再度送信すると処理が促進される場合があります。
- サーバーやrobots.txtを確認する:アクセスが制限されていないかをチェックします。
- サイトの更新履歴を確認:大きな変更を加えた直後は反映に時間がかかります。
目安と注意点
- 多くの場合、数日で表示が戻ります。24時間経っても改善がなければ上記の確認事項を見直してください。重要な変更を加えた場合は再送信と数日の待機を組み合わせると確実です。












