サイトマップ, URLの基本知識と作成・登録方法を詳しく解説

目次

はじめに

目的

この文書は「サイトマップ URL」について、調査とブログ記事作成に使える情報をやさしくまとめます。サイトマップの基本から、含めるべきURLの選び方、作成・登録の手順、注意点、そしてSEOへの効果まで幅広く扱います。

対象読者

初心者から上級者まで、ブログ運営者やECサイト担当、SEOに関心のある方に役立ちます。技術に不慣れな方でも実践できるよう、具体例を交えて説明します。

本書の構成と読み方

各章は実務で使える手順とポイントを中心にまとめます。まずは第2章でサイトマップの基本を確認してください。以降は、実際のURL選定や作成・登録の流れを順に学べます。

サイトマップとは?XMLサイトマップの基本

概要

サイトマップは、サイト内の重要なページの一覧を検索エンジンに伝えるファイルです。特にXMLサイトマップ(通常は sitemap.xml)は機械が読み取りやすい形式でURLを並べ、クロールとインデックスを助けます。

XMLサイトマップの役割

XMLサイトマップは新しいページや更新したページを早く見つけてもらうために有効です。クローラーに「ここを優先して見てください」と伝えるイメージで使います。

含めるべきURL/含めないもの

含める: インデックスさせたい記事、カテゴリーページ、主要な固定ページなど。
含めない: noindex指定のページ、リダイレクト元のURL、重複コンテンツ。URLは正規化(httpsやwwwの有無を統一)してください。

XMLの簡単な例

https://example.com/記事-1
2024-01-10
weekly
0.8

priorityやchangefreqは目安であり、必須ではありません。

配置と注意点

一般的にサイトのルート(例: https://example.com/sitemap.xml)に置きます。ファイルは1つで5万URL、圧縮後でも50MBが上限です。上限を超える場合はsitemap indexを使います。クロールを促す一方で、品質の低いページを含めると逆効果なので注意してください。

サイトマップに含めるべきURLの選び方

概要

サイトマップには「正規(せいき)URL」を含めます。同じ中身を指す複数のURLがある場合は、必ずひとつだけを選んで登録します。誤ったURLを入れると検索エンジンが混乱するためです。

正規URLの決め方(具体例)

  • 表示されるページが1つなら、そのURLを選びます(例: https://example.com/post/123)。
  • パラメータで同じ内容が変わる場合はパラメータを除いたベースURLを正規にします(例: ?utm_source= 等)。
  • wwwあり/なし、末尾のスラッシュの違いはどちらかに統一します。

含めないURL(すぐ除外するもの)

  • noindexが設定されたページ
  • リダイレクト元(301/302で別に飛ぶURL)
  • 重複ページでcanonicalタグが示す正規URL以外
  • ログインページや管理画面、テスト用のステージングURL

実務チェックリスト

  1. 各ページのHTTPステータスが200であることを確認する。2. meta robotsにnoindexがないか確認する。3. canonicalタグで正規が決まっているか確認する。4. リダイレクト元は除外する。5. サイトマップには絶対URLを使う。

これらを順にチェックすれば、正しいURLをサイトマップに含められます。

サイトマップの作成方法

概要

サイトマップは自動で作る方法と手動で作る方法があります。サイトの規模や運用方法に合わせて選びます。

CMSで自動作成(例:WordPress)

WordPressならプラグインで簡単に作成できます。代表的なものは「Google XML Sitemaps」や「Yoast SEO」です。これらを有効化すると、投稿や固定ページを自動で一覧化し、更新に応じてサイトマップを更新します。設定画面で除外するURLや更新頻度を指定できます。

手動で作成する方法(小規模サイト向け)

XMLの基本構造に従ってファイルを作ります。最小限の例:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/</loc>
    <lastmod>2025-01-01</lastmod>
  </url>
</urlset>

各URLは絶対パスで記述し、文字コードはUTF-8にします。

大規模サイトでの作成ツール

ページ数が多い場合はツールを使うと便利です。無料で使える例として「XML-Sitemaps.com」や、デスクトップの「Screaming Frog(無料版は上限あり)」があります。これらはクローリングして大量のURLを一括生成します。

保存場所と圧縮

作成したファイルはルート直下に置き、名前は通常sitemap.xmlにします。大きい場合は.gzで圧縮しても構いません。

動作確認

ブラウザでファイルを開いてXMLが正しく表示されるか、文字化けやURL誤りがないかを確認します。

サイトマップの登録手順

前準備

  • サイト所有権の確認:Google Search Console(GSC)にサイトを登録し、所有権を確認します。ドメインプロパティとURLプレフィックスの違いに注意してください。
  • サイトマップの配置:作成したファイルはサーバーのルート(例:https://example.com/sitemap.xml)に「sitemap.xml」という名前で置きます。サブディレクトリに置く場合はそのフルパスを使います。

Google Search Consoleでの登録手順

  1. GSCにログインし、該当プロパティを選択します。2. 左メニューの「サイトマップ」を開きます。3. 「新しいサイトマップの追加」欄に sitemap.xml などのファイル名またはパスを入力します(例:sitemap.xml または feed/sitemap.xml)。4. 「送信」をクリックします。5. 成功表示が出れば登録完了です。

登録後のチェックと運用

  • ステータス確認:送信後にステータス(成功、エラー、警告)を確認します。エラーが出たら詳細をクリックして原因を確認します。一般的な問題は404、アクセス拒否、robots.txtでブロック、形式エラーなどです。
  • 更新時の再送信:記事を大量に追加したときは再送信してください。頻繁に更新する場合は自動生成とrobots.txtでの参照を検討します。
  • サイズ制限:1ファイルあたり5万URL、圧縮前50MBが上限です。超える場合は複数のサイトマップに分け、サイトマップインデックスを使います。

補足

  • robots.txtに “Sitemap: https://example.com/sitemap.xml” を追記するとクローラーの発見が早まります。

サイトマップの注意点

サイトマップ作成でよくある注意点を、実例を交えてわかりやすくまとめます。

ファイルサイズとURL数

1つのサイトマップは最大50,000件のURL、ファイルサイズは50MB(非圧縮)までです。例:URLが120,000件ある場合は、50,000件ずつに分けて複数ファイルを作り、サイトマップインデックスでまとめます。

分割と圧縮

サイトマップは.xml.gzで圧縮できます。分割したら必ずサイトマップインデックス(index)を用意して検索エンジンに登録します。

含める/除外するURL

正規化した(canonical)URLだけを載せます。ログインページや管理画面、utmなどの追跡パラメータ付きURLは除外してください。noindexタグが付いたページも載せない方が良いです。

更新情報(lastmod)と頻度

lastmodは実際の更新日を入力してください。更新頻度が高いサイトや新規サイトでは、サイトマップをこまめに更新するとクロールの助けになります。

技術的な注意点

・URLは絶対パス(https://〜)で統一します。プロトコルやwwwの有無は揃えてください。
・サイトマップに載せたURLは正常な200応答を返すことを確認します。
・robots.txtでサイトマップの場所を指定すると管理しやすくなります。

登録後のチェック

登録後はサーチコンソールなどでカバレッジを確認し、エラー(4xx/5xx)や意図しない除外がないか定期的に見直してください。大きな構成変更の際は再送信を検討します。

サイトマップのSEO効果

概要

サイトマップは検索エンジンにサイト構造を伝える道しるべです。クローラの巡回(クローラビリティ)を高め、新規ページや更新ページを素早く発見してもらいやすくします。

主な効果と具体例

  • クロールされにくいページがインデックスされる可能性が上がります(例:深い階層や内部リンクが少ないページ)。
  • 新しい記事や更新情報が早く反映されやすくなります。頻繁に更新するサイトで特に有効です。
  • 画像や動画用のサイトマップを用意すると、メディアの検索結果での表示機会が増えます。

実務的なポイント

  • サイトマップはインデックスを保証しませんが、発見の機会を増やします。簡潔なURLを入れ、noindexのページは含めないでください。
  • 大規模サイトは分割(複数のサイトマップ)やgzip圧縮で負荷を下げます。
  • Search Consoleへ送信し、サイトマップレポートを定期確認します。

チェックすべき指標

  • インデックス数、クロール頻度、エラー数を監視します。エラーがあればURLを修正して再送信してください。

ブログ記事用まとめ:サイトマップ URLの選び方と作成・登録方法

短い導入

サイトマップは検索エンジンに知らせたいページの地図です。ここではURLの選び方、作成・登録の流れを分かりやすくまとめます。

ポイント

  • インデックスさせたいページだけを含める(公開済みでnoindexでないページ)
  • リダイレクト元やログインページ、重複ページは除外
  • ファイルサイズとURL数に制限があるため大規模サイトは分割

サイトマップに含めるURLの選び方(例)

  • 含める例:/blog/post-1、/about、/category/tech
  • 除外する例:/private、/search?q=、/old-page(301リダイレクト)

作成方法(簡単な例)

  1. CMS(WordPressのプラグイン等)で自動生成
  2. 手動でXMLを作成:で各URLを列挙
  3. 多数のURLは複数ファイルに分け、sitemap_index.xmlでまとめる

登録方法(Google Search Console)

  1. Search Consoleでサイトを選択
  2. 「サイトマップ」メニューでサイトマップURL(例:sitemap.xml)を入力して送信
  3. robots.txtに“Sitemap: https://example.com/sitemap.xml”を追記すると確実です

大規模サイトの注意点

  • 1ファイル当たり最大50,000 URL、50MBまで。超える場合は分割してインデックスファイルを使う

チェックリスト

  • 含めるURLはindex可能か
  • XMLに誤りがないか(ツールで検証)
  • Search Consoleで送信済みか
  • robots.txtで参照されているか

この内容を基にサイトマップを作れば、検索エンジンへ効率よく通知できます。必要なら具体的なXML例やプラグイン名もお知らせします。

よかったらシェアしてね!
  • URLをコピーしました!

この記事を書いた人

目次