はじめに
目的
この文書は「サイトマップ URL」について、調査とブログ記事作成に使える情報をやさしくまとめます。サイトマップの基本から、含めるべきURLの選び方、作成・登録の手順、注意点、そしてSEOへの効果まで幅広く扱います。
対象読者
初心者から上級者まで、ブログ運営者やECサイト担当、SEOに関心のある方に役立ちます。技術に不慣れな方でも実践できるよう、具体例を交えて説明します。
本書の構成と読み方
各章は実務で使える手順とポイントを中心にまとめます。まずは第2章でサイトマップの基本を確認してください。以降は、実際のURL選定や作成・登録の流れを順に学べます。
サイトマップとは?XMLサイトマップの基本
概要
サイトマップは、サイト内の重要なページの一覧を検索エンジンに伝えるファイルです。特にXMLサイトマップ(通常は sitemap.xml)は機械が読み取りやすい形式でURLを並べ、クロールとインデックスを助けます。
XMLサイトマップの役割
XMLサイトマップは新しいページや更新したページを早く見つけてもらうために有効です。クローラーに「ここを優先して見てください」と伝えるイメージで使います。
含めるべきURL/含めないもの
含める: インデックスさせたい記事、カテゴリーページ、主要な固定ページなど。
含めない: noindex指定のページ、リダイレクト元のURL、重複コンテンツ。URLは正規化(httpsやwwwの有無を統一)してください。
XMLの簡単な例
https://example.com/記事-1
2024-01-10
weekly
0.8
priorityやchangefreqは目安であり、必須ではありません。
配置と注意点
一般的にサイトのルート(例: https://example.com/sitemap.xml)に置きます。ファイルは1つで5万URL、圧縮後でも50MBが上限です。上限を超える場合はsitemap indexを使います。クロールを促す一方で、品質の低いページを含めると逆効果なので注意してください。
サイトマップに含めるべきURLの選び方
概要
サイトマップには「正規(せいき)URL」を含めます。同じ中身を指す複数のURLがある場合は、必ずひとつだけを選んで登録します。誤ったURLを入れると検索エンジンが混乱するためです。
正規URLの決め方(具体例)
- 表示されるページが1つなら、そのURLを選びます(例: https://example.com/post/123)。
- パラメータで同じ内容が変わる場合はパラメータを除いたベースURLを正規にします(例: ?utm_source= 等)。
- wwwあり/なし、末尾のスラッシュの違いはどちらかに統一します。
含めないURL(すぐ除外するもの)
- noindexが設定されたページ
- リダイレクト元(301/302で別に飛ぶURL)
- 重複ページでcanonicalタグが示す正規URL以外
- ログインページや管理画面、テスト用のステージングURL
実務チェックリスト
- 各ページのHTTPステータスが200であることを確認する。2. meta robotsにnoindexがないか確認する。3. canonicalタグで正規が決まっているか確認する。4. リダイレクト元は除外する。5. サイトマップには絶対URLを使う。
これらを順にチェックすれば、正しいURLをサイトマップに含められます。
サイトマップの作成方法
概要
サイトマップは自動で作る方法と手動で作る方法があります。サイトの規模や運用方法に合わせて選びます。
CMSで自動作成(例:WordPress)
WordPressならプラグインで簡単に作成できます。代表的なものは「Google XML Sitemaps」や「Yoast SEO」です。これらを有効化すると、投稿や固定ページを自動で一覧化し、更新に応じてサイトマップを更新します。設定画面で除外するURLや更新頻度を指定できます。
手動で作成する方法(小規模サイト向け)
XMLの基本構造に従ってファイルを作ります。最小限の例:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/</loc>
<lastmod>2025-01-01</lastmod>
</url>
</urlset>
各URLは絶対パスで記述し、文字コードはUTF-8にします。
大規模サイトでの作成ツール
ページ数が多い場合はツールを使うと便利です。無料で使える例として「XML-Sitemaps.com」や、デスクトップの「Screaming Frog(無料版は上限あり)」があります。これらはクローリングして大量のURLを一括生成します。
保存場所と圧縮
作成したファイルはルート直下に置き、名前は通常sitemap.xmlにします。大きい場合は.gzで圧縮しても構いません。
動作確認
ブラウザでファイルを開いてXMLが正しく表示されるか、文字化けやURL誤りがないかを確認します。
サイトマップの登録手順
前準備
- サイト所有権の確認:Google Search Console(GSC)にサイトを登録し、所有権を確認します。ドメインプロパティとURLプレフィックスの違いに注意してください。
- サイトマップの配置:作成したファイルはサーバーのルート(例:https://example.com/sitemap.xml)に「sitemap.xml」という名前で置きます。サブディレクトリに置く場合はそのフルパスを使います。
Google Search Consoleでの登録手順
- GSCにログインし、該当プロパティを選択します。2. 左メニューの「サイトマップ」を開きます。3. 「新しいサイトマップの追加」欄に sitemap.xml などのファイル名またはパスを入力します(例:sitemap.xml または feed/sitemap.xml)。4. 「送信」をクリックします。5. 成功表示が出れば登録完了です。
登録後のチェックと運用
- ステータス確認:送信後にステータス(成功、エラー、警告)を確認します。エラーが出たら詳細をクリックして原因を確認します。一般的な問題は404、アクセス拒否、robots.txtでブロック、形式エラーなどです。
- 更新時の再送信:記事を大量に追加したときは再送信してください。頻繁に更新する場合は自動生成とrobots.txtでの参照を検討します。
- サイズ制限:1ファイルあたり5万URL、圧縮前50MBが上限です。超える場合は複数のサイトマップに分け、サイトマップインデックスを使います。
補足
- robots.txtに “Sitemap: https://example.com/sitemap.xml” を追記するとクローラーの発見が早まります。
サイトマップの注意点
サイトマップ作成でよくある注意点を、実例を交えてわかりやすくまとめます。
ファイルサイズとURL数
1つのサイトマップは最大50,000件のURL、ファイルサイズは50MB(非圧縮)までです。例:URLが120,000件ある場合は、50,000件ずつに分けて複数ファイルを作り、サイトマップインデックスでまとめます。
分割と圧縮
サイトマップは.xml.gzで圧縮できます。分割したら必ずサイトマップインデックス(index)を用意して検索エンジンに登録します。
含める/除外するURL
正規化した(canonical)URLだけを載せます。ログインページや管理画面、utmなどの追跡パラメータ付きURLは除外してください。noindexタグが付いたページも載せない方が良いです。
更新情報(lastmod)と頻度
lastmodは実際の更新日を入力してください。更新頻度が高いサイトや新規サイトでは、サイトマップをこまめに更新するとクロールの助けになります。
技術的な注意点
・URLは絶対パス(https://〜)で統一します。プロトコルやwwwの有無は揃えてください。
・サイトマップに載せたURLは正常な200応答を返すことを確認します。
・robots.txtでサイトマップの場所を指定すると管理しやすくなります。
登録後のチェック
登録後はサーチコンソールなどでカバレッジを確認し、エラー(4xx/5xx)や意図しない除外がないか定期的に見直してください。大きな構成変更の際は再送信を検討します。
サイトマップのSEO効果
概要
サイトマップは検索エンジンにサイト構造を伝える道しるべです。クローラの巡回(クローラビリティ)を高め、新規ページや更新ページを素早く発見してもらいやすくします。
主な効果と具体例
- クロールされにくいページがインデックスされる可能性が上がります(例:深い階層や内部リンクが少ないページ)。
- 新しい記事や更新情報が早く反映されやすくなります。頻繁に更新するサイトで特に有効です。
- 画像や動画用のサイトマップを用意すると、メディアの検索結果での表示機会が増えます。
実務的なポイント
- サイトマップはインデックスを保証しませんが、発見の機会を増やします。簡潔なURLを入れ、noindexのページは含めないでください。
- 大規模サイトは分割(複数のサイトマップ)やgzip圧縮で負荷を下げます。
- Search Consoleへ送信し、サイトマップレポートを定期確認します。
チェックすべき指標
- インデックス数、クロール頻度、エラー数を監視します。エラーがあればURLを修正して再送信してください。
ブログ記事用まとめ:サイトマップ URLの選び方と作成・登録方法
短い導入
サイトマップは検索エンジンに知らせたいページの地図です。ここではURLの選び方、作成・登録の流れを分かりやすくまとめます。
ポイント
- インデックスさせたいページだけを含める(公開済みでnoindexでないページ)
- リダイレクト元やログインページ、重複ページは除外
- ファイルサイズとURL数に制限があるため大規模サイトは分割
サイトマップに含めるURLの選び方(例)
- 含める例:/blog/post-1、/about、/category/tech
- 除外する例:/private、/search?q=、/old-page(301リダイレクト)
作成方法(簡単な例)
- CMS(WordPressのプラグイン等)で自動生成
- 手動でXMLを作成:で各URLを列挙
- 多数のURLは複数ファイルに分け、sitemap_index.xmlでまとめる
登録方法(Google Search Console)
- Search Consoleでサイトを選択
- 「サイトマップ」メニューでサイトマップURL(例:sitemap.xml)を入力して送信
- robots.txtに“Sitemap: https://example.com/sitemap.xml”を追記すると確実です
大規模サイトの注意点
- 1ファイル当たり最大50,000 URL、50MBまで。超える場合は分割してインデックスファイルを使う
チェックリスト
- 含めるURLはindex可能か
- XMLに誤りがないか(ツールで検証)
- Search Consoleで送信済みか
- robots.txtで参照されているか
この内容を基にサイトマップを作れば、検索エンジンへ効率よく通知できます。必要なら具体的なXML例やプラグイン名もお知らせします。












