初心者でもわかるwebサイトのページ数カウント方法詳細ガイド

目次

はじめに

概要

本資料は「webサイト ページ数 カウント」に関する情報を整理したガイドです。自社や他社のホームページのページ数を正確に把握する方法や、無料ツールの使い方、ページ数を知ることの重要性(SEOや運用管理)を分かりやすく解説します。

対象読者

主にWeb担当初心者の方を想定しています。専門的な知識がなくても実践できる手順やツールを中心にまとめました。

この章での目的

本章では本資料の目的と全体の流れを紹介します。各章で何を学べるかを示し、読み進める際のポイントを案内します。

本資料を読むことで得られること(簡単な例)

  • 自社サイトのページ数を把握して運用コストを見積もれる
  • SEO対策でクロール対象ページを整理できる
  • リニューアルや外注時に正確な情報を提示できる

読み方のヒント:まずは第3章の簡単な方法から試してみると、早く実感が得られます。

ホームページのページ数を調べる必要性とは?

ホームページの“ページ数”はなぜ重要か

ページ数を把握すると、サイト全体の規模や構造が一目でわかります。運用や改修の計画を立てるときに基準となり、無駄な作業や見落としを減らせます。

運用管理・作業工数の見積もりに役立つ

ページ数が分かれば、リニューアル時の作業量や必要な人員が見積もりやすくなります。たとえば、コンテンツ更新が100ページあるのと1,000ページあるのでは作業方法が変わります。

コンテンツ整理・削除・統合の判断材料

古いページや重複ページを整理する際、総ページ数と各カテゴリーのページ数を比べると優先順位が付けやすくなります。質の低いページを見つけて統合や削除の判断を下せます。

SEO(検索エンジン対策)への影響

検索エンジンはサイトをクロールします。ページ数を把握すると、クロール予算やインデックス状況の異常を早期に発見できます。不要なページが多ければ、重要なページが評価されにくくなることがあります。

具体的な活用例

  • リニューアルの見積もり: 200ページなら段取りを細かく、2,000ページなら段階的に実施。
  • コンテンツ監査: カテゴリごとのページ数で削減対象を特定。
  • インデックス確認: インデックス数と実ページ数を比べて欠落を検出。

ページ数の把握は運用の効率化と品質向上に直結します。まずは正確に数えることから始めましょう。

ホームページのページ数を簡単に調べる5つの方法

1. サイトマップを確認する

XMLサイトマップ(例: https://example.com/sitemap.xml)は検索エンジン向けに作られた一覧です。URLが並んでいる行数を数えれば、おおよそのページ数が分かります。サイトによっては複数のサイトマップに分かれているので、まとめて確認してください。

2. ブラウザの検索演算子を使う

Googleで「site:ドメイン名」を検索すると、インデックス済みのページ数の概算が表示されます。簡単に確認できますが、インデックスされていないページや除外されたページは含まれません。

3. クローリングツールを使う

Screaming Frogなどのクローラーを使うと、自動でサイトを巡回して正確なページ一覧を取得できます。ツールでクロールし、URLリストをエクスポートすれば実際のページ数が分かります。ログインが必要なページは別途設定が必要です。

4. CMS管理画面から確認する

WordPressやMovable Typeなどの管理画面は、公開済み・下書き・非公開を含めたページ数を直接表示します。管理画面の「投稿」「固定ページ」を開いてフィルタを使うと簡単です。

5. 開発者ツールのリンク抽出機能を使う

ブラウザの開発者ツールでHTMLやNetworkを調べ、ページ内のリンクを抽出します。JavaScriptで動的に生成されるリンクも見つけられます。小規模サイトや動的コンテンツの確認に向きます。

おすすめの無料ページ数カウントツール4選

1. Screaming Frog SEO Spider(無料版)

  • 概要:デスクトップアプリでサイトをクロールし、最大500ページまで解析できます。
  • 使い方:アプリをダウンロードしてURLを入力し「Start」を押すだけでクローリング開始です。
  • 長所:タイトルやメタ情報、ステータスコードなども一覧で見られるため、ページ数確認と同時に簡単なSEOチェックができます。
  • 注意点:無料版は500ページまでです。中〜大規模サイトでは足りないことがあります。

2. XML Sitemaps Generator(xml-sitemaps.com)

  • 概要:オンラインでURLを入力するとサイト全体をクロールしてXMLサイトマップを生成します。
  • 使い方:サイトURLを入力して実行すると、検出ページ数とサイトマップが表示されます。ダウンロードも可能です。
  • 長所:インストール不要で静的サイトにも使えます。生成されたサイトマップからページ数を把握できます。
  • 注意点:クロール深度や頻度に制限がある場合があります。

3. Check My Links(Chrome拡張)

  • 概要:開いているページ内のリンクを高速でチェックし、リンク数や壊れたリンクを色分けで表示します。
  • 使い方:拡張機能を追加して対象ページでアイコンをクリックするだけです。
  • 長所:ページ単位のリンク状況がすぐ分かります。サイトの構造把握の一助になります。
  • 注意点:ページ単位のためサイト全体のページ数確認は別ツールが必要です。

4. Link Grabber(Chrome拡張)

  • 概要:ページ内のすべてのリンクを抽出して一覧表示・コピーできます。
  • 使い方:拡張を追加し、対象ページで実行するとリンクリストを取得できます。CSVへ貼ると簡単に件数が分かります。
  • 長所:簡単にリンクのリスト化ができ、手作業でページ数を集計する際に便利です。
  • 注意点:動的に読み込むリンクや複数ページの横断には追加操作が必要です。

各ツールは用途やサイト規模で使い分けると効率よくページ数を把握できます。

ホームページのページ数を数える基本手順

前提確認

まず対象サイトのサイトマップ(通常は /sitemap.xml)を探します。サイトマップには公開中のURLが一覧化されているので、一番手早く把握できます。

手順1:サイトマップを開く

ブラウザかツールで sitemap.xml を開きます。ファイル内の タグを数えるか、テキストをコピーして行数を数えるだけでおおよそのページ数が分かります。

手順2:サイトマップ以外のページも確認

HTMLサイトマップや、robots.txt、サイト内のナビゲーションを確認します。ブログのアーカイブやカテゴリーページはサイトマップに載らない場合があります。

手順3:重複とパラメータの整理

同じ内容で ?utm_source 等のパラメータが付いたURLは除外します。canonical 指定や noindex 指定があるページもカウントから外すと実際の公開ページ数に近づきます。

手順4:ディレクトリ別に集計

URLのパスでグループ分けし、ディレクトリごとのページ数を出します。手作業ならスプレッドシート、慣れていれば簡単なスクリプトで集計します。

補足:検証と更新

サイトは変化します。定期的にサイトマップを再確認し、新規ページや削除をチェックしてください。

ツールを使ったページ数確認方法

1. ツールの選び方

用途とサイト規模で選びます。小規模なら無料ツールやデスクトップ型の無料版で十分です。大規模や詳細分析が必要なら有料ツールを検討してください。

2. 一般的な手順(どのツールでも共通)

  1. ドメインを入力またはサイトを指定してクロール(巡回)を開始します。\n2. クロールが終わったら「内部ページ」や「URL数」を確認します。\n3. ステータスコード(200/301/404等)やcanonical指定で重複を除外します。\n4. 必要ならフィルターでパラメータやログインページを除き、エクスポートします。

3. 具体例(機能と特徴)

  • 無料ツール: 小規模サイトの確認に最適。回数やページ数に制限があることが多いです。\n- 有料ツール: 大量URLの解析、重複検出、サイトマップ生成など詳細な機能を提供します。\n

4. 注意点

  • robots.txtやサイト内ログインでクロールが制限されると正確な数が出ません。\n- JavaScriptで動的に生成されるページは一部のツールで拾えない場合があります。\n- 表示された「URL数」はパラメータ違いも含むため、正規化(canonical)やフィルタリングが重要です。

5. 活用のコツ

  • まずサイトマップと照合して差分を確認します。\n- 複数ツールで比較すると精度が上がります。\n- 定期的に確認して増減の原因を追いましょう。

Google Search Consoleを使ったページ数の確認手順

はじめに

Google Search Console(GSC)では「カバレッジ」レポートで、Googleが認識しているページの数と状態を確認できます。ここでは実際の操作手順とポイントを丁寧に説明します。

手順(基本)

  1. GSCにログインし、調べたいサイトのプロパティを選びます。
  2. 左メニューの「カバレッジ(カバレッジ レポート)」を開きます。
  3. 上部に表示されるグラフとステータス別のカード(エラー、有効、除外など)で概要を確認します。

インデックス状況の見方

  • エラー:クロールやインデックスで問題があるページ(例:サーバーエラー、404など)。
  • 有効(警告あり):インデックスはされているが注意が必要なページ。
  • 有効(インデックス済み):Googleに登録されているページ数です。SEO上の“有効ページ”はここを基準に考えます。
  • 除外:ノーインデックス、重複、クロール未実施などでインデックスされていないページ。

個別ページの確認

URL検査ツールで個別URLを入力すると、現在のインデックス状態やクロール情報を確認できます。必要なら「インデックス登録をリクエスト」して再クロールを促せます。

サイトマップの活用

左メニューの「サイトマップ」から送信したサイトマップと、送信済みURL数・インデックスされたURL数を比較できます。サイトの全体把握に便利です。

データのエクスポートと数え方

カバレッジの各レポートはCSVでエクスポート可能です。エクスポート後に「有効(インデックス済み)」の行数を数えると、正確なインデックス済みページ数が分かります。

注意点

GSCの数はGoogleが認識するページ数であり、サイト上の全ページ数と一致しないことがあります。noindexタグやcanonical、robots.txt、重複コンテンツが原因で除外されることが多いです。問題があれば該当URLを確認して対応してください。

ホームページのページ数を確認する意味

目的

自社サイトのページ数を把握することは、サイト運営の現状を客観的に知る第一歩です。ページ数が分かると、何を優先的に改善するか判断しやすくなります。

具体的なメリット

  • リニューアルや改修の作業量を見積もれる:ページごとの修正・デザイン適用の目安が立てられます。
  • 不要なページの洗い出しができる:古い情報や重複ページを削除して管理コストを下げられます。
  • SEO観点での評価がしやすい:コンテンツ量の偏りや薄いページを特定して対策できます。
  • ガバナンス向上:担当者や更新頻度の管理が楽になります。

具体例

ページ数が500と50では、見直しにかかる時間や必要な人員が大きく違います。また、放置された数十ページが検索評価を下げる原因になることがあります。

活用シーン

  • サイトリニューアル前の全体設計
  • 定期的なコンテンツ監査
  • SEO戦略の策定やKPI設定

ページ数を確認することで、無理のない計画と効率的な運用が可能になります。

手動でホームページのページ数を調べる方法

概要

最もシンプルな方法は、実際にサイトをたどって目でページを数えることです。トップページからナビゲーションやページ内のリンクを順にたどり、見つけたページをリスト化していきます。サイト内にリンクされていない隠しページは見つかりませんので、その点はご注意ください。

準備するもの

  • ブラウザ(タブが使えるもの)
  • メモ帳やスプレッドシート(URLとタイトルを記録)
  • チェック用のマーク(ブックマークや色付け)

手順(ステップバイステップ)

  1. トップページから始め、サイト内のメインナビゲーションを開きます。
  2. 各リンクを新しいタブで開き、URLとページタイトルをスプレッドシートに記録します。
  3. フッターやサイドバーのリンク、カテゴリーやアーカイブページも順に確認します。
  4. 記録済みのURLは重複しないようにチェックし、同じページはカウントしません。
  5. ページネーション(「次へ」や数字のページ)がある場合は順にたどって数えます。
  6. サイト内検索結果やログイン後にのみ表示されるページは、目的に応じて含めるか除外します。

注意点とコツ

  • URLをキーにすることで重複カウントを防げます。
  • 同じ内容で別URL(パラメータやトラッキング付き)がある場合は、必要に応じてまとめて扱ってください。
  • 大規模サイトでは時間がかかるため、カテゴリーごとに分けて作業すると効率的です。
  • 手動で見落とすことがあるので、後でツールやサイトマップと照合すると確実です。
よかったらシェアしてね!
  • URLをコピーしました!

この記事を書いた人

目次