はじめに
このガイドの目的
この文書は、Webサイトやホームページの内容を自分のパソコンなどローカル環境に保存し、オフラインでも閲覧・管理・バックアップできる方法をやさしく解説します。ブラウザ標準の保存機能から、拡張機能や専用ツール、スクリプト、FTPを使ったバックアップまで幅広く扱います。
誰に向いているか
個人で記事やレシピを保存したい方、企業や団体でサイトのバックアップを検討している方、研究や資料整理のためにウェブページを保存する必要がある方に適しています。初心者でも試せる手順を中心に、用途に応じた応用も紹介します。
本書の進め方
各章で具体的な手順、メリット・デメリット、よくあるトラブルとその対処法を示します。まずは簡単な方法から試し、目的や規模に合わせてより高度な方法に進んでください。
簡単な注意点
著作権や利用規約に配慮し、保存したデータは個人利用や正当な目的に限定してください。動的に生成されるページやログインが必要なページは保存方法が変わりますので、その点も章ごとに説明します。
ホームページのローカル保存とは?
概要
ホームページのローカル保存とは、インターネット上のページを自分のパソコンや外付けドライブに一式で保存し、ネットに接続しなくても閲覧や編集ができるようにすることです。HTML、画像、CSS、JavaScriptなどが含まれます。簡単に言えば「ウェブのコピー」を手元に置く作業です。
保存される主な要素(具体例)
- HTMLファイル:ページ構成そのもの
- 画像・動画:写真やロゴなどのメディア
- CSS:見た目を整えるスタイルシート
- JavaScript:動きをつけるスクリプト(ただし一部は動かない場合があります)
- フォントやアイコン:表示に必要な外部リソース
主な用途
- 情報のバックアップ(重要な記事やドキュメントを保管)
- オフラインでの閲覧(出先や電波の悪い場所で役立ちます)
- サイト引越しやローカルでの修正作業(公開前のチェック用)
- プレゼン資料や教材の準備
メリットと注意点
- メリット:いつでも見られる、ページが消えても残る、編集や検証がしやすい
- 注意点:動的な機能やサーバー依存の部分は正しく保存できないことがある、外部APIは動作しない場合がある、著作権や利用規約に従う必要がある
すぐできる簡単チェックリスト
- 保存したいページのURLを決める
- ブラウザで「ページを保存」やスクリーンショットを試す
- 重要なメディアが欠けていないか確認する
- 著作権や利用規約を確認して問題がないか確かめる
この章では概念と注意点を中心に説明しました。次章で実際の保存手順を具体的にご案内します。
ブラウザ標準機能でページを保存する手順
主要ブラウザはページ保存機能を標準で備えています。ここでは、代表的なブラウザごとの手順と保存形式、保存後の確認方法、注意点をわかりやすく説明します。
Google Chrome(Windows / Mac)
- 保存したいページを表示します。
- キーボードで「Ctrl+S」(Macは「Command+S」)を押します。
- 「名前を付けて保存」ダイアログで保存場所とファイル名を指定します。
- 保存形式は主に「Webページ、完全(画像などを含む)」と「HTMLのみ」があります。環境によっては「単一ファイル(.mhtml)」を選べる場合もあります。
メリット:操作が早く単ページの保存に最適です。画像フォルダも一緒に保存されるのでオフライン表示できます。
Microsoft Edge
- 画面右上のメニュー(…)を開きます。
- 「名前を付けて保存」を選びます。または「Ctrl+S」を使用します。
- 保存形式を選んで保存します。手順はChromeに似ています。
Firefox
- メニューから「ページを保存」または「名前を付けて保存」を選びます。
- 「Webページ、完全」か「HTMLのみ」を選択して保存します。
Safari(Mac)
- ファイルメニューの「別名で保存」または「webアーカイブで保存」を選びます。
- 「Webアーカイブ」は画像やリソースを一つにまとめるので、開き直したときに見た目が保たれやすいです。
開いたときの確認と注意点
- 保存したHTMLファイルをブラウザで開けばオフラインで閲覧できます。画像は同じフォルダ内の付属フォルダに入ります。
- ログインが必要なページや動画、動的に読み込むコンテンツは正しく保存されないことがあります。
- 単ページの保存には手早く便利ですが、サイト全体のバックアップには別の方法が適します。
拡張機能・専用ツールで丸ごと保存
Web全体や大量ページを確実に保存したいときは、専用ツールや拡張機能が便利です。ここでは代表的なものと使い方、注意点をやさしく説明します。
HTTrack
HTTrackはサイト全体をまるごとダウンロードする専用ソフトです。URLを指定するとリンク先も自動で取得し、フォルダ構成をそのまま保存します。初心者でもウィザードに従えば操作できます。大きなサイトでは保存サイズが大きくなる点に注意してください。
Wget(コマンドライン)
Wgetはコマンドラインで動く強力なツールです。例:wget -r -k -p URLで再帰的に取得し、リンクをローカル向けに変換します。LinuxやmacOSでよく使われますが、Windowsでも利用可能です。コマンド操作に不慣れな方は注意してください。
Chrome拡張機能(SingleFile・DownThemAllなど)
SingleFileは開いているページを1ファイルにまとめて保存します。画像やスタイルも含めやすく、手早く保存できます。DownThemAllやWebsite Downloaderは一括で複数ファイルや画像をダウンロードするのに向きます。操作はボタンを押すだけのものが多く、手軽です。
使い分けと注意点
少数のページならブラウザ拡張、サイト全体や定期バックアップはHTTrackやWgetが適します。サーバー負荷や著作権に配慮し、 robots.txtや利用規約を確認してから実行してください。
複数ページ・大量ページの一括保存テクニック
複数ページや大量ページを保存するには、手作業よりスクリプトが便利です。ここではURLリストやサイトマップを元に自動でHTMLを保存する基本手順と注意点を分かりやすく説明します。
準備
- Pythonとrequestsライブラリを用意します(pip install requests)。
- 保存するURLを1行ずつ書いたurls.txtを作ります。
基本スクリプト(例)
import requests, time, os
os.makedirs('saved', exist_ok=True)
with open('urls.txt') as f:
for i, url in enumerate(f,1):
try:
r = requests.get(url.strip(), timeout=10, headers={'User-Agent':'mybot'})
fn = f"saved/page_{i}.html"
with open(fn,'w',encoding='utf-8') as w:
w.write(r.text)
time.sleep(1) # サーバー負荷を避ける
except Exception as e:
print('Error', url, e)
サイトマップからの抽出
サイトマップXMLにはタグでURLが並びます。xml.etree.ElementTreeで簡単に抽出できます。
並列化で高速化
多数になる場合はThreadPoolExecutorで並列化します。ただし同時接続数を抑え、短い遅延を入れてください。
運用時の注意点
- robots.txtの確認と対象サイトの利用規約を守ってください。
- 過度なリクエストで相手に負荷をかけないように間隔と並列数を調整します。
- 動的に生成されるページ(JavaScriptで描画)にはヘッドレスブラウザが必要です。
- 失敗時の再試行やログ保存を実装すると運用が安定します。
FTPやサーバーからのバックアップ
準備するもの
・FTP/SFTPの接続情報(ホスト、ユーザー名、パスワード、ポート)を用意します。契約時のメールやレンタルサーバーの管理画面で確認できます。FileZillaやCyberduckなど無料のクライアントを例に説明します。
FTPソフトでの手動バックアップ(手順)
- FTPソフトを起動し、接続情報を入力してサーバーに接続します。
- 公開フォルダ(例:public_html、www、htdocs)を開きます。
- HTML、画像、CSS、JS、アップロードフォルダ(例:wp-content/uploads)など必要なフォルダを選び、PC側にダウンロードします。
- 転送が終わったらファイル数や容量を確認し、保存先フォルダを整理します。
WordPress特有の注意点
WordPressはファイルだけでなくデータベースに投稿や設定を保存します。phpMyAdminやサーバーの管理画面からデータベースをエクスポートしてください。プラグイン(例:UpdraftPlus、BackWPup)を使えば、ファイルとデータベースを一緒にバックアップできます。
自動化と検証
定期的にバックアップを自動化すると安心です。FTPでの取得だけでなく、ダウンロードしたデータをローカルで開いて表示が崩れていないかを確認してください。復元手順も一度試しておくと、本番で困りません。
保存・バックアップ時の注意点とポイント
著作権と利用規約
他人のサイトを保存・再配布すると著作権や利用規約に抵触することがあります。たとえば有料記事や画像は個人利用にとどめ、公開・販売は控えてください。会社や団体のサイトを保存する場合は運営者に確認するのが安全です。
会員制・動的ページの扱い
ログインが必要な会員制ページや、フォームや検索で生成される動的ページは完全に復元できないことがあります。データベースやセッション情報は取得できない点に注意してください。
ファイル構成とリンク切れの確認
保存後はフォルダ構成と相対パスを確認し、画像やCSSのリンク切れをチェックします。ブラウザでオフライン表示を試し、表示崩れがないか確かめてください。
大量ダウンロード時の配慮
短時間に大量にアクセスすると相手サーバーに負荷をかけます。ダウンロード間隔を空け、robots.txtやAPI利用制限を守ってください。公開サイトを巡回する場合は負荷を考えて夜間に分散して実行するのがおすすめです。
保存先とセキュリティ
バックアップは複数の場所に保管し、重要なデータは暗号化やパスワード保護を行います。ローカルだけでなくクラウドや外付けHDDにも保存して冗長化しましょう。
まとめ
要点の振り返り
ホームページのローカル保存は、個人のアーカイブから業務でのバックアップまで幅広く役立ちます。ブラウザの保存、拡張機能や専用ツール、スクリプトとFTPによる方法があり、目的や規模で最適な手段が変わります。
目的別のおすすめ
- 個人利用・単ページ:ブラウザの「ページを保存」やPDF出力で十分です。
- 複数ページや階層化サイト:HTTrackなどの専用ツールが便利です。
- 定期的なバックアップ:FTP/SFTPやホスティングの自動バックアップを使い、自動化スクリプトで運用します。
保存時の重要ポイント
- 著作権や利用規約を確認してください。
- 画像やCSS、JavaScriptなど外部リソースが欠けないか必ず確認します。
- ログインが必要なページは別途手順やツールが必要です。
- 保存先の整理(フォルダ名や日付)と複数世代のバックアップを心がけてください。
最後に
まずは小さなページで試し、問題点を確認してから本格運用に移すと安心です。目的に合った方法を選び、定期的にバックアップ状態をチェックしてください。












