WindowsおよびLinuxでWgetを使用してサイトのオフラインミラーコピーを作成する
Webサイトの閲覧可能なコピーを入手して、オフラインでアクセスしたり、USBスティックを装着したり、スマートフォンにアップロードして飛行中や旅行中に読んだりできるようにする必要がある場合があります。最近のブラウザやオペレーティングシステムでは、WebページをPDFに保存するのは簡単ですが、すべてのページを処理するのは面倒な場合があります。これがwgetです。
広告
Wgetはオープンソースのダウンロードマネージャーです。これは主にLinux用に開発されたコンソールアプリですが、WindowsやMacOSなどの他のOSに正常に移植されています。
pinterest で他のトピックをフォローする方法
wgetに慣れていない場合は、ぜひ試してみてください。とてもパワフルです。これにより、最近使用しているインターネットプロトコルであるHTTP、HTTPS、およびFTPを使用してWebサイトからファイルをフェッチできます。その動作は、コマンドライン引数によって制御されます。
Wgetは、再試行、終了した場所からの続行など、低速または不安定な接続でファイルを取得するためのさまざまなオプションをサポートしています。 'robots.txt'ファイルをサポートしているため、Webクローラーのように機能します。変更されたファイルのみを取得でき、ワイルドカード、ファイルタイプの制限、および通常の拡張子をサポートします。
Wgetは、HTML WebサイトとFTPサーバーの再帰的取得をサポートしているため、Webサイトをミラーリングできます。これがその方法です。
先に進む前に、wgetアプリを入手する必要があります。
WindowsでWgetを入手する
私は通常、これらのソースからのバイナリを使用します。
どちらも仕事をしています。
LinuxでWgetを入手する
ディストリビューションのパッケージマネージャーを使用します。いくつかの例(実行 ルートとしてそれら ):
Debian / Ubuntu / Mint:
apt install wget
CentOS / Redhat
yum install wget
Arch Linux
pacman -Sy wget
Void Linux
xbps-install -S wget
Wgetを使用してサイトのオフラインコピーを作成するには、
- 開いた コマンド・プロンプト / ターミナル 。
- Windowsでは、wget.exeファイルへのフルパスを入力します。
- Linuxでは、wgetと入力します。
- ここで、次の引数を入力して、次のコマンドを取得します。
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://site-to-download.com
- を交換してください
https://site-to-download.com
ミラーリングしたい実際のサイトURLの部分。
完了です!
使用するスイッチは次のとおりです。
- 鏡
-ダウンロードを再帰的にするためにいくつかのオプションを適用します。-親なし
–サイトの一部のみを取得するために、親ディレクトリをクロールしないでください。--convert-links
-すべてのリンクがオフラインコピーで正しく機能するようにします。-ページ-必要条件
-ローカルミラーを参照するときに元のページスタイルを保持するために、JSファイルとCSSファイルをダウンロードします。--adjust-extension
-適切な拡張子(html、css、jsなど)がない場合は、ファイルに追加します。
それでおしまい。