Ниже приведен пример такой команды:
wget \
--recursive \
--no-clobber \
--page-requisites \
--adjust-extension \
--convert-links \
--restrict-file-names=windows \
--domains howtoit.ru \
--no-parent \
howtoit.ru
Для понимания того, что эта команд делает, разберем ключи:
- --recursive: переходить по ссылкам, т.е., фактически, скачать весь сайт целиком.
- --no-clobber: запрещает перезапись существующих файлов (удобно при возобновлении преравнной закачки).
- --page-requisites: загрузить все элементы, которые включены в web-страницу (изображения, CSS-стили, и т.д.).
- --adjust-extension: сохраняет все файлы, имеющие тип 'application/xhtml+xml' или 'text/html' с расширением .html(полезно в том случае, если сайт содержит динамическое содержимое и страницы имеют расширение например, .php или .asp). Ключ используется начиная с версии wget 1.12, ранее назывался html-extension.
- --restrict-file-names=windows: переименовывает файлы убирая нечитаемые в ОС Windows символы.
- --domains howtoit.ru: запрещает переход по ссылкам (и, соответственно, сохранение этих страниц) за пределами указанного домена.
- --no-parent: запрещает переход на уровень выше. Например, если в качестве сайта вы укажете howtoit.ru/linux, то будут скачаны только страницы, с адресами вида howtoit.ru/linux/***
- в конце указывается непосредственно адрес сайта (или раздела сайта), который надо скачать