Воскресенье, 25 Август 2013

wget: скачать сайт целиком

  •   
  • размер шрифта уменьшить размер шрифта увеличить размер шрифта
Оцените материал
(3 голосов)

wget: скачать сайт целикомПри возникновении необходимости скачать сайт целиком (включая изображения и стили) для просмотра в режиме оффлайн можно воспользоваться командой wget.

 Ниже приведен пример такой команды:

wget \
--recursive \
--no-clobber \
--page-requisites \
--adjust-extension \
--convert-links \
--restrict-file-names=windows \
--domains howtoit.ru \
--no-parent \
howtoit.ru

 Для понимания того, что эта команд делает, разберем ключи:

  • --recursive: переходить по ссылкам, т.е., фактически, скачать весь сайт целиком.
  • --no-clobber: запрещает перезапись существующих файлов (удобно при возобновлении преравнной закачки).
  • --page-requisites: загрузить все элементы, которые включены в web-страницу (изображения, CSS-стили, и т.д.).
  • --adjust-extension: сохраняет все файлы, имеющие тип 'application/xhtml+xml' или 'text/html' с расширением .html(полезно в том случае, если сайт содержит динамическое содержимое и страницы имеют расширение например, .php или .asp). Ключ используется начиная с версии wget 1.12, ранее назывался html-extension.
  • --restrict-file-names=windows: переименовывает файлы убирая нечитаемые в ОС Windows символы.
  • --domains howtoit.ru: запрещает переход по ссылкам (и, соответственно, сохранение этих страниц) за пределами указанного домена.
  • --no-parent: запрещает переход на уровень выше. Например, если в качестве сайта вы укажете howtoit.ru/linux, то будут скачаны только страницы, с адресами вида howtoit.ru/linux/***
  • в конце указывается непосредственно адрес сайта (или раздела сайта), который надо скачать

 

 

Другие материалы в этой категории: Смена пароля пользователя в Linux »

Добавить комментарий


Защитный код
Обновить

 

 

Scroll to top