Как заставить redownload с wget?

У меня был плохой сюрприз: wget не перезагружается, когда файл с тем же именем уже существует.

Есть ли возможность заставить его перезагружать, не удаляя файл сначала на linux?

wget -O - $url >/path/to-file 

Или, если вы зеркалируете, вы можете использовать флаг -c . Это сделает так, чтобы файлы были «продолжены», но поскольку они уже имеют размер, который сервер сообщает wget, он будет «продолжать» их с самого начала.

Это зависит от того, какие параметры вы wget в командной строке wget . Я обнаружил, что поведение по умолчанию в моих системах заключается в повторной загрузке, но добавьте число к имени файла, чтобы сделать его другим.

Вот описание опции --no-clobber от man wget (для wget 1.11.4) – обратите внимание на взаимодействие с другими параметрами, в частности -r и -p . (Акцент мой.)

-nc
–no-колошматить
Если файл загружается более одного раза в одном каталоге, поведение Wget зависит от нескольких параметров, включая -nc. В некоторых случаях локальный файл будет сбиваться или перезаписываться при повторной загрузке. В других случаях он будет сохранен.

При запуске Wget без -N, -nc, -r или p загрузка одного и того же файла в том же каталоге приведет к сохранению оригинальной копии сохраняемого файла, а вторая копия будет иметь имя file.1. Если этот файл снова загружен, третья копия будет называться file.2 и так далее. Когда указано значение -nc, это поведение подавляется, и Wget откажется от загрузки новых копий файла. Следовательно, «no-clobber» «на самом деле является неправильным в этом режиме – это не сбивание, которое предотвращено (поскольку числовые суффиксы уже препятствуют сглаживанию), а скорее предотвращает сохранение нескольких версий.

При запуске Wget с -r или -p, но без -N или -nc, повторная загрузка файла приведет к тому, что новая копия просто перезапишет старую. Добавление -nc предотвратит это поведение, вместо этого приведет к сохранению исходной версии и игнорированию любых новых копий на сервере.

При запуске Wget с -N с или без -r или -p решение о загрузке новой копии файла зависит от локальной и удаленной отметки времени и размера файла. -nc может не указываться одновременно с -N.

Обратите внимание: если указано значение -nc, файлы с суффиксами .html или .htm будут загружены с локального диска и проанализированы так, как если бы они были извлечены из Интернета.

Это контролируется -nc или --no-clobber .

Это сложно и зависит от других параметров, но у вас есть выбор для создания или переименования файлов с измененными файлами file.1, file.2

На странице руководства, похоже, говорится, что если вы не используете опцию «no-clobber» , файлы с перезагрузкой будут перенумерованы. Вы видите файлы с числовыми суффиксами?

В любом случае см. man page

  • Wget - только получение файла .listing в каждом поддиректоре
  • Как скачать каталог или файлы с командной строкой на сервере Linux
  • Загрузка нескольких файлов с параметрами wget и обработки
  • Wget - сложность без учета доменов и каталогов
  • Исключить список определенных файлов в wget
  • Wget - сохранить все данные (изображения) из заданного каталога?
  • Как загрузить весь (активный) форум phpbb?
  • Скопировать весь сайт, включая PHP и SQL?
  • Как я могу заставить wget переименовать загруженные файлы, чтобы не включать строку запроса?
  • Как загрузить файл за аутентификацией через Wget или cURL
  • wget / curl большой файл с Google Диска
  • Давайте будем гением компьютера.