Загрузка полных веб-страниц (не сайтов)

Я часто использую автономное время (например, когда на машине / поезде / самолете), чтобы читать статьи, вытащенные из Интернета. Чтобы сохранить содержимое, в настоящее время я использую Firefox Save As . (Обратите внимание: это не рекурсивно загружает целые сайты, а просто отдельные страницы, а также их стили, изображения и т. Д.)

Я изучил автоматизацию этого, но ни wget, ни HTTrack не дают мне то, что мне нужно (это слишком много или слишком мало – или даже оба).

Любые рекомендации были бы очень желанными!

Вы пробовали wget --page-requisites ?

  This option causes Wget to download all the files that are neces‐ sary to properly display a given HTML page. This includes such things as inlined images, sounds, and referenced stylesheets. 

Вы должны использовать расширение firefox: ScrapBook https://addons.mozilla.org/en-US/firefox/addon/427

ScrapBook – это расширение Firefox, которое помогает вам сохранять веб-страницы и легко управлять коллекциями. Ключевые особенности: легкость, скорость, точность и многоязычность. Основные возможности:

  • Сохранить веб-страницу
  • Сохранить фрагмент веб-страницы
  • Сохранить веб-сайт
  • Организуйте сборку так же, как и закладки
  • Полнотекстовый поиск и быстрая фильтрация поиска коллекции
  • Редактирование собранной веб-страницы
  • Функция редактирования текста / HTML, напоминающая заметки Opera

Нет скриптового решения, но я использую Scrapbook для архивирования сайта для последующего чтения. Это замечательное расширение!

Если у вас есть iPhone, вы можете воспользоваться услугой Instapaper . Он позволяет вам закладок страниц для чтения позже (использует небольшой букмарклет в вашем браузере). После закладки закладки страницы могут быть синхронизированы с вашим iPhone по воздуху (Wifi или Cellular) с серверов Instapaper. Как только приложение завершит синхронизацию, все данные хранятся локально на iPhone.

В качестве дополнительного бонуса серверы Instapaper обрабатывают страницу и могут обслуживать текстовую версию страницы (также можно сделать графическую версию), которая может быть проще для чтения.

Я пользуюсь услугой и считаю ее отличной для заполнения моего часа в пути на поезде.

Сохранить как расширения PDF доступны для Firefox, которые могут помочь сделать это тоже и сохранить некоторые работы.

Internet Explorer может сохранять страницы как MHTML. Скорее всего, вы можете автоматизировать это с помощью VBS и COM.

  • Как определить ОС по сценарию Bash?
  • Есть ли инструмент командной строки распознавания лиц?
  • Как я могу использовать синтаксис Bash в целевых файлах Makefile?
  • Обработка ошибок в Bash
  • Как записать cd в каталог с пробелом в имени?
  • Не удалось перенаправить журнал в / var / log / syslog
  • Переменные среды в bash_profile или bashrc?
  • Передача аргументов в osascript через функцию оболочки в OS X Mountain Lion
  • Предварительно санкционируйте sudo? (Так что это можно запустить позже)
  • Постоянно сохранять файл журнала в OSX?
  • Почему wget'ing изображение дает мне файл, а не изображение?
  • Давайте будем гением компьютера.