Как извлечь изображения из Word Document из Linux

Есть ли (Linux) инструмент командной строки для извлечения всех изображений из документа MS Word (желательно тот, который может обрабатывать формат .docx)?

Поскольку файлы docx представляют собой zip-файлы, вы можете разархивировать файл docx, а затем выбрать файлы изображений.

У меня нет Microsoft Office для тестирования, поэтому я загрузил некоторые случайные файлы docx из Интернета. Кажется, что изображения всегда хранятся в каталоге word/media в архиве.

Эта команда будет извлекать все файлы из media каталога из архива:

 unzip foo.docx "word/media/*" 

Эта команда будет извлекать только файлы *.jpeg :

 unzip foo.docx "*.jpeg" 

Обратите внимание, что вы должны указать "*.jpg" если файлы сохраняются как jpg вместо jpeg . Я предполагаю, что также возможно, что изображения хранятся в другом формате. Я не знаю, можно ли сохранять изображения в другом месте, кроме каталога word/media . Вы можете использовать unzip -l для отображения содержимого архива.

Сохранение документа Word как веб-страницы – это метод, используемый в Windows для извлечения всех изображений в папку: http://support.microsoft.com/kb/555171

Возможно, вы долгое время зависали, но, возможно, вы могли бы контролировать Open Office в Linux из командной строки для извлечения изображений, возможно, путем преобразования на веб-страницу и заканчивая изображениями в поддерживающей папке, которые она создала.

  • Автоматически изменять размер изображения / изображения в Word?
  • Как автоматизировать «вставить как JPEG» для вставки фото в Word, чтобы уменьшить весь размер документа?
  • Как получить горизонтальные линии слева и справа от заголовка в Microsoft Word?
  • Установка Microsoft Word на другой язык
  • Преобразование уравнений MathType в собственные уравнения Word 2007/2010
  • Как скопировать таблицы Word в Excel без разделения ячеек на несколько строк?
  • Microsoft Word не может сохранить
  • Изменить язык проверки орфографии для документа в Microsoft Word 2010
  • Могу ли я создать собственный код поля в Word 2010 или использовать макрос?
  • Как создать пользовательское «свойство документа»?
  • Преобразование уравнений Word 2007 в уравнение Microsoft
  • Interesting Posts

    Могу ли я установить свежие разделы Linux по разделам (LUKS & LVM) и сохранить / использовать существующего домашнего пользователя?

    Как эффективно выполнять «отличные» с несколькими ключами?

    На картах STL лучше использовать map :: insert, чем ?

    Как удалить пробел при слиянии

    Отключение анимации прогресса проекта .NET при изменении значения?

    Android: ClickableSpan в интерактивном TextView

    Как превратить String в InputStreamReader в java?

    Android 3.1 USB-хост – BroadcastReceiver не получает USB_DEVICE_ATTACHED

    iText – добавление содержимого в существующий файл PDF

    Как диагностировать спонтанную перезагрузку?

    Что такое сочетание клавиш для минимизации обычного окна?

    Сохранение папки локальных окон в синхронизации с удаленной ftp-папкой в ​​режиме реального времени

    Получение IP-адреса сервера в ASP.NET?

    maven-dependency-plugin (цели «копии-зависимости», «распаковка») не поддерживается m2e

    Как перемешать символы в строке

    Давайте будем гением компьютера.