Как извлечь изображения из Word Document из Linux

Есть ли (Linux) инструмент командной строки для извлечения всех изображений из документа MS Word (желательно тот, который может обрабатывать формат .docx)?

2 Solutions collect form web for “Как извлечь изображения из Word Document из Linux”

Поскольку файлы docx представляют собой zip-файлы, вы можете разархивировать файл docx, а затем выбрать файлы изображений.

У меня нет Microsoft Office для тестирования, поэтому я загрузил некоторые случайные файлы docx из Интернета. Кажется, что изображения всегда хранятся в каталоге word/media в архиве.

Эта команда будет извлекать все файлы из media каталога из архива:

 unzip foo.docx "word/media/*" 

Эта команда будет извлекать только файлы *.jpeg :

 unzip foo.docx "*.jpeg" 

Обратите внимание, что вы должны указать "*.jpg" если файлы сохраняются как jpg вместо jpeg . Я предполагаю, что также возможно, что изображения хранятся в другом формате. Я не знаю, можно ли сохранять изображения в другом месте, кроме каталога word/media . Вы можете использовать unzip -l для отображения содержимого архива.

Сохранение документа Word как веб-страницы – это метод, используемый в Windows для извлечения всех изображений в папку: http://support.microsoft.com/kb/555171

Возможно, вы долгое время зависали, но, возможно, вы могли бы контролировать Open Office в Linux из командной строки для извлечения изображений, возможно, путем преобразования на веб-страницу и заканчивая изображениями в поддерживающей папке, которые она создала.

  • Нажатие клавиши «Ввод» в заполняемой форме разрывает макет
  • Как сохранить выделенный текст при изменении фокуса в Microsoft Word / Excel
  • Импорт векторного файла EPS в Microsoft Word без потери качества
  • Как создать отформатированные всплывающие подсказки в Microsoft Word
  • Как вставить текст над таблицей в верхней части документа Word?
  • Удалить все между в Word
  • Как найти переменные документа в MS Word без использования макроса
  • Нумерация основных документов / поддокументов
  • Могу ли я создать собственный код поля в Word 2010 или использовать макрос?
  • Продолжение с предварительным форматированием после вставки в Microsoft Word
  • Восстановление пароля для документа Word 2007
  • Удаление всего между двумя символами в Ms Word
  • Давайте будем гением компьютера.