Как удалить водяной знак из файла PDF?

Я думал, что это будет простая задача, но все получилось иначе.

Водяной знак – это то же самое (перекрывающееся, но прозрачное) изображение на каждой странице. Я сам создал файл PDF (поэтому здесь не стоит беспокоиться об авторских правах) с использованием PDFCreator 0.9.8.

Я уже пробовал Adobe Acrobat Pro моего друга, но это не сработало. Он пытается удалить его, но он не может. Я попытался удалить верхний и нижний колонтитулы и т. Д., Но водяной знак просто не исчезнет.

Как удалить водяной знак?

  • Сжать файл в формате pdf?
  • Эквивалент ластика Microsoft Paint в Adobe Acrobat Pro
  • Изменить подсветку Okular, чтобы автоматически копировать выделенный текст в комментарий
  • Извлечение текста из сканированной книги .PDF
  • Пакетное преобразование изображений TIFF в PDF?
  • Как сохранить ротационный файл Adobe PDF
  • 7 Solutions collect form web for “Как удалить водяной знак из файла PDF?”

    Для водяных знаков на основе изображений есть несколько инструментов, которые обещают их автоматическое удаление. Например:

    • Мы удаляем водяной знак PDF
    • Удаление водяных знаков PDF
    • SoftOrbits PDF Logo Remover

    Все это можно попробовать, но для получения желаемого результата требуется лицензия.

    Тем не менее, водяной знак этого конкретного файла PDF (который отправил мне письмо по электронной почте) – это не одно изображение, которое повторяется на всех страницах. Как оказалось, PDFCreator жестко закодировал его (почти пиксельно по пикселям) в каждом из них. Это делает водяной знак намного сложнее удалить (и приводит к довольно раздутому PDF-файлу).

    Поскольку водяной знак на самом деле состоит из множества мелких изображений, вы можете удалить их с помощью редактора PDF (например, Foxit Advanced PDF Editor ), просто выбрав их и нажав « Удалить» . К сожалению, вы должны повторить это для каждой страницы.

    Менее трудоемким решением было бы сделать программный снимок водяного знака. Нам нужно:

    • Pdftk : инструмент для (un) сжатия и исправления потоков PDF.
    • Notepad ++ : текстовый редактор, способный заменять регулярные выражения Perl Compatible Regular .

    меры

    1. Загрузите Pdftk и извлеките pdftk.exe и libiconv2.dll в % windir% \ System32 , каталог на пути или в любом другом месте по вашему выбору.

    2. Загрузите и установите Notepad ++.

    3. Потоки PDF обычно сжимаются с использованием алгоритма DEFLATE . Это экономит место, но делает источник PDF неразборчивым.

      Команда

      pdftk original.pdf output uncompressed.pdf uncompress 

      Распаковывает все потоки, поэтому их можно изменить с помощью текстового редактора.

    4. Откройте uncompressed.pdf с помощью Notepad ++, чтобы открыть структуру водяного знака.

      В этом конкретном случае каждая страница начинается с блока

       q 9 0 0 9 2997 4118.67 cm BI /CS/RGB /W 1 /H 1 /BPC 8 ID Ÿ®¼ EI Q 

      И почти 4000 блоков, подобных этому. Этот конкретный блок устанавливает только один ( /W 1 /H 1 ) пикселей водяного знака.

      Прокрутка вниз до изменения шаблона показывает, что поток водяного знака составляет 95 906 байтов (считая новые строки). Точный поток повторяется на каждой странице PDF-файла.

    5. Нажмите Ctrl + H и установите следующее:

       Find: q 9 0 0 9 2997 4118\.67 cm.{95881} Replace: (blank) Match case: checked Wrap around: checked Regular expression: selected . matches newline: checked 

      Регулярное выражение q 9 0 0 9 2997 4118\.67 cm.{95881} соответствует первой строке вышеуказанного блока ( q 9 0 0 9 2997 4118.67 cm ) и все последующие 95 881 символ, т. Е. Поток водяного знака.

      Щелчок « Заменить все» удаляет его со всех страниц PDF-файла.

    6. Теперь водяной знак удален, но файл PDF имеет ошибки (длина потоков неверна), и он несжатый.

      Команда

       pdftk uncompressed.pdf output nowatermark.pdf compress 

      Заботится обо всех.

    7. Uncompressed.pdf больше не требуется. Вы можете удалить его.

    В результате получается тот же PDF-файл без водяного знака (и примерно в два раза меньше).

    Похоже, что водяной знак фактически является частью изображений внутри .PDF, а не отдельным изображением, обработанным над ним, тем, что вы используете для отображения .PDF. Возможно, вы не сможете удалить водяной знак, не извлекая изображения из .PDF, запуская их через редактор изображений, а затем вручную восстанавливая .PDF.

    Для текстовых водяных знаков редактирование версии PostScript может быть намного проще: после

    $ Pdftops document.pdf

    Отредактируйте document.ps, затем конвертируйте обратно в PDF через

    $ Ps2pdf document.ps

    Артефакты штампа – это то, что вы можете удалить его в Adobe Acrobat Pro, однако он восстанавливается при перемещении мыши, потому что объект потока сохраняет его постоянным.

    Если вы попытаетесь отредактировать источник pdf – что сложно, есть вероятность, что файл будет поврежден.

    Если штамп является потоком, мы можем прервать его, отключив компьютер от сети, что я и сделал.

    Затем, используя Adobe Acrobat Pro, я выбрал одну из моих аннотаций, щелкнул правой кнопкой мыши, чтобы получить всплывающее окно, и выбрал «Показать список комментариев».

    Выберите гнусный водяной знак / штамп из списка, щелкните правой кнопкой мыши, чтобы открыть всплывающее окно, и выберите «Удалить». Сделайте это на каждой странице, где происходит аффиксация.

    Сохраните файл под другим именем. Мое приложение разбилось, но не до сохранения файла!

    Откройте новый и намного меньший файл; Обратите внимание, что все водяные знаки / марки являются гонзо.

    В моем случае размер файла моего трехстраничного документа сократился с 300 кб до впечатляющего 60 кб. Все исходные данные и аннотации остались неизменными – без водяных знаков.

    ~ Хорошая охота: o)

    Конвертировать документ в файл .rtf с помощью zamzar. После преобразования знак воды автоматически исчезает. Обратите внимание: – Он отлично работает, если документ содержит текстовый материал. Это всегда было очень полезно .. (пользователь Mac)

    Нашел другой способ сделать это:

    1. Используйте инструмент pdf2htmlEX (или любой другой конвертер PDF в HTML), чтобы преобразовать PDF в HTML-файл.
    2. Редактируйте HTML с помощью текстового редактора и удалите водяной знак. Сохрани это.
    3. Печать в HTML в новый документ PDF
    4. прибыль

    Это дополнение к ответу @Dennis от 18:06 30 июля 2012 года. Он, безусловно, обращается к более сложному делу.

    В простейшем случае, когда водяной знак прост, неприкрашенный текст, например

    Смедли для комиссара

    Несжатые водяные знаки PDF могут быть определены следующим образом:

      BT 75.96 625 Td (Smedley For Commissioner)Tj ET 

    Где 75.96 – горизонтальное смещение, а 625 – вертикальное смещение для данного экземпляра водяного знака. (Да, можно видеть как реальные числа, так и целые числа.)

    Регулярное выражение, подобное приведенному ниже, будет работать для всех таких водяных знаков, игнорируя любые изменения в их размещении:

     ^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n 

    Имейте в виду, что многие модифицирующие операторы PDF могут вступать в игру с водяными знаками, которые имеют более сложное форматирование. Такая фантазия может трансформировать то, что читатель ожидает (надеется?), Чтобы быть непрерывной, легко искаженной строкой в ​​беспорядок алфавитного супа. Например,

    E 1 = mc² от Smedley ™

    Может быть результатом этого:

      BT 75.96 625 Td (E)Tj -5 Ts (1)Tj 0 Ts ( = mc)Tj 5 Ts (2)Tj 0 Ts (by Smedley)Tj 5 Ts (TM)Tj 0 Ts ET 

    , , , Или намного хуже, если ваш водяной знак улучшен по цвету!

    Отметив все это, я также отмечу, что PDFtk имеет версию GUI, предназначенную для обработки водяных знаков с учетом лицензионного сбора в размере 4 долларов США. Не дорогой!

    С другой стороны, я нахожу, что его сайт в настоящее время рекламирует полную поддержку O / S через Windows 8 и OS X 10.8 Mountain Lion . Этот урожай более 4 лет назад. Может ли PDFtk устаревать? Я подозреваю, что нет, но я не знаю.

    Давайте будем гением компьютера.