iTextSharp – Преобразование слова doc / docx в pdf

Я понимаю, что iTextSharp можно использовать для преобразования документа в pdf.

Но сначала мы должны создать документ с нуля с помощью iTextSharp.text.Document, а затем добавить элементы в этот документ.

Что делать, если у меня есть существующий файл doc, можно ли преобразовать этот документ в pdf с помощью iTextSharp.

Кроме того, я хочу использовать iTextSharp или любой аналогичный инструмент, который может выполнять следующие действия в файле doc:

  1. манипулирование файлами doc / docx / text (например, замена некоторых заполнителей значениями DB), а также
  2. конвертирует их в .pdf

Любой, кто имеет представление об этом, пожалуйста, поделитесь.

Спасибо!

Компонент Aspose.Words может сделать это надежно (я не являюсь аффилированным лицом или чем-либо еще).

iTextSharp не имеет необходимого набора функций для загрузки и обработки форматов файлов MS Word.

Aspose.Words действительно хорошее решение, но оно не обеспечивает идеальной точности. На момент написания у него были проблемы с не-римскими языками, сложным форматированием, таким как плавающие элементы и ряд других проблем.

Возможно, вам захочется взглянуть на эту веб-службу конвертации PDF, которая может использоваться из любой среды, поддерживающей веб-службы, включая Java и .NET.

Обратите внимание, что я работал над этим проектом, поэтому применяются обычные отказы.

Вы можете использовать существующий метод Microsoft.Office

private Microsoft.Office.Interop.Word.ApplicationClass MSdoc; //Use for the parameter whose type are not known or say Missing object Unknown = Type.Missing; private void word2PDF(object Source, object Target) { //Creating the instance of Word Application if (MSdoc == null)MSdoc = new Microsoft.Office.Interop.Word.ApplicationClass(); try { MSdoc.Visible = false; MSdoc.Documents.Open(ref Source, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown); MSdoc.Application.Visible = false; MSdoc.WindowState = Microsoft.Office.Interop.Word.WdWindowState.wdWindowStateMinimize; object format = Microsoft.Office.Interop.Word.WdSaveFormat.wdFormatPDF; MSdoc.ActiveDocument.SaveAs(ref Target, ref format, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown); } catch (Exception e) { MessageBox.Show(e.Message); } finally { if (MSdoc != null) { MSdoc.Documents.Close(ref Unknown, ref Unknown, ref Unknown); //WordDoc.Application.Quit(ref Unknown, ref Unknown, ref Unknown); } // for closing the application WordDoc.Quit(ref Unknown, ref Unknown, ref Unknown); } } 

Если вам не важно, будет ли форматирование верным тому, что будет отображаться Word, есть впечатляющий docx2tex, который преобразует файлы Word 2007 docx в документы Latex. Когда-то в Латексе, у вас есть много возможностей для программной переформатировки документа и создания PDF-файла из него.

Я больше говорю об утилите в ответе на tex.stackexchange .

Для манипуляции с docx вы должны использовать собственный метод Open XML. Загрузите Open XML SDK 2 из Microsoft.

А затем вы можете конвертировать файлы docx в pdf с помощью этой платной библиотеки: http://www.subsystems.com/dpw.htm . Это действительно здорово.

У меня такая же проблема.
После нескольких дней попыток найти решение кажется, что Docx4J , инструмент на основе Java или PDF-принтеры, такие как PDFCreator , могут быть среди бесплатного решения.
Конечно, только коммерческий инструмент может эффективно выполнять запрошенную задачу.
На стороне Microsoft вы можете использовать службы автоматизации SharePoint SharePoint Server с включенной поддержкой (проверка 7 июня 2016 года) или взаимодействие на вашем локальном компьютере.
Предлагаемое преобразование «часть к части» (DOC или DOC на некоторый промежуточный язык, а затем в PDF) кажется, что пользователи сказали на stackoverflow или других форумах, что невозможно, потому что результат не тот, который ожидался.

  • Где okular хранит метаданные
  • Открыть PDF-файл «на лету» из приложения Java
  • Программное обеспечение для чтения PDF-файлов с инвертированными цветами
  • Как удалить защиту из файла PDF?
  • z-index не работает в Internet Explorer с pdf в iframe
  • Спасение возможно поврежденного PDF в Acrobat
  • Как прокрутить несколько строк (таким образом, быстрее) в Adobe Acrobat Reader?
  • Двухстраничный просмотр в полноэкранном режиме для Adobe Acrobat
  • Ссылки Firefox на локальные или сетевые страницы не работают
  • Как объединить несколько файлов PDF (сгенерированных во время выполнения)?
  • Как преобразовать многостраничный файл PDF в PNG-файлы с одним PNG-файлом на страницу документа PDF?
  • Давайте будем гением компьютера.