Scan A4 doc> pdf> ocr> перевести на английский?

Я попытался использовать комбинацию

  • Мой домашний сканер для создания «300 dpi», «document», «pdf» (опции для Canon all-in-one)
  • ZoHoViewer для создания файла RTF или TXT
  • Google docs для перевода

Я не уверен, насколько хороший или плохой продукт ZoHoViewer, но следующее:

Als Arbeitsmarkbehörde haben wir den gesetzlichen Auftrag, die Vermittelbarkeit von

превращается в:

AlsArbeitsmarktbeh6rde habenwirdengesetzlichenAuftrag, dieVermittelbarkeit vonSt …

Следовательно, goog docs заставляет завтрак свиньи пытаться перевести его.

Есть ли у кого-нибудь лучшие предложения (предпочтительно бесплатные онлайн-сервисы)

Было еще несколько вопросов о SuperUser на OCR, которые, возможно, стоит проверить на возможные решения.

В первую очередь этот ответ Молли выглядит многообещающим:

Мне очень нравится TopOCR , безусловно, отличное дополнение к вашим инструментам сканирования:

  • Невероятная точность распознавания, до 99,8% при использовании 3-мегапиксельной камеры
  • Нет ограничений по страницам, без дополнительных загрузок или компонентов.
  • Обрабатывает изображения со смешанным текстом и графикой (ручное или автоматическое зонирование)
  • Устраняет перекос и неровное освещение
  • Несколько форматов вывода текста, включая PDF с возможностью поиска и HTML
  • Возможность читать 11 разных языков
  • Мощная, простая в использовании обработка изображений с использованием Dewarping изображений
  • Поддержка смартфонов: см. Примеры смартфонов
  • Включает в себя встроенные полнофункциональные редакторы текста и изображений WYSIWYG
  • Постобработка проверки орфографии для всех 11 языков
  • Встроенное программное обеспечение Text-To-Speech. Как насчет OCR в MP3?
  • Включает встроенный многоязычный текстовый переводчик
  • Поддерживает интерфейс командной строки и графический интерфейс
  • Создание высокопроизводительной системы поиска и индексирования документов
  • Режим поддержки браузера поддерживает создание бесплатных аудио-книг
  • С TopOCR Web Engine легко добавить новые функции

Alt text

Он очень точен и отлично работает с изображениями низкого качества, такими как фотографии страниц / документов

TopOCR является бесплатной (может быть сделана переносной с Universal Extractor )

Дальнейшее чтение:

У какого программного обеспечения OCR больше всего возможностей?

Практическое решение для распознавания текста для преобразования большой книги в цифровой формат?

Как извлечь текст с помощью OCR из PDF в Linux?

Учитывая, что OCR конвертировало:

Als Arbeitsmarkbehörde …

чтобы:

AlsArbeitsmarktbeh6rde …

Несколько вещей приходят в голову.

  1. Попробуйте выполнить сканирование с более высоким разрешением. Похоже, что он не может распознать пробел между словами, более высокий dpi может улучшить это.

  2. Можете ли вы указать язык своей программы OCR? Я вижу, что он превратил «ö» в «6». Хотя это может быть проблемой, вызванной разрешением, также может быть, что, поскольку «ö» не является повседневной частью английского языка, программа выбирает «следующий лучший» вариант – в данном случае «6».

Не на 100% отлично, но лучше всего из того, что я пробовал:

http://www.paperfile.net/ в сочетании с языковым пакетом (бесплатно для загрузки инструкций в приложении) скопируйте и вставьте весь текст в документ google, затем используйте инструменты> translate in google docs

  • Открытие защищенного паролем pdf-файла с iTextSharp
  • Отключить сжатие изображения в word 2010
  • Как получить настраиваемые свойства документа для экспорта в PDF?
  • Как добавить текст внизу страниц с помощью pdftk?
  • Создание файлов PDF во время выполнения в c #
  • Отображение PDF-файла в приложении WPF
  • Mac Office PowerPoint сохраняет как PDF с гиперссылками
  • Изменение размера страниц в Adobe Acrobat Pro
  • Проверьте, повреждены ли файлы PDF с помощью командной строки в Linux
  • Конвертировать PDF в документ Word?
  • Использование Ghostscript для преобразования многостраничного PDF в один JPG?
  • Давайте будем гением компьютера.