Изображение SCAN для ТЕКСТА

Я получил отсканированный документ изображения из банка, и я просто хочу скрывать в нормальный документ с изображениями в ubuntu.

Есть ли для этого инструмент?

Существует ряд считывателей OCR для Linux, которые могут конвертировать изображения в текст. Посмотрите на следующие варианты:

  • GOCR : страница в Википедии
  • Ocrad : страница в Википедии
  • Ocropus : страница Википедии
  • Tesseract-ocr : страница в Википедии

Все вышеперечисленное, кроме ocropus, присутствует в репозитории Ubuntu в пакете с тем же именем.

Различные читатели поддерживают разные форматы изображений, поэтому вы можете ограничить свои параметры в формате файла, в котором находится ваш документ. Кроме того, вы можете использовать инструмент преобразования из ImageMagick, чтобы изменить формат, если вы хотите использовать конкретный считыватель OCR.

Адаптирован из моего ответа здесь .

Сначала вам нужно установить «tesseract-ocr» на вашу Linux-машину.

sudo apt-get install tesseract-ocr 

Вы можете сделать это вручную из CLI или я сделал PHP-код для того же самого, вы можете использовать его, если хотите.

Примечание. Чтобы запустить этот код, команда exec должна быть включена в php.ini

 <?php //IMAGE TO TXT Conversion $input_file = $_REQUEST['input_file']; $out = explode(".",$input_file); $output_file = $out[0]."_".$out[1]; $output_file_name = $output_file.".txt"; echo "<br />----IMAGE To TXT conversion Started-----</br />"; echo exec('tesseract '.$input_file.' '.$output_file); echo "<br />----TXT conversion Done-----</br />"; echo "<br /><b>Please Check----->".$output_file.".txt</b><br />"; echo "Click <a target='_blank' href='".$output_file_name."'>Here </a>to view it<br />"; ?> 

Поместите этот код в корневую папку и получите доступ к нему из браузера,

Например:

 http://yourserver.com?input_file=1.png 

Примечание. Файл 1.png должен присутствовать в вашем текущем каталоге.

У меня нет прав скачивать изображение. Я использовал этот образ для справки, http://plone.org/documentation/kb-old/copy_of_ocr-in-plone-using-tesseract-ocr/phototest.gif/image_preview

  • Почему мой USB-hdd возвращает данные SG_IO: bad / missing sense?
  • Как переустановить диспетчер загрузки Windows на раздел EFI
  • Как установить Flash-плагин для Firefox на Ubuntu в автономном режиме?
  • Программа Ubuntu наиболее совместима с Microsoft Office?
  • Перемещение всех файлов вложенных папок в другую папку
  • Предложения по совместному использованию и использованию данных между Ubuntu и Windows 7 с двойной загрузкой
  • Ошибка: нет такого раздела. Аварийное спасение
  • Двойная загрузка и виртуализация как Windows 8, так и Ubuntu
  • Flash Player не работает в ubuntu
  • Двойная / тройная загрузка Surface Pro?
  • Внешние жесткие диски, поврежденные сектора, восстанавливают / маркируют утилиту в Linux
  • Давайте будем гением компьютера.