Предельные символы tesseract ищет

Можно ли ограничить набор символов, которые ищет tesseract (например, поиск только для букв az)? Это значительно улучшит мои результаты.

Создайте файл конфигурации (например, «буквы») в каталоге tessdata / configs – обычно /usr/share/tesseract/tessdata/configs
или
/usr/share/tesseract-ocr/tessdata/configs

И добавьте эту строку в файл конфигурации:

 tessedit_char_whitelist abcdefghijklmnopqrstuvwxyz 

… или, может быть, [az] работает .. dunno 🙂
Затем вызовите tesseract, подобный этому:

 tesseract input.tif output nobatch letters 

Это ограничит tesseract, чтобы распознать только нужные символы

В дополнение к конфигурационному файлу, флаг -c :

 tesseract stdin stdout -c tessedit_char_whitelist=abcdefghijklmnopqrstuvwxyz -psm 6 

Просто добавьте это для тех, кто использует tesseract на Android. В вашей функции readOCR, где вы устанавливаете язык и т. Д., Добавьте следующую строку;

 tesseract.setVariable("tessedit_char_whitelist","ABCDEFGHIJKLMNOPQRSTUVWXYZ"); 

вы также можете сделать blackList для исключения символов.

Чтобы использовать белый список в файле конфигурации или с помощью -c tessedit_char_whitelist=... командной строки -c tessedit_char_whitelist=... , в новейшей версии 4.0 вам нужно будет установить режим OCR Engine в «Только оригинальный Tesseract». Это связано с тем, что новый режим «Нейронные сети LSTM» не учитывает настройку белого списка. Пример правильной командной строки для версии 4.0:

tesseract input_file output_file –oem 0 -c tessedit_char_whitelist = abc123

  • лучший OCR (оптическое распознавание символов) пример в android
  • Как конвертировать отсканированные изображения в PDF в файл PDF с возможностью поиска?
  • обработка изображений для повышения точности Tesseract OCR
  • Реализация Java OCR
  • Каковы хорошие алгоритмы обнаружения автомобильных номерных знаков?
  • Была ли исправлена ​​/ взломана reCaptcha / OCR'd / побежден / сломан?
  • Interesting Posts

    Как использовать STL очереди приоритетов для объектов?

    Пользовательская форма проверки валидации для сравнения двух полей

    Подключение к удаленному рабочему столу невозможно подключиться к Windows Server 2012

    Использование функций `…` (трехточечная или точка-точка) в функциях

    WPF Databinding: как мне получить доступ к «родительскому» контексту данных?

    Проверьте установленные пакеты перед запуском install.packages ()

    Как сделать запись в React Native?

    Как отключить WebRTC в Google Chrome

    Как распечатать содержимое вектора?

    Какие проблемы следует учитывать при переопределении равных и hashCode в Java?

    Как я могу изменить количество и размер Linux ramdisks (/ dev / ram0 – / dev / ram15)?

    Лучше ли добавить вторую видеокарту в Crossfire или заменить старую видеокарту?

    Как скомпилировать приложение .NET в собственный код?

    Изменить временный каталог

    Передача переменной Количество аргументов с другим типом – C ++

    Давайте будем гением компьютера.