Распознавание логотипов в изображениях

Кто-нибудь знает о недавней академической работе, которая была сделана при распознавании логотипа в образах? Пожалуйста, ответьте только в том случае, если вы знакомы с этим конкретным предметом (я могу лично найти Google для «признания логотипа», большое спасибо). Любой, кто хорошо разбирается в компьютерном видении и проделал работу по распознаванию объектов, также может комментировать.

Обновление : см. Алгоритмические аспекты (какой подход, по вашему мнению, уместен, документы в этой области, должен ли он работать (и был протестирован) для данных реального мира, соображения эффективности), а не технические стороны (используемый язык программирования или будь то OpenCV …) Также может помочь работа по индексированию изображений и поиску изображений на основе контента.

Вы можете попробовать использовать локальные функции, такие как SIFT здесь: http://en.wikipedia.org/wiki/Scale-invariant_feature_transform

Он должен работать, потому что форма логотипа обычно постоянна, поэтому извлеченные функции должны хорошо соответствовать.

Рабочий процесс будет следующим:

  1. Обнаружение углов (например, угловой детектор Harris) – для логотипа Nike у них два острых конца.

  2. Вычислить дескрипторы (например, целочисленный вектор SIFT-128D)

  3. Помните о них на тренировочном этапе; на этапе согласования найдите ближайших соседей для каждой функции в базе данных, полученной во время обучения. Наконец, у вас есть набор совпадений (некоторые из них, вероятно, неверны).

  4. Исправлены неправильные совпадения с использованием RANSAC. Таким образом, вы получите матрицу, которая описывает преобразование от идеального логотипа к тому, где вы найдете логотип. В зависимости от настроек вы можете допускать различные виды преобразований (просто перевод, перевод и rotation, аффинное преобразование).

В книге Селиски есть глава (4.1) о местных особенностях. http://research.microsoft.com/en-us/um/people/szeliski/Book/

PS

  1. Я предположил, что вы хотите найти логотипы на фотографиях, например, найти все рекламные щиты Pepsi, чтобы они могли быть искажены. Если вам нужно найти логотип телеканала на экране (чтобы он не поворачивался и не масштабировался), вы могли бы сделать это проще (сопоставление образцов или что-то еще).

  2. Обычный SIFT не учитывает информацию о цвете. Поскольку логотипы обычно имеют постоянные цвета (хотя точный цвет зависит от молнии и камеры), вы можете каким-то образом рассмотреть информацию о цвете.

Мы работали над обнаружением и распознаванием логотипов в реальных изображениях. Мы также создали dataset FlickrLogos-32 и сделали его общедоступным, включая данные, основные истинные и оценочные сценарии.

В нашей работе мы рассматривали распознавание логотипов как проблему поиска, чтобы упростить распознавание нескольких classов и позволить таким системам легко масштабироваться для многих (например, тысяч) classов логотипов.

Недавно мы разработали метод связывания, называемый Min-Hashing Bundle, который объединяет пространственные конфигурации нескольких локальных функций в высоко отличительные узлы функций. Представление связки можно использовать как для поиска, так и для распознавания. См. Следующие примеры шаблонов для обнаружения логотипов:

введите описание изображения здесьвведите описание изображения здесь

Вы найдете более подробную информацию о внутренних операциях, потенциальных приложениях подхода, опытах по его работе и, конечно же, многих ссылках на соответствующую работу в статьях [1] [2] .

Работала над этим: сопоставление и поиск товарных знаков в спортивных видеобазах получают документ в формате PDF: http://scholar.google.it/scholar?cluster=9926471658203167449&hl=ru&as_sdt=2000

Мы использовали SIFT как дескрипторы товарных знаков и изображений и нормализованное пороговое соответствие для вычисления расстояния между моделями и изображениями. В нашей последней работе мы смогли значительно сократить вычисления с использованием метамоделей, создав оценку релевантности точек SIFT, которые присутствуют в разных версиях одного и того же товарного знака.

Я бы сказал, что в целом работа с видеороликами сложнее, чем работа на фотографиях из-за очень плохого визуального качества используемых в настоящее время телевизионных стандартов.

Marco

Я работал над проектом, где нам приходилось делать что-то очень похожее. Сначала я попытался использовать методы обучения Haar с помощью этого программного обеспечения

OpenCV

Он работал, но не был оптимальным решением для наших нужд. Наши исходные изображения (где мы искали логотип) были фиксированного размера и содержали только логотип. Из-за этого мы смогли использовать cvMatchShapes с известным хорошим совпадением и сравнить возвращаемое значение, чтобы считать хорошее совпадение.

Interesting Posts

Неплохо ли использовать if-инструкцию без фигурных скобок?

Как расширить редактор vim до полного экрана в шпаклере?

Как подключиться к серверу Google App Engine во внутренней сети iMac?

Получение полноэкранного режима в моем браузере с помощью jquery

Excel VBA – поиск последнего столбца с данными

Rails, проверка подлинности, проблема CSRF

Наследование: «A» является недоступной базой «B»

Моделирование событий нажатия клавиш в Mac OS X

Как вы получаете свой общедоступный IP-адрес через командную строку Windows?

Удаление программ с помощью CMD

Будет ли торрент-клиент запрашивать трекеры для фрагментов, соответствующих определенным хэшам, или части, включенные в определенный торрент-файл?

Простой способ создания C ++ memystream из (char *, size_t) без копирования данных?

Отключить язык приложений гипертекста (HAL) в JSON?

Как использовать вложенные проблемы в OpenMDAO 1.x?

Настроить окно, чтобы он всегда находился сверху в Windows 7

Давайте будем гением компьютера.