Распознавание картин без распознавания / Хабр
Обычно распознавание чего угодно реализуется с помощью технологий компьютерного зрения и машинного обучения. Нейросети “скармливают” набор изображений, по которым она учится узнавать предметы. Но что делать, если распознавать нужно сразу на мобильном устройстве, а дообучать модель в случае увеличения количества классов нет возможности из-за ограничений на стороне клиента? В таком случае использовать нейросеть не получится.
В мире нейронных сетей другие подходы к распознаванию изображений уходят в тень, но сегодня мы восстановим справедливость и расскажем о том, как можно с помощью чистой математики решать задачи машинного обучения.
Что распознаем
Нашей команде довелось заняться разработкой приложения для пивного музея. Приложение должно было распознать экспонат не более чем за секунду, используя камеру смартфона, и выдать информацию об экспонате на экране телефона, т.е. приложение использовалось вместо гида, и каждый посетитель мог бы самостоятельно изучать выставку с помощью своего мобильного телефона.
Для нас этот проект не составил бы большого труда, ведь подобные проекты — не редкость для любой ML-команды. У заказчика даже был сформирован датасет из 60 объектов-экспонатов, по несколько фотографий на каждый, что сняло бы с нас часть нагрузки по подбору нужных фото для обучения.
Однако у заказчика было два серьезных ограничения, которые заставили нас полностью пересмотреть подход к разработке:
Возможность легко расширять классы — клиенту было важно иметь возможность самостоятельно добавлять фотографии новых экспонатов и получать сразу работающее распознавание новых объектов. Расширяемость данных представила сложность, т.к. на стороне клиента не было разработчика, который мог бы дообучать модель, что было бы необходимо, если бы мы решили использовать алгоритмы компьютерного зрения
Быстрая скорость распознавания — клиент попросил реализовать распознавание так, чтобы оно занимало не дольше 1 секунды. Учитывая, что мобильные устройства гораздо менее мощные, чем отдельный компьютер с GPU, это требование тоже наложило ограничения на разработку.
Исходя из требований заказчика, было решено использовать классические алгоритмы компьютерного зрения, вместо нейросети:
О ключевых точках
Основным понятием для нашего приложения в процессе распознавания являются ключевые точки.
В качестве входной информации приложение получает изображение. Если алгоритмы компьютерного зрения анализировали бы изображение целиком, стараясь понять какой объект перед ними, наш алгоритм выполняет поиск ключевых точек.
Ключевые точки — характерные точки изображения, т.е. точки, которые сильнее всего отличаются от других областей. Математически ключевая точка является областью с наиболее высоким значением градиента. Например, на шахматной доске характерной точкой будет переход из черной клетки в белую. А у полностью белой доски характерных точек не будет.
Поиск ключевых точек реализован с помощью OpenCV. Используя стандартный оператор OpenCV мы также ищем производную изображения.
Внутри OpenCV есть детектор и дескриптор ключевых точек KAZE, который выполняет поиск этих самых ключевых точек, а затем для каждой точки генерирует вектор признаков. Алгоритм читает градиент вокруг этой точки во всех направлениях, и для каждого направления выдается число, которое описывает эту точку. Это и является описанием ключевой точки. Благодаря этому описанию мы можем сравнить точки между собой, сравнивая расстояние между векторами.
Как же происходит распознавание? Когда приложение получает на вход новую картинку, оно ищет ключевые точки на картинке, затем сравнивает их с ключевыми точками картинок из датасета. Какой экспонат получит больше баллов, т.е. с каким экспонатом количество ключевых точек совпадает максимально, тот и выдается результатом определения пользователю. Алгоритм не требует обучения, распознавание происходит полностью математическим способом.
Разработка прототипа
Для проверки гипотезы об эффективности подхода с поиском ключевых точек мы разработали прототип. А чтобы клиенту было проще проверять работу алгоритма, мы создали Телеграмм-бот: клиент отправляет в чат изображение, оно отправляется на сервер, где его обрабатывает алгоритм, результат определяется и отправляется обратно в Телеграмм вместе с некоторыми параметрами — фото экспоната, время работы алгоритма.
Прототип позволил нам понять, что подход с ключевыми точками — не только рабочий, но и оптимальный в рамках ограничения этого проекта. Все, что нам осталось сделать на этом этапе — улучшить качество определения, которое на момент создания прототипа было в районе 60%, и сделать так, чтобы алгоритм быстро работал на мобильных устройствах.
Улучшение качества распознавания
Чтобы достичь более высокого качества определения, наша команда пробовала использовать разные детекторы и дескрипторы ключевых точек (SIFT, ORB, KAZE), перебирали их параметры, занимались предобработкой входных изображений. В итоге остановились на KAZE, как наилучшем.
Дескрипторы особых точек — алгоритмы, которые дают ключевым точкам математическое описание, т.е. вектор признаков.
Нашей целью было улучшить поиск ключевых точек так, чтобы не просела скорость определения. Одним из простых решений было собирать ключевые точки для экспоната с фотографий с разных ракурсов. Таким образом, у нас будет больше информации об экспонате — мы будем более устойчивы к изменению ракурса.
Однако такое решение имеет в себе подвох. Из-за большого количества дубликатов ключевых точек скоринг начал работать некорректно. Проще всего объяснить что пошло не так на простом примере.
Наш датасет не сбалансирован. Один класс содержит 10 фотографий, другой — 3, третий — 15. Например, у нас есть 2 фотографии Паши в классе “Паша” и 10 фотографий Глаши в классе “Глаша”. При описываемом выше подходе, алгоритм определит ключевые точки со всех трех фотографий Паши и объединит их в одну группу, то же самое сделает с десятью фотографиями Глаши.
А теперь дадим алгоритму на вход фото Паши. Ключевые точки фотографии Паши совпадают с ключевыми точками класса “Паша”, и по идее никаких проблем с определением кто перед нами быть не должно. Алгоритм видит, например, 7 ключевых точек на фотографии, видит эти же 7 ключевых точек в классе “Паша” и дает этому классу 14 баллов (ведь в классе “Паша” у нас 2 фотографии, а ключевые точки с двух фото мы объединили в одну группу, породив дубликаты). Однако так получилось, что и Глаша, и Паша — люди, и у них есть много общего: нос, глаза, рот, волосы, уши. Для алгоритма они имеют довольно много схожих ключевых точек, например, две.
Из-за выполненного ранее объединения ключевых точек разных фотографий в одну кучу, две ключевые точки Паши, схожие с ключевыми точками Глаши, дают классу “Глаша” не 2 балла, а целых 20, ведь в классе “Глаша” 10 фотографий, по две схожие ключевые точки на каждом фото. Таким образом побеждает класс “Глаша” из-за большого количества дубликатов.
Решить эту проблему получилось, когда мы заменили группы похожих ключевых точек одним цетроидом — усредненным вектором признаков. После этих изменений мы достигли 87-88% качества. Мы планировали поднять качество выше 88%, путем определения требований к датасету.
Ускорение поиска расстояния
Классификация на базе ключевых точек экспонатов сводится к оценке схожести между ними, для этого нужно посчитать расстояние между дескрипторами ключевых точек. Наивный байесовский алгоритм работал слишком медленно, т.к. для каждой точки на тестовом изображении ему было нужно посчитать расстояния до всех точек в базе. Нужно ли говорить, что такой подход очень медленный, ведь точек может быть очень много?
Для ускорения работы мы заменили этот алгоритм на HNSW — приближенный поиск дистанции. Данный алгоритм строит граф, в котором строится пространство с иерархией. После внедрения HNSW скорость поиска расстояния между точками увеличилась в разы — если раньше определение занимало несколько секунд, то теперь оно занимает от 1 до 3 fps.
Определение границ экспоната
В планах клиента было не только определение экспоната с помощью приложения, но и добавление AR элементов, для чего нам нужно было научить приложение локализовывать объект, т.е. отличать его от фона и от других экспонатов вокруг.
В рамках нашего подхода решить подобную задачу проще для “плоских” объектов, таких как картины, чем для объемных, таких как статуи. Определение границ объекта можно осуществить с помощью линейных преобразований: у нас хранятся ключевые точки и их взаимное расположение как целевого объекта, так и сохраненного в библиотеке, благодаря линейным преобразованиям мы можем вычислить насколько они отклонились.
Однако некоторые объекты, а именно объемные фигуры, изменяются нелинейно на плоскости, математически восстановить трансформацию на плоскости для объемной фигуры нельзя, поэтому этот подход работает только для картин и прочих плоских экспонатов.
Ограничения подхода
Подход распознавания изображений по ключевым точкам был выбран нами не зря — он отвечал задачам клиента и поставленным изначально ограничениям. Несмотря на то, что подход отвечал требованиям, он не лишен недостатков.
Во-первых, ограничением является сам критерий распознавания — ключевые точки. Не все объекты могут их иметь, например, “Черный квадрат” Малевича наше приложение не смогло бы определить, т.к. у картины с одним цветом характерных точек нет.
Во-вторых, не просто дать количественную оценку нашей уверенности в результате классификации.
Как считается оценка неопределенности: для каждой картины мы считаем количество точек, которые совпали. У каждой картины будет разное количество баллов — у первого класса, например, 3 точки, у второго класса — 2 точки и т. д. У какого класса больше баллов, к тому классу и относится наша картина. Когда классов очень много, в знаменатель уходит все количество баллов, в числитель — баллы победителя. Если суммировать баллы по всем кандидатам, получится, например, 100. У победителя 10 баллов, у всех остальных по 1 баллу, но если поделим 10 на 100 — получится очень низкая уверенность.
И как следствие, не просто “откинуть” изображение как не присутствующее в датасете. Алгоритм всегда будет находить ближайший похожий экспонат, даже если у него будет только одна общая точка с целевым изображением.
Разработка мобильного прототипа для музея картин
Пока проект в работе и клиент думает над реализацией, мы решили создать мобильный прототип для местного музея картин. Протестировали его в боевых условиях и даже сняли видео.
Спасибо за внимание! Оставайтесь на связи, впереди еще много интересных ML-кейсов.
Список лучших инструментов распознавания изображений 2022
Содержание
Что такое инструменты распознавания изображений?
Средства распознавания изображений — это программное обеспечение искусственного интеллекта, которое создает нейронную сеть. Данные, найденные с помощью инструментов распознавания изображений, могут быть полезны во многих отношениях.
Он помогает мгновенно обрабатывать и анализировать закономерности в объектах, людях, местах и жестах на изображениях на уровне отдельных пикселей с помощью системы камер машинного зрения.
Эти шаблоны могут повысить точность и ускорить процесс идентификации изображений.
Он действует как сенсорная запись для решения возможных проблем. Допустим, автономному транспортному средству необходимо учитывать свою естественную среду, чтобы распознавать дорогу, по которой оно движется, препятствия, дорожные знаки и т. д.
Бренды интегрируют его для выполнения машинных визуальных задач в изобилии, таких как использование метатегов для классификации содержание изображений.
Помогает выполнять поиск содержимого изображений и направлять самоуправляемых роботов, автомобили с автоматическим управлением и системы предотвращения аварий.
Это помогает брендам определить, какие визуальные эффекты вызывают поведение клиентов, и использовать это для улучшения стратегии бренда. Инструменты распознавания изображений помогут вам лучше понять вашу клиентскую базу — покупательское поведение, предположения и проблемы. Получите то, что может помочь вам выйти на другой рынок, убедитесь, что никто не злоупотребляет вашим логотипом, и изучите реальный охват вашей рекламы.
Этот блог расскажет вам о различных доступных инструментах распознавания изображений и поможет вам решить, какой из них лучше всего подходит для вашего бизнеса.
Наряду с узнаваемостью бренда и лояльностью клиентов , он также обеспечивает защиту бренда и анализ демографии аудитории .
Locobuzz, Brandwatch, LogoGrab и т. д. — это несколько лучших инструментов для распознавания изображений. Давайте рассмотрим каждый из них, приведенный ниже:
8 Лучшие инструменты распознавания изображений в 2022 году
1. Анализ изображений Brandwatch cloudsight
Будучи одним из первых инструментов искусственного интеллекта в социальных сетях, который обеспечивает классификацию упоминаний бренда, Brandwatch Image Insights имеет двойную точность и в 10 раз больший охват, чем его конкуренты. Один из немногих инструментов для отслеживания любого логотипа бренда.
Благодаря надежной системе визуализации данных вы можете мгновенно анализировать ситуацию и принимать запланированные решения в режиме реального времени.
Оптимизированный для брендов и агентств, Brandwatch имеет хороший охват и расширенный набор аналитических инструментов.
Их инструменты распознавания изображений также являются сервисом, который позволяет брендам создавать Image Insights в соответствии со своими требованиями и получать уведомления в определенных ситуациях, обычно негативные упоминания. Brandwatch — одно из лучших программ для распознавания изображений на рынке!
2. Clarifai
Clarifai — один из самых популярных инструментов распознавания изображений на сегодняшний день!
Clarifai обеспечивает точность в дополнение к исключительным API-интерфейсам распознавания изображений с использованием методов машинного обучения и искусственного интеллекта.
Средства распознавания изображений могут идентифицировать, управлять и помечать изображения и видео, используя другие изображения. Пользователи могут загрузить несколько данных изображения, чтобы проверить силу инструмента при любых зарядах.
Иногда мы не можем разместить правильное описание в поисковой системе, но с Clarifai вы можете легко получить похожие изображения, выбрав фотографии и проинструктировав инструмент о ваших требованиях.
Средства распознавания изображений также могут выполнять визуальный поиск, давать рекомендации, модерировать контент и управлять коллекциями мультимедиа.
Благодаря встроенным шаблонам идентификации он может распознавать определенные понятия, такие как еда или путешествия.
Его обычная модель может иметь дело с различными понятиями, такими как объекты, идеи и эмоции. И его индивидуальные модели работают с другими произвольными объектами, такими как транспортные средства или породы собак.
3. Локобазз
Возможности Locobuzz по распознаванию изображений под управлением искусственного интеллекта анализируют фирменные логотипы, элементы или изображения.
В отличие от других инструментов распознавания изображений, этот инструмент анализирует огромное количество изображений и одновременно анализирует восприятие пользователями логотипа своего бренда, деятельности бренда и его репутации.
Средства распознавания изображений отображают обновленную социальную ленту популярных изображений клиентов, имеющих отношение к вашему бренду, и предоставляют брендам возможность контролировать изображения брендов для мониторинга пользовательского контента.
4. Распознавание Amazon
Этот сервис распознавания изображений от Amazon может распознавать объекты, ландшафты и лица на изображениях, а также в видео.
Эти инструменты распознавания изображений также имеют возможность поиска и сравнения лиц. С помощью нейронной сети он может идентифицировать и классифицировать несколько объектов и ландшафтов на предоставленных изображениях.
Например, если вы хотите найти логотип Puma, вам придется вставить тысячи изображений, связанных с Puma.
Он работает на основе технологии глубокого обучения, созданной экспертами Amazon по компьютерному зрению, которые ежедневно изучают миллиарды изображений для Prime Photos.
Инструменты распознавания изображений — это высокотехнологичная программа, которая также способна обнаруживать небезопасные и неприемлемые изображения и видео, распознавать персонажей фильмов и текст на изображениях, например названия улиц и названия продуктов на изображениях.
Еще одним преимуществом является то, что вы можете проверить программу без каких-либо платежей, но вы просто платите за дату
5. Google Vision AI
Наряду с обратным поиском изображений, Google Vision AI включает в себя подготовку настраиваемых моделей изображений или использование уже подготовленных ресурсов Google.
Среди различных инструментов распознавания изображений этот инструмент помогает вам передать источник изображения для анализа зрения, чтобы объяснить его особенности.
В отличие от других инструментов распознавания изображений, этот инструмент предоставляет бесплатную пробную версию и может использоваться для любых целей, будь то обзор качества или поиск продукта.
Инструменты распознавания изображений Google широко используются во многих компаниях.
Это относится к обратному поиску изображений, когда простая загрузка изображения может предоставить список сайтов в Интернете и отобразить похожее изображение. Что ж, теперь бренды могут искать с помощью Google Lens.
6. LogoGrab
LogoGrab предлагает технологию обнаружения изображений, которая позволяет брендам искать изображения, содержащие логотипы их брендов.
Созданная бывшими сотрудниками Google, эта технология достаточно надежна, чтобы искать различные части логотипа и обнаруживать их в случае неправильного использования.
Благодаря функции обнаружения логотипа в службах изображений, LogoGrab предоставляет вам дополнительные возможности для решения различных задач, таких как доля рынка и оценка упоминания бренда.
Средства распознавания изображений также включают мониторинг социальных сетей, мониторинг спонсорства спортивных мероприятий и монетизацию опыта визуальных данных.
Среди различных инструментов распознавания изображений этот инструмент может принести много пользы для стратегии компании благодаря своим передовым стратегиям взращивания лидов и оценки событий. LogoGrab теперь известен как VISUA!
Также ознакомьтесь с преимуществами контента, созданного пользователями
7. Обнаружение изображений IBM
Инструменты распознавания изображений IBM позволяют предприятиям понимать содержимое бренда.
Например, он может идентифицировать еду, лица, предполагаемый возраст, пол и находить связанные изображения в коллекции.
Кроме того, основное преимущество этого инструмента по сравнению с другими инструментами распознавания изображений заключается в том, что бренды могут обучать технологии, создавая настраиваемые средства обнаружения для поиска определенных категорий изображений.
Он генерирует ключевые слова класса для описания изображения, где бренды могут использовать свои изображения и извлекать связанные URL-адреса изображений с веб-сайтов, доступных для общественности для анализа.
В отличие от других инструментов распознавания изображений, этот инструмент включает специальный словарь из более чем 2000 продуктов питания для идентификации блюд, пищевых продуктов и блюд с повышенной точностью, а также для анализа нежелательного содержания.
8. API обработки изображений Microsoft
Средство обработки изображений Microsoft включает в себя инструменты машинного обучения для идентификации изображений, а также видео, цифровых документов и извлечения.
В отличие от других инструментов распознавания изображений, этот инструмент может обнаруживать 100 лиц на одном изображении с их местоположением и атрибутами тела, такими как возраст, пол, эмоции, поза, макияж, растительность на лице, порнографические изображения или нежелательный контент.
Помимо различных инструментов распознавания изображений, этот инструмент также может обнаруживать такие элементы, как описание цвета, описание содержимого, цифровой почерк, общие формы многоугольников и плановые координаты рукописных документов.
Заключение
Будущее цифрового маркетинга будет контролироваться визуальными данными, поэтому эти одни из лучших инструментов распознавания изображений, такие как Microsoft Image Processing API, Locobuzz и Brandwatch и т. д., помогают брендам идентифицировать, анализировать и извлечь то, что необходимо.
Вы также можете ознакомиться с инструментами распознавания изображений от других поставщиков, таких как DeepAI, Hive, Nanonets или Imagga.
API модерации изображений и видео от Sightengine, служба модерации изображений xModerator или API и SDK для распознавания лиц и тела.
Но основным требованием является обнаружение логотипа, анализ объектов и местоположения для изображений, поскольку это помещает эту оценку в более широкую структуру глобальных отраслевых тенденций.
Оставьте ответ
Название
Электронная почта
Веб -сайт
Комментарий
Последние сообщения
Избранные услуги
Управление Calistic Social Media
Confurtanation Commerce and Chatbots
Smart
Care
0007
Исследование рынка и аналитические данные
Управление репутацией в Интернете
WhatsApp Business Services
Многоканальное взаимодействие
Решения
Прослушивание социальных сетей и мониторинг бренда
Запросить демонстрацию
Мы ненавидим спам и обещаем защитить вашу электронную почту!
9 Лучшее программное обеспечение для распознавания изображений в 2022 году
Программное обеспечение для распознавания изображений помогает вам идентифицировать объекты, людей, места, записи и действия на изображениях или видео. Такие программы используют технологию нейронной сети, которая обрабатывает все пиксели, входящие в состав изображения.
Информация, обнаруженная программным обеспечением для распознавания фотографий, может использоваться для многих целей. Это поможет вам лучше понять клиентов и их интересы, а также разработать таргетированную рекламу для определенной группы людей. Это позволяет ритейлерам создавать рекламу, соответствующую потребностям и увлечениям их аудитории.
- Распознавание изображений Google — Распознавание объектов в 2 клика
- Amazon Rekognition — распознавание знаменитостей
- Clarifai — Помогает федеральным и коммерческим организациям
- Google Vision AI — обнаруживает эмоциональные сигналы на лицах
- LogoGrab — Распознавание логотипов и товарных знаков
- Imagga — Классифицирует изображения
- IBM Image Detection — использует первоклассную технологию
- API обработки стека файлов — интегрируется со службами обмена файлами
- GumGum — отлично подходит для цифровых маркетологов и графических дизайнеров
Все программы для обнаружения изображений в этом списке распознают лица с помощью искусственного интеллекта (ИИ). Благодаря алгоритму обнаружения изображений, также называемому классификатором изображений, программа анализирует входное изображение и отображает его содержимое. Чтобы алгоритм распознал содержимое изображения, ему необходимо определить, что делает классы такими разными.
1. Распознавание изображений Google – наш выбор
Распознавание объектов в 2 клика
- Удобно
- Позволяет загрузить изображение
- Отличная онлайн-поддержка
- Совершенно бесплатно
- Не может предоставить фактический анализ
Распознавание изображений Google
ИСПОЛЬЗОВАТЬ ОНЛАЙН
Вердикт: Google славится тем, что создал лучшее решение для поиска. Чтобы улучшить его, в 2014 году компания запустила службу поиска по распознаванию изображений. Она просматривает Интернет в поисках изображений, которые кажутся идентичными загруженным вами изображениям. Вы можете отправить фотографии в формате JPEG или PNG.
Как следует из названия, это программное обеспечение для распознавания изображений позволяет загружать и искать изображения. Его наиболее примечательной особенностью является то, что он так же удобен для пользователя, как и служба поиска Google, и имеет аналогичные возможности. Он обеспечивает превосходное покрытие, но не имеет аналитики в реальном времени, чтобы помочь вам понять результаты.
1/2
2. Amazon Rekognition
Распознавание знаменитостей
- Обнаруживает объекты, сцены и действия
- Функции распознавания лиц 8″> Признание знаменитостей
- Использование моделей глубоких нейронных сетей
- Вам необходимо войти в систему
Распознавание Amazon
ИСПОЛЬЗОВАТЬ ОНЛАЙН
Вердикт: Amazon Rekognition — это программное решение для распознавания изображений. Он позволяет распознавать объекты, узоры и лица. Его также можно использовать для поиска или сравнения лиц. Он основан на той же передовой технологии обучения, которая была разработана исследователями компьютерного зрения для Amazon Prime Photos для ежедневного анализа миллиардов изображений.
Он использует модели глубокой нейронной сети для выявления и маркировки объектов и шаблонов на ваших изображениях. Он может найти любое изображение, однако качество поиска зависит от предоставленных вами изображений, а это означает, что если вы хотите найти логотип FixThePhoto, вам сначала нужно предоставить ему тысячи изображений, связанных с FixThePhoto.
1/2
3. Clarifai
Помогает федеральным и коммерческим организациям
- Обнаруживает изображения с общими функциями
- Расширенный анализ фотографий
- Распознавание животных
- Бесплатный API
- Ограниченная функциональность
- Некоторые проблемы с NLP API
Кларифаи
ИСПОЛЬЗОВАТЬ ОНЛАЙН
Вердикт: Clarifai — это расширенный бесплатный API для распознавания изображений, который может маркировать, упорядочивать и интерпретировать изображения и видео с помощью машинного обучения и искусственного интеллекта.
Благодаря использованию технологии компьютерного зрения это программное обеспечение для обработки изображений с помощью ИИ помогает федеральным и коммерческим организациям определять содержание своих данных, что облегчает им решение проблем.
1/2
4. Google Vision AI
Обнаруживает эмоциональные сигналы на лицах
- Универсальность
- Разносторонне анализирует изображения
- Определяет эмоции
- Удобный интерфейс
- Плохо распознает текст
ИИ Google Vision
ИСПОЛЬЗОВАТЬ ОНЛАЙН
Вердикт: С помощью Google API Cloud Vision вы можете анализировать изображения с помощью нескольких мощных инструментов, от распознавания явного содержания до идентификации аффективных сигналов лица. Благодаря такому широкому спектру опций это очень полезный инструмент, который можно настроить в соответствии с вашими конкретными потребностями.
Доступно несколько вариантов: от обработки изображений с открытым исходным кодом до использования предварительно созданной модели изображения, предоставленной Google. Вы можете указать источники ваших изображений, и Vision проанализирует их и покажет вам детали. Их можно использовать для любых целей, от проверки качества до поиска нужных продуктов.
1/2
5. LogoGrab
Распознавание логотипов и торговых марок
- Мониторинг социальных сетей
- Безопасность бренда и выявление подделок
- Мониторинг данных
- Мониторинг деятельности по спонсированию спорта
- 8″> Ограниченная функциональность
LogoGrab
ИСПОЛЬЗОВАТЬ ОНЛАЙН
Вердикт: LogoGrab способен идентифицировать логотипы, символы и бренды. Это позволяет вашей организации отслеживать и контролировать графическое мультимедийное содержимое в различных типах сред, таких как социальные сети, вещательные СМИ и веб-сайты розничной торговли.
Интеграция программы на разные платформы отличная. Вы обнаружите, что переход на LogoGrab и высококачественную информацию, которую он предоставляет, гладкий и приятный.
1/2
6. Имагга
Классифицирует изображения
- Сортирует, упорядочивает и отображает изображения
- Инструменты анализа и отчетности
- Недорогой 8″> Удобство использования
- Вам необходимо войти в систему
Имагга
ИСПОЛЬЗОВАТЬ ОНЛАЙН
Вердикт: Imagga API — это автоматизированное решение для тегирования изображений и управления категориями, предназначенное для обработки больших объемов изображений. Imagga указан как API для распознавания цифровых изображений. Он имеет библиотеку, которая позволяет классифицировать активы и управлять метаданными. С помощью инструментов поиска/фильтра вы можете находить медиафайлы и управлять ими.
Вы также можете создавать отчеты и проводить анализ. Это похоже на другие API для управления цифровыми активами, такие как Box, Airtable или Canto Digital Asset Management. Тем не менее, если вы сравните Imagga с другими API-интерфейсами управления цифровыми активами, которые позволяют бесплатно распознавать изображения в Интернете, вы увидите, что он гораздо более доступен.
1/2
7.
IBM Image Detection
Использует первоклассную технологию
- Простая в настройке платформа
- Передовые технологии
- Классификация изображений
- Поиск предметов
- Инструмент распознавания лиц бесполезен
IBM Image Detection
ИСПОЛЬЗОВАТЬ ОНЛАЙН
Вердикт: IBM — технологический супергерой, и она выпустила один из лучших программных продуктов для распознавания изображений. Он может обнаруживать человеческие лица, приблизительный возраст, пол и подобные изображения.
Одной из наиболее важных особенностей IBM Image Detection является его способность к обучению. Это означает, что IBM предоставляет вам гибко настраиваемую среду, которую можно настроить для удовлетворения практически любых потребностей.
1/2
8. API обработки стека файлов
Интегрировано с файлообменниками
- Хранение файлов
- Интегрирован с файлообменными платформами
- Обнаруживает явный контент
- Позволяет пользователям отмечать видео
- Дорого
API обработки стека файлов
ИСПОЛЬЗОВАТЬ ОНЛАЙН
Вердикт: Filestack Processing API хранит, сжимает и конвертирует файлы. Кроме того, он может автоматически подключаться к службам обмена файлами, таким как Google Drive, Dropbox и Facebook. Он также выполняет несколько других задач, например, обнаруживает неприемлемый контент и распознает символы.
Filestack Processing имеет несколько других специальных функций. Вы можете использовать его, чтобы пометить видео и найти фотографии, защищенные авторским правом. С его помощью вы также можете изменять размер, обрезать и поворачивать изображения.
1/2
9. ГумГум
Отлично подходит для цифровых маркетологов и графических дизайнеров
- Находит изображения, релевантные вашему бренду
- Редактирует фото
- Идеально подходит для маркетологов и графических дизайнеров
- Простой в использовании интерфейс
- Нет полной интеграции с социальными сетями