'
Научный журнал «Вестник науки»

Режим работы с 09:00 по 23:00

zhurnal@vestnik-nauki.com

Информационное письмо

  1. Главная
  2. Архив
  3. Вестник науки №9 (78) том 3
  4. Научная статья № 72

Просмотры  16 просмотров

Смирнов Н.А., Анисимова Э.С.

  


ОБЗОР СУЩЕСТВУЮЩИХ МЕТОДОВ ОБНАРУЖЕНИЯ ОБЪЕКТОВ *

  


Аннотация:
в работе проведён обзор методов обнаружения объектов на снимках и видео: детектор Виолы-Джонса, гистограмма направленных градиентов, модель деформируемых частей, рассмотрены их достоинства и недостатки.   

Ключевые слова:
обнаружение объектов, дескриптор функции, гистограмма направленных градиентов, скользящее окно   


За последнее время появилось немало различных методов обнаружения объектов на снимках и видео. Рассмотрим их более подробно.1. Детектор Виолы-Джонса.Детектор Виолы-Джонса был представлен в 2001 году и основан на функциях типа Хаара(Рис.1). Алгоритм использует каскады и интегральные изображения, а также детектор скользящего окна, который устраняет маловероятные окна, используя быстро вычисляемые функции.Рис. 1. Функции Хаара, применяемые в алгоритме Виолы-Джонса.На приведенных выше функциях (Рис. 1) представлен прямоугольник со светлой и темной сторонами, по которым машина определяет, что это за функция. Перед обнаружением объекта изображение преобразуется в оттенки серого, так как с монохромными изображениями проще работать и требуется меньшая обработка данных. По сравнению с более поздними алгоритмами обнаружения объектов алгоритм Виолы-Джонса имеет более низкую точность [2].2. Гистограмма направленных градиентов.Дескриптор функции — это представление изображения или патча изображения, которое упрощает его, извлекая полезную и отбрасывая лишнюю информацию. Одним из популярных дескрипторов является гистограмма направленных градиентов (HOG Detector). HOG Detector использует метод статистического сопоставления шаблонов, градиент изображения вычисляет с помощью операторов Собеля, Шарра или Превитта. Операторы Собеля, Шарра и Превитта — это операторы градиента, используемые для обнаружения границ при обработке изображений. Они вычисляют градиент изображения путем свертки изображения с помощью небольшого разделяемого и целочисленного фильтра в горизонтальном и вертикальном направлениях. Оператор Собеля использует ядро 3x3 для вычисления частных производных изображения в направлениях x и y. Оператор Шарра похож на оператор Собеля, но использует ядро 3x3 с другими весами. Операторы Собеля, Шарра, и операторы Превитта относительно недороги с точки зрения вычислений по сравнению с другими операторами, такими как оператор Кайяли. Однако приближение градиента, создаваемое оператором Превитта, является относительно грубым, особенно для высокочастотных изменений изображения.На Рис.2 выделен крупно фрагмент изображения, на который наложены стрелки, показывающие градиент — стрелка показывает направление градиента, а ее длина показывает величину. Направление стрелок указывает на направление изменения интенсивности, а величина показывает, насколько велика разница.абРис. 2. а: Патч RGB и градиенты, представленные стрелками,б: градиенты в одном и том же патче, представленные в виде чисел.3. Модель деформируемых частей.Модель деформируемых частей (DPM) основана на идее, что объекты можно рассматривать как наборы частей, расположенных в деформируемой конфигурации. Модели деформируемых частей и сверточные нейронные сети являются двумя широко используемыми инструментами для визуального распознавания. Они отличаются между собой, однако недавно было обнаружено, что DPM эквивалентны единой унифицированной CNN[1].Модели DPM и CNN не являются двумя разными подходами к распознаванию объектов. Вместо этого модель DPM можно сформулировать как CNN, развернув алгоритм вывода DPM и сопоставив каждый шаг с эквивалентным уровнем CNN.   


Полная версия статьи PDF

Номер журнала Вестник науки №9 (78) том 3

  


Ссылка для цитирования:

Смирнов Н.А., Анисимова Э.С. ОБЗОР СУЩЕСТВУЮЩИХ МЕТОДОВ ОБНАРУЖЕНИЯ ОБЪЕКТОВ // Вестник науки №9 (78) том 3. С. 386 - 389. 2024 г. ISSN 2712-8849 // Электронный ресурс: https://www.вестник-науки.рф/article/17304 (дата обращения: 05.11.2024 г.)


Альтернативная ссылка латинскими символами: vestnik-nauki.com/article/17304



Нашли грубую ошибку (плагиат, фальсифицированные данные или иные нарушения научно-издательской этики) ?
- напишите письмо в редакцию журнала: zhurnal@vestnik-nauki.com


Вестник науки СМИ ЭЛ № ФС 77 - 84401 © 2024.    16+




* В выпусках журнала могут упоминаться организации (Meta, Facebook, Instagram) в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25 июля 2002 года № 114-ФЗ 'О противодействии экстремистской деятельности' (далее - Федеральный закон 'О противодействии экстремистской деятельности'), или об организации, включенной в опубликованный единый федеральный список организаций, в том числе иностранных и международных организаций, признанных в соответствии с законодательством Российской Федерации террористическими, без указания на то, что соответствующее общественное объединение или иная организация ликвидированы или их деятельность запрещена.