'
Научный журнал «Вестник науки»

Режим работы с 09:00 по 23:00

zhurnal@vestnik-nauki.com

Информационное письмо

  1. Главная
  2. Архив
  3. Вестник науки №6 (87) том 1
  4. Научная статья № 181

Просмотры  95 просмотров

Лагузина Е.А.

  


ОБЗОР МЕТОДОВ ОБНАРУЖЕНИЯ ЧЕЛОВЕКА НА ИЗОБРАЖЕНИЯХ *

  


Аннотация:
обнаружение человека — востребованная область распознавания образов. В статье проведен обзор методов распознавания, используемых для обнаружения человека, а также предложена их классификация и сравнительный анализ.   

Ключевые слова:
компьютерное зрение, обнаружение человека, признаковая классификация, распознавание образов, условная модель   


Основными способами поиска на данный момент, является пешее прочёсывание окрестностей. Для осмотра больших участков территории в последнее время спасатели все чаще применяют БПЛА, фотографирующие местность. С одной поисково-спасательной операции получается несколько тысяч фотографий, которые на сегодняшний день добровольцы отсматривают вручную [1].Данная статья посвящена обзору и сравнительному анализу основных методов распознавания человека.Главный элемент в системе обнаружения объекта — описание объекта. Грамотный выбор средств описания позволяет нивелировать влияние факторов изменения образа на устойчивость обнаружения и увеличить результативность и надежность. В современной литературе выделяют три основные ситуации, в рамках которых идет обнаружение [2]:Портретное (детальное) — данные имеют масштаб, позволяющий различить детально конечности, лицо и торс.Обзорное (малодетальное) — данные имеют масштаб, позволяющий различить фигуру человека, определить расположение конечностей и примерно позу.Аэрофотосъемка — данные имеют масштаб, позволяющий различить фигуру человека, определить примерное расположение конечностей, а иногда — позу человека.Определяя способ описания человека, необходимо выбрать структурный тип объекта, который мы будем считать человеком. Существуют два подхода к выбору [3]:1) глобальный (монолитный),2) локальный (составной).Глобальный подход рассматривает человека как единое образование, описание которого составляется путем обработки всей области, на которой определен человек. Локальный подход рассматривает человека как совокупность частей, характеристики которых и составляют определение человека.Описание объекта составляется из признаков, выбор признаков определяет результативность работы системы. На изображениях обычно выделяют четыре группы признаков:1) спектральные признаки или признаки интенсивности,2) признаки формы,3) признаки текстуры,4) признаки движения.Спектральные признаки используют очень редко: в специфических задачах опознания людей, в которых цвет кожи является одним из отличительных признаков, либо при использовании тепловой съемки.Признаки формы описывают расположение и направление переходов на изображении, иногда говорят, что они оценивают градиент. Признаки формы, используемые для распознавания человека, очень различны. Более простые признаки стремятся найти простые геометрические фигуры на изображении и определить, являются ли наборы этих фигур человеком.Сегменты параллельных краев — прямоугольник, построенный на области, в которой линии края отклоняются от заданных параллельных прямых не более чем на заданный порог.Прямоугольные контура — прямоугольник априорно заданного размера и цвета, близость которого к изображению определяется преобразованием дальности по контуру.Составные шаблоны — набор элементов силуэта человека в различных позах. Обобщенно методы, использующие данные признаки, принято называть методами сравнения с шаблоном.Гистограмма ориентированных градиентов (ГОГ, HOG) представляет собой гистограмму распределения направлений градиента интенсивности изображения на области.Контекст фигуры (Shape Context) — гистограмма распределения пикселей контура в логарифмических полярных координатах.Признаки текстуры описывают регулярные шаблоны изменения интенсивности сигнала на изображении. В области распознавания человека доминируют два типа, относящихся к данной группе признаков.Признаки Хаара (Haar-like feature) — разница сумм двух соседних областей изображения.Локальные бинарные модели (ЛБМ, LBP) — описание пикселя составляет вектор результатов операции сравнения значений противоположных пикселей, на ЭВМ можно записать в виде одного байта, где каждый бит — это решение одного из сравнений.Признаки движения описывают шаблоны изменения интенсивности сигнала между соседними кадрами видео.Последний шаг при планировании детектора — выбор структуры самого детектора. Структура детектора описывает порядок взятия данных с изображения и составление вектора признаков, которым описывается объект. В литературе распространены два типа структуры детектора:1) регулярная структура,2) нерегулярный каркас.Первый тип определяет регулярную структуру, в рамках которой будут брать значения пикселей изображения и размер области в этой регулярной структуре, на основе которой будут вычислять признак и шаг, с которым будут брать признак. Из набора взятых признаков формируется вектор признаков, которым описывается объект.Второй тип структуры потенциально лишен недостатков детекторов на основе регулярной структуры. Элементы каркаса можно расставить лишь в областях, где присутствует объект. Кроме того, каркас может быть гибким, что позволяет достигать большей устойчивости к деформации.Составив описание объекта, необходимо разработать и реализовать подход, обеспечивающий распознавание человека на основе данного описания, т.е. решить проблему классификации. Классификатор может быть составлен на основе различных предположений, которые могут быть предложены как априорно, так и получены путем обучения. Существуют две модели классификаторов:1) порождающая модель,2) разделяющая модель.Классификаторы порождающей модели стремятся построить описание объекта и оценить близость образа на изображении к построенной модели объекта. По такой модели работают методы распознавания по модели силуэта [5], по структурным моделям [6, 7] или моделям образа [4]. К классификаторам, работающим по такой модели и использованным для распознавания человека, относятся: наивный Байесовский классификатор [8], метод словаря признаков — модель объекта формируется из нескольких элементов словаря, принадлежащих к объекту. Такие модели пользуются популярностью, так как на этапе обучения требуется значительно меньше примеров объектов, в первую очередь из-за того, что требуются лишь примеры самого объекта, т.е. поддерживают возможность обучения без учителя.Классификаторы разделяющей (дескриптивной или условной) модели стремятся предугадать класс объекта на основе входных данных, например, стремясь найти набор гипотез, максимизирующий вероятность нахождения объекта. Такие классификаторы требуют наличия разделенных на классы данных на этапе обучения, т.е. обучения с учителем. Несмотря на сложное обучение, подобные классификаторы позволяют достичь большей производительности при обработке изображений. Примеры классификаторов, работающих по такой модели:Метод опорных векторов (МОВ, SVM) — пытается максимизировать различие признаков объекта от признаков фона в пространстве признаков.Метод адаптивного усиления — ищет коэффициенты взвешенной суммы слабых классификаторов, ведущие к максимизации результативности распознавания объекта с помощью данной суммы.Нейросетевой классификатор — обучение различных типов искусственных нейронных сетей с целью увеличения вероятности распознавания объекта.Метод обучения на множестве случаев — разделяет изображения на наборы отдельных случаев. Набор классифицируется как объект, если хотя бы один из составляющих его случаев классифицируется в качестве объекта.Рассмотренные в статье методы показывают общую ситуацию с обнаружением человека на изображениях и позволяют сориентироваться в данной области. Обзор содержит общую классификацию, а также ссылочный аппарат, позволяющий перейти к детальному изучению темы. В настоящий момент наибольшей популярностью пользуются классификаторы разделяющей модели, такие, как классический метод опорных векторов и нейросетевой классификатор.   


Полная версия статьи PDF

Номер журнала Вестник науки №6 (87) том 1

  


Ссылка для цитирования:

Лагузина Е.А. ОБЗОР МЕТОДОВ ОБНАРУЖЕНИЯ ЧЕЛОВЕКА НА ИЗОБРАЖЕНИЯХ // Вестник науки №6 (87) том 1. С. 1460 - 1466. 2025 г. ISSN 2712-8849 // Электронный ресурс: https://www.вестник-науки.рф/article/23757 (дата обращения: 15.07.2025 г.)


Альтернативная ссылка латинскими символами: vestnik-nauki.com/article/23757



Нашли грубую ошибку (плагиат, фальсифицированные данные или иные нарушения научно-издательской этики) ?
- напишите письмо в редакцию журнала: zhurnal@vestnik-nauki.com


Вестник науки © 2025.    16+




* В выпусках журнала могут упоминаться организации (Meta, Facebook, Instagram) в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25 июля 2002 года № 114-ФЗ 'О противодействии экстремистской деятельности' (далее - Федеральный закон 'О противодействии экстремистской деятельности'), или об организации, включенной в опубликованный единый федеральный список организаций, в том числе иностранных и международных организаций, признанных в соответствии с законодательством Российской Федерации террористическими, без указания на то, что соответствующее общественное объединение или иная организация ликвидированы или их деятельность запрещена.