'
Научный журнал «Вестник науки»

Режим работы с 09:00 по 23:00

zhurnal@vestnik-nauki.com

Информационное письмо

  1. Главная
  2. Архив
  3. Вестник науки №6 (75) том 3
  4. Научная статья № 203

Просмотры  205 просмотров

Захарова О.И., Рыбаков Е.А.

  


ИСПОЛЬЗОВАНИЕ PYTHON И БИБЛИОТЕКИ OPEN CV ДЛЯ РАСПОЗНАНИЯ ОБЪЕКТОВ *

  


Аннотация:
в статье рассматриваются вопросы использования Python и OpenCV для решения задач распознавания образов. Описано, как каскады Хаара используются для обнаружения объектов на изображениях с использованием библиотеки OpenCV на языке Python. Подчеркивается важность наличия файлов XML с обученными моделями для конкретных типов объектов, а также возможность применения этих методов в различных областях, таких как робототехника, медицина и безопасность.   

Ключевые слова:
машинное обучение, методы распознавания, каскад Хаара   


ВведениеДля текущего этапа развития человечества характерно ежедневное накопление и использование огромного количества входящей информации. такая ситуация неминуема в условиях современного многообразия источников данных. проблема обработки и анализа полученных данных очень актуальна в наше время, так как с каждым днём появляется всё больше инструментов и возможностей для организации автоматизации повседневных процессов. таким образом, формируются задачи по автоматизации анализа, которые люди уже не в состоянии решить только лишь просматривая больших объемов данных и делая из них выводы. для решения этой задачи используется язык программирования python.Основные средства разработкиPython – это популярный язык программирования, который широко используется в различных областях, включая автомобильную промышленность. он обладает простым и понятным синтаксисом, что делает его идеальным выбором для разработки программ, работающих с изображениями. для распознания объектов на статичном изображении или в потоковом видео, существует множество общедоступных библиотек, примером которой может послужить – opencv.OpenCV (open source computer vision library) — это мощная библиотека для обработки изображений и видео, написанная на c++. стоит отметить, что существует версия библиотеки и для python, которая имеет два варианта именования: opencv-python или python-opencv. Основные возможности библиотеки openCV:считывание и обработка динамического или статического изображения из разнообразных источников,обработка полученного изображения с целью классификации объектов и выделения контуров,определения объекта в библиотеке OpenCV применяется каскад Хаара.Каскад Хаара — это способ обнаружения определённых объектов на изображении, основанный на машинном обучении, авторами идеи которого являются пол виола (paul viola) и майкл джонс (michael jones). на вход принимается статическое изображение, в свою очередь, обученный каскад хаара определяет, присутствует ли на нем искомый объект, а значит выполняет задачу классификации, разделяя входные данные на два класса (искомый объект обнаружен, искомого объекта на изображении нет). если обучение каскада хаара проведено на качественно подготовленных тренировочных данных, то он будет иметь хорошую скорость выполнения классификации, а также сможет справиться с несущественными отклонениями разного рода. исходя из этого, можно отнести скорость к основным преимуществам использования библиотеки OpenCV, так как она играет большую роль в решении задач, связанных с анализом и обработкой больших данных. так же стоит упомянуть, универсальность этого подхода, что позволит многократно увеличить область применения данного решения.Каскад Хаара можно использовать для решения задачи обнаружения объектов в компьютерном зрении следующим образом:1.сбор положительных и отрицательных изображений: для обучения классификатора необходимо собрать множество положительных (изображения с объектами) и отрицательных (изображения без объектов) изображений,2.извлечение признаков: используются признаки Хаара, которые представляют собой смежные прямоугольные области с разными значениями интенсивности пикселей под чёрным и белым прямоугольниками.Прямоугольный признак: f(x) = ?_i p_i ·площадь(R_i)Диагональный признак: f(x) = ?_i p_i ·площадь(D_i),где:- f(x) - значение признака Хаара для данного окна изображения- p_i - значение пикселя в области R_i или D_i- площадь(R_i) - площадь прямоугольной области R_i- площадь(D_i) - площадь диагональной области D_iЭти формулы используются для вычисления значений признаков Хаара в различных областях изображения, что позволяет выделить характеристики объектов и использовать их для классификации и обнаружения на изображениях.3.обучение каскада: на основе собранных положительных и отрицательных изображений происходит обучение каскадной функции, которая затем используется для обнаружения объектов на других изображениях,4.обнаружение объектов: каждая область изображения проверяется одновременно, и для каждой области получается значение разности сумм пикселей под белым и чёрным прямоугольниками. большое значение функции указывает на актуальность объекта.В библиотеке OpenCV каскады Хаара используются для обнаружения объектов на изображениях. Этот метод основан на использовании признаков Хаара, о которых было указано ранее. OpenCV предоставляет готовые каскады Хаара для обнаружения лиц, глаз, улыбок и других объектов.Для использования каскадов Хаара в OpenCV обычно используется класс cv2.CascadeClassifier. Вот пример кода на Python, демонстрирующий обнаружение лиц с использованием каскада Хаара в OpenCV:Рис. 1. Реализация каскада Хаара на языке Python.В этом коде загружается каскад Хаара для обнаружения лиц, загружается изображение, преобразуется в оттенки серого и затем применяется метод detectMultiScale для обнаружения лиц. Найденные лица обрамляются прямоугольниками на изображении.Нужно отметить, что для использования каскадов Хаара в OpenCV нужно иметь файлы XML с обученными моделями для конкретных типов объектов (например, лица). Эти файлы можно найти в репозитории OpenCV или обучить свои собственные модели с помощью инструментов машинного обучения.ЗаключениеРезультаты данного исследования могут быть использованы в различных областях, где для решения поставленных задач требуется распознавание и классификация объектов на изображении, таких как робототехника, медицина, обеспечение безопасности и других. также, возможно использование в задачах связных с организацией автоматизированных систем.Таким образом, можем сделать вывод, что использование Python и библиотеки OpenCV позволяет разрабатывать эффективные и наглядные программы для распознавания объектов на изображениях. эти инструменты широко применяются в различных областях науки и техники, обеспечивая развитие современных технологий.   


Полная версия статьи PDF

Номер журнала Вестник науки №6 (75) том 3

  


Ссылка для цитирования:

Захарова О.И., Рыбаков Е.А. ИСПОЛЬЗОВАНИЕ PYTHON И БИБЛИОТЕКИ OPEN CV ДЛЯ РАСПОЗНАНИЯ ОБЪЕКТОВ // Вестник науки №6 (75) том 3. С. 1372 - 1377. 2024 г. ISSN 2712-8849 // Электронный ресурс: https://www.вестник-науки.рф/article/16072 (дата обращения: 11.12.2025 г.)


Альтернативная ссылка латинскими символами: vestnik-nauki.com/article/16072



Нашли грубую ошибку (плагиат, фальсифицированные данные или иные нарушения научно-издательской этики) ?
- напишите письмо в редакцию журнала: zhurnal@vestnik-nauki.com


Вестник науки © 2024.    16+




* В выпусках журнала могут упоминаться организации (Meta, Facebook, Instagram) в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25 июля 2002 года № 114-ФЗ 'О противодействии экстремистской деятельности' (далее - Федеральный закон 'О противодействии экстремистской деятельности'), или об организации, включенной в опубликованный единый федеральный список организаций, в том числе иностранных и международных организаций, признанных в соответствии с законодательством Российской Федерации террористическими, без указания на то, что соответствующее общественное объединение или иная организация ликвидированы или их деятельность запрещена.