'
Мустаев А.Ф.
ПРИМЕНЕНИЕ НЕЙРОСЕТЕЙ В РАСПОЗНАВАНИИ ИЗОБРАЖЕНИЙ *
Аннотация:
в статье рассматривается применение нейронных сетей в задачах распознавания изображений
Ключевые слова:
нейросети, нейронные сети, распознавание образов
Среди методов распознавания, можно выделить широкий класс методов, методы, заслуживающие отдельного рассмотрения нейросетевые методы. В их основе лежат нейронные сети вычислительные модели, принцип функционирования которых сходен с сетями биологических нейронов головного мозга. Благодаря заимствованию принципов организации у биологических структур мозга, нейросети демонстрируют многие их свойства, такие как обучение на основе предыдущего опыта, извлечение существенных свойств из поступающей информации, обобщение имеющихся прецедентов на новые случаи. Возможности, предоставляемые нейронными сетями, были использованы для решения задач распознавания и классификации образов во множестве исследований и прикладных разработок. В данной главе рассматриваются некоторые основные разновидности нейронных сетей, их возможности и способы обучения. «Обычные» нейросети Как следует из названия в такой сети каждый нейрон связан с каждым, сигнал идет только в направлении от входного слоя к выходному, нет никаких рекурсий. Будем называть такую сеть сокращенно ПНС. Сперва необходимо решить, как подавать данные на вход. Самое простое и почти безальтернативное решение для ПНС — это выразить двумерную матрицу изображения в виде одномерного вектора. Дальше происходит выбор архитектуры. До сих пор не существует методов, позволяющих однозначно определить структуру и состав нейросети исходя из описания задачи. Для трудно формализуемых задач вряд ли когда-либо такой метод будет создан. Кроме того, существует множество различных методик редукции сети (например OBD), а также разные эвристики и эмпирические правила. Одно из таких правил гласит, что количество нейронов в скрытом слое должно быть хотя бы на порядок больше количества входов. Но вот если задуматься, на ум приходит что, когда мы преобразуем изображение в линейную цепочку байт, мы что-то безвозвратно теряем. Причем с каждым слоем эта потеря только усугубляется. Так и есть — мы теряем топологию изображения, т.е. взаимосвязь между отдельными его частями. Кроме того, задача распознавания подразумевает умение нейросети быть устойчивой к небольшим сдвигам, поворотам и изменению масштаба изображения, т.е. она должна извлекать из данных некие инварианты, не зависящие от почерка того или иного человека. Так какой же должна быть нейросеть, чтобы быть не очень вычислительно сложной и, в тоже время, более инвариантной к различным искажениям изображений? Сверточные нейронные сети Решение этой проблемы было найдено американским ученым французского происхождения Яном ЛеКуном, вдохновленным работами нобелевских лауреатов в области медицины Torsten Nils Wiesel и David H. Hubel. Эти ученые исследовали зрительную кору головного мозга кошки и обнаружили, что существуют так называемые простые клетки, которые особо сильно реагируют на прямые линии под разными углами и сложные клетки, которые реагирую на движение линий в одном направлении. Ян ЛеКун предложил использовать так называемые сверточные нейронные сети. Идея сверточных нейронных сетей заключается в чередовании сверточных слоев (C-layers), субдискретизирующих слоев (S-layers) и наличии полносвязных (F-layers) слоев на выходе
Номер журнала Вестник науки №7 (16) том 3
Ссылка для цитирования:
Мустаев А.Ф. ПРИМЕНЕНИЕ НЕЙРОСЕТЕЙ В РАСПОЗНАВАНИИ ИЗОБРАЖЕНИЙ // Вестник науки №7 (16) том 3. С. 53 - 57. 2019 г. ISSN 2712-8849 // Электронный ресурс: https://www.вестник-науки.рф/article/1960 (дата обращения: 26.04.2024 г.)
Вестник науки СМИ ЭЛ № ФС 77 - 84401 © 2019. 16+
*