'
Научный журнал «Вестник науки»

Режим работы с 09:00 по 23:00

zhurnal@vestnik-nauki.com

Информационное письмо

  1. Главная
  2. Архив
  3. Вестник науки №5 (50) том 2
  4. Научная статья № 13

Просмотры  127 просмотров

Давыдов А.В., Жусупова А.К., Салыкова О.С.

  


ОБНАРУЖЕНИЕ ПРИЗНАКОВ БОЛЕЗНИ СЕРДЦА С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ *

  


Аннотация:
в данной статье рассматривается возможность использования методов машинного обучения для диагностики сердечно-сосудистых заболеваний. Для анализа было взято 187 записей ЭКГ, из которых 80 соответствовали здоровым пациентам, 90 — инфаркту миокарда и 17 — кардиомиопатии. Сигнал каждой записи предварительно обрабатывается. Результатом предварительной обработки стал суммарный сегмент из 600 образцов. Такие методы, как Random Forest, классическая логистическая регрессия, эталонные векторы и трехуровневая нейронная сеть, использовались для выявления признаков болезни сердца   

Ключевые слова:
машинное обучение, методы машинного обучения, модель нейронной сети, нейронные сети, логистическая регрессия, случайный лес   


УДК 4.8

Давыдов А.В.

обучающийся магистратуры по специальности 7M06103

Информационные технологии и робототехника

Костанайский региональный университет им.А.Байтурсынова

(г. Костанай, Республика Казахстан)

 

Жусупова А.К.

старший преподаватель кафедры программного обеспечения,

магистр технических наук,

Костанайский региональный университет им.А.Байтурсынова

(г. Костанай, Республика Казахстан)

 

Салыкова О.С.

зав. кафедрой программного обеспечения,

кандидат технических наук, доцент

Костанайский региональный университет им.А.Байтурсынова

(г. Костанай, Республика Казахстан)

 

ОБНАРУЖЕНИЕ ПРИЗНАКОВ БОЛЕЗНИ

СЕРДЦА С ИСПОЛЬЗОВАНИЕМ

МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ

 

Аннотация: в данной статье рассматривается возможность использования методов машинного обучения для диагностики сердечно-сосудистых заболеваний. Для анализа было взято 187 записей ЭКГ, из которых 80 соответствовали здоровым пациентам, 90 — инфаркту миокарда и 17 — кардиомиопатии. Сигнал каждой записи предварительно обрабатывается. Результатом предварительной обработки стал суммарный сегмент из 600 образцов. Такие методы, как Random Forest, классическая логистическая регрессия, эталонные векторы и трехуровневая нейронная сеть, использовались для выявления признаков болезни сердца.

 

Ключевые слова: машинное обучение, методы машинного обучения, модель нейронной сети, нейронные сети, логистическая регрессия, случайный лес.

 

  1. Введение

Сердечно-сосудистые заболевания являются основной причиной потери здоровья в большинстве развитых стран, поэтому раннее выявление сердечно-сосудистых заболеваний является очень важным вопросом. Для диагностики заболеваний сердца врач анализирует результаты электрокардиографии.

Существует множество различных методов анализа сигнала ЭКГ. Например, методы, основанные на слепом распределении сигналов [1], многослойный метод опорных векторов [2] и др.

Целью данного исследования является изучение использования методов машинного обучения для выявления ЭКГ-признаков, указывающих на некоторые аномалии сердца.

База данных PhysioNet [3] была выбрана для анализа электрокардиограммы, содержащей 594 записи ЭКГ. Для каждой записи был создан файл с личными данными пациента, включая такие данные, как возраст и диагноз, а также файл записи ЭКГ в формате .dat. Для работы с имеющейся базой данных использовалась библиотека Wfdb языка программирования Python, так как данные электрокардиограммы представлены в массивах numpy, с которыми несложно работать.

На первом этапе был исключен общий сердечный цикл на основе сигналов электрокардиограммы, полученных от пациентов, что позволило уменьшить общий объем данных и смоделировать все данные. Это делается с помощью библиотеки биосферы языка программирования Python. Во-первых, метод Гамильтона был использован для определения R-пиков. После нахождения этих зубов сигнал был разделен примерно на 600 отсчетов для каждого. Затем было получено среднее значение массивов, содержащих 600 образцов, за которым следовал общий сердечный цикл для сигнала электрокардиограммы.

На втором этапе предлагается решить задачу бинарной классификации с использованием различных методов машинного обучения.

 

  1. Предварительная обработка сигнала

Два набора данных пациентов с кардиомиопатией и инфарктом были объединены в один массив. Таким образом, были получены два массива, один из которых содержит 80 записей о здоровых пациентах, а другой — 107 записей о больных. С помощью библиотеки biosppi были найдены R-вершины каждого сигнала и идентифицированы окрестности 600 точек вблизи каждого R-пика. Полученные сердечные циклы по 600 точек усреднялись для получения суммарного сегмента сигнала ЭКГ. Эта обработка проводилась на всех сигналах ЭКГ. На рис. 1 представлена сумма сердечных циклов у здоровых пациентов.

  

  1. Разработка и обучение моделей машинного обучения

Модели выявления симптомов сердечных заболеваний основаны на таких методах, как «случайный лес», классическая логистическая регрессия, метод опорных векторов и нейронная сеть, состоящая из трех слоев (25, 5 и 1 нейрон). Опишем подробно принцип работы каждого метода:

Логистическая регрессия используется для прогнозирования вероятности события на основе набора возможностей. Для этого введите y-зависимую переменную, принимающую значения 0 и 1, и множество независимых переменных x1 , ... , xn, вероятность принятия которых вы хотите вычислить на основе значений. зависимая переменная [4]. Например, рассмотрим случай двух классов: Y={-1,+1}. Линейный алгоритм классификации a разработан в логистической регрессии X ® Y вида

 где - wj вес j-он устанавливает w0-порог решения, w=(w0, ..., wn)-весовой вектор, <x, w>-скалярное произведение характеристики объекта на вектор масштаба.

Основная идея метода опорных векторов заключается в построении гиперссылки, оптимально разделяющей объекты выборки. Алгоритм работает на следующем допущении: чем больше расстояние (зазор) между объектами отдельной гиперплоскости и разделяемыми классами, тем меньше средняя ошибка классификатора. В этой работе линейная гиперплоскость была получена как ядро метода опорных векторов.

Случайный лес состоит из множества деревьев решений. Они используются в статистике, анализе данных и машинном обучении. На рис. 2 наглядно показана модель этого алгоритма. Каждое отдельное дерево представляет собой очень простой узор с ветвями, узлами и листьями. Узлы содержат атрибуты, которые зависят от целевой функции. Далее значения целевой функции попадают на ветви листьев. В процессе классификации новой ситуации приходится спускаться от дерева к листу по ветвям, передавая все значения признаков по логическому принципу «ЕСЛИ». В зависимости от этих условий целевой переменной присваивается значение или класс (значение целевой переменной попадает на конкретный лист). Целью создания дерева решений является создание модели,

  

Простой пример искусственной нейронной сети показан на рис. 3.

 

 

В данной работе была построена искусственная нейронная сеть, состоящая из трех слоев. Функция активации на каждом слое выбрала функцию ReLU. Поскольку перед нами типичная задача бинарной классификации, была выбрана функция ошибки logloss.

logloss = -(ylog(p) + (1-y)log(1-p))

где y - двоичный индикатор (0 или 1) того, является ли метод класса правильной классификацией для наблюдения, p - прогнозируемая вероятность модели, что наблюдение относится к классу.

Каждый из описанных выше способов имеет свои преимущества и недостатки. В этой статье мы обучили все модели, описанные выше, чтобы определить, какая модель более точно диагностирует болезни сердца.

 

  1. Экспериментальное исследование

Для экспериментального исследования была запущена программа сбора данных, состоящая из 187 записей для каждого из методов машинного обучения. Все сигналы предварительно обрабатываются перед обучением. Модели обучались с помощью перекрестной проверки. Для каждой модели рассматривались следующие характеристики: чувствительность, точность и прецизионность. В таблице 1 показаны результаты обучения.

 

Метод

Чувствительность

Исключения

Точность

Случайный лес

0,879

0,775

0,874

Метод опорных векторов

0,879

0,675

0,791

Логистическая регрессия

0,888

0,7125

0,813

Нейронная сеть

0,832

0,7

0,775

 

Таблица 1. Результаты работы нейронной сети зависят от полученных потенциалов.

 

  1. Вывод

В этой статье было проведено сравнение различных алгоритмов машинного обучения для выявления заболеваний сердца. Перед использованием алгоритмов все сигналы ЭКГ были предварительно обработаны в соответствии с разделом 2. Исследование показало, что классическая логистическая регрессия с большей вероятностью, чем другие алгоритмы, классифицирует больного субъекта как заболевание (чувствительность). Однако алгоритм «Случайный лес» показал наилучшие характеристики и точность. Наименее эффективные результаты показали нейронные сети, что свидетельствует о необходимости использования классических алгоритмов, так как на практике было установлено, что нейронные сети не всегда дают хорошие результаты.

 

СПИСОК ЛИТЕРАТУРЫ:

 

Девика, М.Г. Инфаркт миокарда Фетация с использованием гибридного метода BSS / М.Г. Девика, Р.П. Аниш // Международная конференция по системам и сетям связи. - 2016. - Т. 1. - 167 с.

Дхаван, А. Выявление острого инфаркта миокарда в серии ЭКГ с использованием многослойной машины референтных векторов / А. Даван, Б. Венцель, С. Джордж, И. Гуссак, Б. Бойович, Д. Панеску // 34-я ежегодная международная конференция IEEE EMBS. - 2012. - Т. 1. - 2704 с.

База данных диагностических ЭКГ ПТБ //PhysioNet, 2016 - [Электронный ресурс]. - Режим доступа: https://physionet.org/physiobank/database/ptbdb/ (18.11.2019).

Давыдов, Н.С. Диагностика инфаркта миокарда с помощью волнового анализа сигналов ЭКГ / Н.С. Давыдов, А.Г. Храмы // Материалы семинара CEUR. - 2018. - Т. 2212. - С. 31-37.

Флач, П. Машинное обучение. Наука и искусство создания алгоритмов. Наушники, 2016. - 38-56 с.

 

Davydov A.V.

graduate student in the specialty 7M06103

Information technology and robotics

Kostanay Regional University named after A.Baitursynov

(Kostanay, Republic of Kazakhstan)

 

Zhusupova A.K.

Senior Lecturer of the Software Department,

Master of Technical Sciences,

Kostanay Regional University named after A.Baitursynov

(Kostanay, Republic of Kazakhstan)

 

Salykova O.S.

Head of the Software Department,

Candidate of Technical Sciences, Associate Professor

Kostanay Regional University named after A.Baitursynov

(Kostanay, Republic of Kazakhstan)

 

DETECTION OF SIGNS OF DISEASE

HEARTS USING MACHINE LEARNING METHODS

 

Abstract: this article discusses the possibility of using machine learning methods for the diagnosis of cardiovascular diseases. 187 ECG recordings were taken for analysis, of which 80 corresponded to healthy patients, 90 to myocardial infarction and 17 to cardiomyopathy. The signal of each record is pre-processed. The result of the preprocessing was a total segment of 600 samples. Methods such as Random Forest, classical logistic regression, reference vectors and a three-level neural network were used to detect signs of heart disease.

 

Keywords: machine learning, machine learning methods, neural network model, neural networks, logistic regression, random forest.

  


Полная версия статьи PDF

Номер журнала Вестник науки №5 (50) том 2

  


Ссылка для цитирования:

Давыдов А.В., Жусупова А.К., Салыкова О.С. ОБНАРУЖЕНИЕ ПРИЗНАКОВ БОЛЕЗНИ СЕРДЦА С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ // Вестник науки №5 (50) том 2. С. 78 - 86. 2022 г. ISSN 2712-8849 // Электронный ресурс: https://www.вестник-науки.рф/article/5591 (дата обращения: 29.03.2024 г.)


Альтернативная ссылка латинскими символами: vestnik-nauki.com/article/5591



Нашли грубую ошибку (плагиат, фальсифицированные данные или иные нарушения научно-издательской этики) ?
- напишите письмо в редакцию журнала: zhurnal@vestnik-nauki.com


Вестник науки СМИ ЭЛ № ФС 77 - 84401 © 2022.    16+




* В выпусках журнала могут упоминаться организации (Meta, Facebook, Instagram) в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25 июля 2002 года № 114-ФЗ 'О противодействии экстремистской деятельности' (далее - Федеральный закон 'О противодействии экстремистской деятельности'), или об организации, включенной в опубликованный единый федеральный список организаций, в том числе иностранных и международных организаций, признанных в соответствии с законодательством Российской Федерации террористическими, без указания на то, что соответствующее общественное объединение или иная организация ликвидированы или их деятельность запрещена.