'
Ширяев А.С., Суворов В.С.
ОПТИМИЗАЦИЯ МЕТОДОВ ГЛУБОКОГО ОБУЧЕНИЯ ДЛЯ ДИАГНОСТИКИ МЕЛАНОМЫ С ИСПОЛЬЗОВАНИЕМ ОГРАНИЧЕННЫХ МЕДИЦИНСКИХ ДАННЫХ *
Аннотация:
ранняя диагностика меланомы критична для эффективного лечения и снижения смертности. Однако малое количество и несбалансированность медицинских данных затрудняют обучение точных моделей ИИ. В статье анализируются методы повышения качества таких моделей: перенос знаний (transfer learning) из крупных наборов данных, расширение выборки с помощью аугментации и генерации синтетических изображений, а также адаптация архитектур глубокого обучения под дермоскопические снимки. Для оценки эффективности рассматриваются метрики accuracy, recall, precision и F1-score. На приведённых примерах показано, что эти приёмы существенно улучшают точность и доступность диагностики меланомы в регионах с ограниченными ресурсами.
Ключевые слова:
компьютерное зрение, датасет, глубокое обучение, онкология, свёрточные нейронные сети
ВВЕДЕНИЕ.Меланома — одно из самых агрессивных онкологических заболеваний, требующее ранней диагностики для успешного лечения и снижения смертности. Однако диагностика меланомы сталкивается с трудностями из-за нехватки квалифицированных специалистов и ограниченных медицинских ресурсов, особенно в удалённых районах. В последние годы технологии машинного обучения, включая методы глубокого обучения, открыли возможности для автоматизации диагностики, что значительно повышает точность и скорость выявления заболевания.Одной из главных проблем в области диагностики является ограниченность качественных медицинских данных, необходимых для обучения моделей глубокого обучения. Особенно это касается дерматоскопических изображений, на которых часто базируются диагнозы меланомы. В условиях ограниченных данных особое значение приобретают методы оптимизации, такие как transfer learning (перенос обучения) и аугментация данных. Эти подходы позволяют повысить точность моделей, несмотря на минимальные исходные данные.Для улучшения диагностики меланомы активно используется методология ABCD-теста, которая оценивает ключевые характеристики кожных образований (асимметрия, границы, цвет и диаметр). Этот подход помогает эффективно распознавать признаки меланомы и может быть интегрирован с методами машинного обучения для повышения точности.Данная статья посвящена исследованию методов оптимизации диагностики меланомы с использованием ограниченных медицинских данных. Рассматриваются подходы, такие как использование предварительно обученных моделей, а также методы генерации синтетических данных и аугментации изображений. Также особое внимание уделяется интеграции ABCD-теста с алгоритмами машинного обучения для повышения точности классификации дерматоскопических изображений. Приведённый анализ покажет, как эти методы могут быть эффективно внедрены в практическую диагностику, особенно в условиях ограниченных ресурсов и удалённых районов, где доступ к квалифицированным специалистам ограничен.1. ABCD-подход в диагностике меланомы.ABCD-подход является одним из самых популярных и широко применяемых методов для оценки дерматоскопических изображений, используемых для диагностики меланомы. Этот метод основан на анализе пяти ключевых характеристик кожных образований, которые могут указать на злокачественную природу новообразования. Каждая из характеристик вносит свой вклад в оценку риска того, что образование может быть меланомой, и на основе этого проводится классификация.Ключевые критерии ABCD-подхода включают:A – Асимметрия: Оценка симметрии кожного образования. В норме родинки симметричны, в то время как у меланомы одна половина может значительно отличаться от другой.B – Границы: Оценка регулярности границ образования. У доброкачественных образований обычно наблюдаются чёткие и ровные границы, в то время как у меланомы могут быть неровные или зазубренные края.C – Цвет: Важный показатель, который характеризует изменения в оттенках и цветах, присутствующих в образовании. Меланома часто имеет неоднородную окраску, включая оттенки чёрного, коричневого и красного.D – Диаметр: Оценка размера образования. Меланомы, как правило, имеют более крупный диаметр (более 6 мм), чем доброкачественные родинки.E – Изменчивость: Этот критерий отслеживает изменения, происходящие в течение времени. Появление изменений в размерах, цвете или форме может быть тревожным признаком.ABCD-подход используется для оценки кожных образований, а также позволяет облегчить задачу врачей при первичной диагностике. Несмотря на свою эффективность, он также имеет ограничения, связанные с субъективностью в оценке этих характеристик и потребностью в квалифицированном анализе.В последние годы применение машинного обучения и компьютерного зрения для автоматизации процесса диагностики меланомы, основанное на ABCD-подходе, значительно увеличило точность и эффективность анализа. Модели машинного обучения, особенно сверточные нейронные сети (CNN), могут автоматически извлекать важные признаки из изображений и выполнять классификацию, что способствует повышению точности и снижению зависимости от человеческого фактора.В последние годы применение машинного обучения и компьютерного зрения для автоматизации процесса диагностики меланомы, основанное на ABCD-подходе, значительно увеличило точность и эффективность анализа. Модели машинного обучения, особенно сверточные нейронные сети (CNN), могут автоматически извлекать важные признаки из изображений и выполнять классификацию, что способствует повышению точности и снижению зависимости от человеческого фактора.Для реализации этого подхода, как показано в статье Гаврилова и соавторов, используется метод transfer learning, при котором модели, обученные на больших и разнообразных датасетах, адаптируются к конкретным задачам, таким как классификация кожных заболеваний. Этот метод позволяет значительно улучшить точность и снизить потребность в больших объёмах данных, что особенно важно в медицинской практике с ограниченным доступом к качественным изображениям [1].Таким образом, интеграция ABCD-подхода в системы автоматической диагностики с использованием искусственного интеллекта и глубоких нейронных сетей позволяет существенно повысить точность диагностики меланомы, снизив вероятность ошибок, что особенно важно для ранней диагностики и своевременного лечения.2. Обзор и анализ выбранных наборов данных.Задача классификации в данной работе является мультиклассовой. Она предполагает разделение изображений на три класса:Меланома (1) — изображения с злокачественными кожными образованиями.Доброкачественная меланома (0) — изображения с доброкачественными кожными образованиями.Иное кожное заболевание (2) — изображения с другими кожными заболеваниями, такими как акне, экзема, псориаз и др.Таким образом, цель модели заключается в том, чтобы правильно классифицировать изображения кожных образований на основе их характеристик, таких как асимметрия, границы, цвет и диаметр, с использованием методов машинного и глубокого обучения.Для разработки модели и обучения были использованы два основных датасета:DermNet Dataset — международный набор данных, предоставленный сообществом DermNet, включающий более 20 классов кожных заболеваний.Российский набор данных от СГМУ — "Фотографии кожных покровов у пациентов с подозрением на меланому", который включает изображения, разделённые на два класса: меланома и не меланома [2].Оба датасета были объединены и использованы для обучения модели, что позволило создать более универсальную и точную систему для классификации кожных заболеваний.Данные были разделены на три части:Тренировочная выборка (train) — используется для обучения модели. В эту выборку входят изображения, классифицированные по заболеваниям, и она включает изображения с различными кожными заболеваниями.Валидационная выборка (validation) — используется для проверки производительности модели на данных, которые она не видела во время обучения. Это позволяет избежать переобучения и помогает оценить её способность к обобщению.Набор данных был разделён на обучающую и тестовую выборки, что позволило провести эффективную проверку точности модели.Тренировочная выборка (test) – используется для проверки модели на реальных данных для оценки F1 оценки.В тренировочной выборке содержатся изображения кожных заболеваний, разделённые на несколько классов: Акне (Acne), Меланома (Melanoma), Актинический кератоз (Actinic Keratosis), Доброкачественные опухоли (Benign Tumors), Буллёзные заболевания (Bullous), Кандидоз (Candidiasis), Побочные реакции на лекарства (Drug Eruption), Экзема (Eczema), Укусы/инфекции (Infestations/Bites), Лишай (Lichen), Красная волчанка (Lupus), Псориаз (Psoriasis), Розацеа (Rosacea), Себорейные кератозы (Seborrheic Keratoses), Повреждения от солнца (Sun/Sunlight Damage), Трихофития (Tinea), Сосудистые опухоли (Vascular Tumors), Васкулит (Vasculitis), Витилиго (Vitiligo), Бородавки (Warts).Изображения в наборе данных представляют собой дерматоскопические фотографии кожных образований. Эти фотографии были получены с помощью дерматоскопа, который позволяет врачам исследовать кожные образования с увеличением, что помогает точно различать их особенности. В наборе данных имеются изображения, содержащие как злокачественную меланому, так и доброкачественные образования, а также другие кожные заболевания.3. Математика CNN + ABCD для диагностики меланомы.Комбинированный подход, использующий сверточные нейронные сети (CNN) и метод ABCD, представляет собой мощную модель для диагностики меланомы на основе дерматоскопических изображений. В этом подходе CNN используются для извлечения локальных признаков из изображений, а метод ABCD — для количественной оценки признаков, таких как асимметрия, границы, цвет и диаметр. Описание математических основ этой модели можно представить следующим образом:CNN — это многослойная нейронная сеть, предназначенная для обработки изображений кожных покровов [3]. Она работает путем применения сверток (конволюций) на изображения для выделения значимых признаков. Сеть обучается на примерах, что позволяет автоматически извлекать важные особенности изображений, такие как текстуры, контуры и формы меланомы или иного заболевания.Математически это можно выразить через свертку:где:f(x,y) — результат свертки изображения кожного заболевания,I(x,y) — значение пикселя на изображении кожного заболевания,K(i,j) — ядро свертки (фильтр),m,n — размеры фильтра.Этот процесс повторяется на каждом слое сети, где извлекаются всё более сложные признаки. В конечном итоге, последняя часть сети (полносвязанный слой) использует эти признаки для классификации изображения (меланома или не меланома) [4].Метод ABCD включает в себя математическое описание четырёх характеристик кожного образования [5]:A (Асимметрия): оценивается как отношение длин осей эллипса, аппроксимирующего контур родинки:B (Нерегулярность границ): для оценки используется отношение площади выпуклой оболочки
Номер журнала Вестник науки №6 (87) том 1
Ссылка для цитирования:
Ширяев А.С., Суворов В.С. ОПТИМИЗАЦИЯ МЕТОДОВ ГЛУБОКОГО ОБУЧЕНИЯ ДЛЯ ДИАГНОСТИКИ МЕЛАНОМЫ С ИСПОЛЬЗОВАНИЕМ ОГРАНИЧЕННЫХ МЕДИЦИНСКИХ ДАННЫХ // Вестник науки №6 (87) том 1. С. 1620 - 1632. 2025 г. ISSN 2712-8849 // Электронный ресурс: https://www.вестник-науки.рф/article/23774 (дата обращения: 15.07.2025 г.)
Вестник науки © 2025. 16+
*