'
Сметанин А.О.
КЛАССИФИКАЦИЯ ЗАБОЛЕВАНИЙ ПОЧЕК НА ОСНОВЕ КОМПЬЮТЕРНОЙ ТОМОГРАФИИ С ИСПОЛЬЗОВАНИЕМ ПРЕДОБУЧЕННОЙ МОДЕЛИ VGG-16 *
Аннотация:
автоматизированная классификация заболеваний почек по данным компьютерной томографии является важной задачей медицинской диагностики, направленной на повышение точности и скорости выявления патологий. В данной работе рассматривается подход к классификации патологий почек на основе КТ-изображений с использованием сверточной нейронной сети VGG-16. В качестве входных данных используется набор медицинских изображений, разделённых на четыре класса: нормальное состояние, киста, опухоль и камни. Описывается архитектура модели, адаптированная для задачи многоклассовой классификации, с использованием transfer learning для повышения точности на ограниченном медицинском датасете. Экспериментальные результаты показывают высокую точность модели, что подтверждает целесообразность применения архитектуры VGG-16 для задач медицинского анализа изображений.
Ключевые слова:
искусственный интеллект, сверточные нейронные сети, классификация изображений, компьютерная томография, заболевания почек, медицинская диагностика
В последние годы развитие искусственного интеллекта в медицине достигло значительных успехов, особенно в области анализа медицинских изображений. Компьютерная томография (КТ) остается одним из ключевых методов диагностики заболеваний почек, позволяя визуализировать структуры органов с высокой детализацией. Распространенность этого метода исследования обосновано более высокой диагностической точность по сравнению с ультразвуковым исследованием [1]. Однако ручная интерпретация КТ-изображений требует значительного времени и опыта специалиста, что может приводить к ошибкам, особенно в условиях высокой нагрузки на медицинские учреждения. Автоматизированная классификация изображений с использованием глубокого обучения предлагает решение этой проблемы, повышая скорость и точность диагностики. В данной работе рассматривается применение предобученной модели VGG-16, разработанной Visual Geometry Group Оксфордского университета, для классификации КТ-изображений почек. Модель VGG-16, состоящая из 16 слоев свертки и полносвязных нейронов, доказала свою эффективность в задачах компьютерного зрения, включая медицинскую визуализацию [2]. В работе используется метод transfer learning, при которой предобученные веса модели на большом датасете (ImageNet) адаптируются к специфической медицинской задаче, что особенно полезно при ограниченном объеме данных. Датасет состоит из 12 446 изображений, разделенных на четыре класса: Normal (нормальное состояние, 5077 изображений), Cyst (киста, 3709), Stone (камень, 1377) и Tumor (опухоль, 2283) [3]. Этот набор данных, доступный в открытых источниках, отражает реальные вызовы медицинской диагностики, такие как несбалансированность классов и вариабельность изображений. Основная цель — разработать модель, достигающую высокой точности классификации, и оценить ее метрики (accuracy, precision, recall, F1-score). Несмотря на успехи, такие модели сталкиваются с вызовами: шумом в медицинских изображениях, этическими аспектами автоматизации диагностики и необходимостью интерпретируемости. Мы фокусируемся на инженерном подходе, где предобработка данных и строгие метрики валидации обеспечивают надежность результатов. Это соответствует тенденциям «Software 2.0», где ИИ выступает как инструмент для усиления человеческого экспертиза [4]. ВОЗМОЖНОСТЬ ПОЛНОЙ АВТОМАТИЗАЦИИ И ЭВОЛЮЦИЯ РОЛИ СПЕЦИАЛИСТА. С появлением глубоких нейронных сетей возник миф, что ИИ полностью заменит радиологов в анализе изображений. Однако это упрощение игнорирует фундаментальную разницу между вероятностной природой моделей и детерминированным мышлением эксперта. VGG-16, как и другие CNN, excels в распознавании паттернов, но не учитывает клинический контекст: историю пациента, сопутствующие заболевания или этические нюансы. Модель может классифицировать изображение с точностью 99%, но ошибка в редком случае (например, на границе классов) может иметь критические последствия [5]. Роль специалиста эволюционирует от рутинной интерпретации к архитектурному проектированию: определению требований к модели, как классы и метрики, верификации результатов и интеграции в клинические исследования. В этом подходе инженер или врач с навыками в сфере ИИ создает предобработку данных и тесты, внутри которого модель генерирует предсказания. Это превращает ИИ в прозрачный инструмент, где визуализация матрицы ошибок ****и метрик позволяет быстро выявлять слабые места [6]. АРХИТЕКТУРА МОДЕЛИ VGG-16. VGG-16 представляет собой последовательную (Sequential) модель, состоящую из блоков свертки (Conv2D) с ReLU-активацией, максимального пулинга (MaxPooling2D) и полносвязных слоев (Dense). В оригинальной версии модель предобучена на ImageNet для 1000 классов, но в рамках исследования она будет адаптирована для четырех классов заболеваний почек, заменяя выходной слой на Dense(4, activation=softmax) для многоклассовой классификации. Ключевые этапы реализации: Предобработка данных: Изображения требуется изменить до 200x200 пикселей, конвертировать в монохром для снижения вычислительной нагрузки и нормализовать (rescale=1/255). Используется ImageDataGenerator для аугментации. Разделение датасета: Splitfolders.ratio с соотношением 80% train, 10% val, 10% test обеспечивает воспроизводимость (seed=7). Получено 9955 изображений для обучения, 1242 для валидации и 1249 для теста. Обучение: Компиляция с оптимизатором rmsprop, loss=categorical_crossentropy. Обучение на 50 эпохах с batch_size=100, steps_per_epoch=6. Мониторинг loss и метрик (accuracy, precision, recall). Оценка: Предсказания на тестовом наборе, confusion matrix с heatmap в Seaborn, расчет F1-score. Эта архитектура наследует принципы transfer learning, где нижние слои извлекают общие признаки (края, текстуры), а верхние — специфические для медицинских паттернов (формы кист или опухолей) [7]. В отличие от обучения с нуля, transfer learning минимизирует overfitting на малом датасете. ЗАГРУЗКА ДАННЫХ, РЕЗУЛЬТАТЫ ОБУЧЕНИЯ, РАЗВЕРТКА МОДЕЛИ. На практике процесс начинается с загрузки датасета и инспекции: os.listdir для подсчета изображений по классам, plot_images для визуализации сэмплов. Далее — разделение и генерация потоков данных (flow_from_directory). Модель строится как Sequential: Conv2D(32, (3,3), activation=relu) → MaxPooling2D((2,2)). Conv2D(64, (3,3), padding=same) → MaxPooling2D((2,2)). Conv2D(128, (3,3), padding=same) → MaxPooling2D((2,2)). Conv2D(256, (3,3), padding=same) → MaxPooling2D((2,2)). Flatten() → Dense(128, relu) → Dense(64, relu) → Dense(4, softmax). Результаты обученной модели высоки и показаны на рисунке 1: loss=0.018, accuracy=0.9992, precision=0.9995, recall=0.9982, F1=0.9989. Тепловая карта на рисунке 2 подтверждает минимальные ошибки, преимущественно в классе Stone, что обосновано наибольшим колличеством данных. Для развертывания модель сохраняется как.h5, что позволяет интегрировать в приложения, такие как веб-сервисы для радиологов. . Рис. 1. Результаты обученной модели. . Рис. 2. Тепловая карта обученной модели. Следует отметить, что полученные высокие значения показателей точности классификации могут быть обусловлены ограниченным объемом используемого набора данных. Малое количество обучающих примеров и их относительная однородность способны приводить к переоценке обобщающей способности модели. В связи с этим представленные результаты следует рассматривать прежде всего как демонстрацию применимости и перспективности предлагаемого подхода, а не как окончательную клинически валидированную систему. Для подтверждения устойчивости и воспроизводимости полученных результатов необходимы исследования на расширенных и многоцентровых выборках данных. ЗАКЛЮЧЕНИЕ. В данной работе был предложен и реализован подход к автоматизированной классификации заболеваний почек по данным компьютерной томографии с использованием предобученной сверточной нейронной сети VGG16. Полученные результаты подтверждают концептуальную применимость предложенного подхода, однако требуют дальнейшей проверки на расширенных выборках для оценки его клинической надежности. Разработанная модель может рассматриваться как инструмент поддержки принятия врачебных решений при интерпретации КТисследований почек и как основа для дальнейших исследований, направленных на интеграцию морфологических и функциональных характеристик почек в рамках интеллектуальных диагностических систем.
Номер журнала Вестник науки №12 (93) том 4 ч. 1
Ссылка для цитирования:
Сметанин А.О. КЛАССИФИКАЦИЯ ЗАБОЛЕВАНИЙ ПОЧЕК НА ОСНОВЕ КОМПЬЮТЕРНОЙ ТОМОГРАФИИ С ИСПОЛЬЗОВАНИЕМ ПРЕДОБУЧЕННОЙ МОДЕЛИ VGG-16 // Вестник науки №12 (93) том 4 ч. 1. С. 796 - 803. 2025 г. ISSN 2712-8849 // Электронный ресурс: https://www.вестник-науки.рф/article/27863 (дата обращения: 07.02.2026 г.)
Вестник науки © 2025. 16+