'
Жидкин Г.А.
РАЗРАБОТКА ИНТЕЛЛЕКТУАЛЬНОГО ПОМОЩНИКА ДЛЯ ПРОВЕРКИ ДОКУМЕНТОВ НА СООТВЕТСТВИЕ ГОСТ 7.32 *
Аннотация:
в статье рассматривается подход к созданию системы для помощи в проверки оформления документов на соответствие требованиям ГОСТ 7.32 с использованием технологий искусственного интеллекта.
Ключевые слова:
ГОСТ, оформление текста, нейронные сети, компьютерное зрение, автоматизация, искусственный интеллект
Оформление документов в соответствии с государственными стандартами является важным требованием в образовательной и научной деятельности. В настоящее время преподаватели и научные сотрудники тратят значительные ресурсы на ручную проверку соответствия оформления требованиям ГОСТ 7.32. Это приводит к перегрузке персонала и увеличению времени проверки. Актуальность задачи автоматизации данного процесса очевидна, особенно в свете развития технологий машинного обучения и компьютерного зрения.ГОСТ 7.32-2017 – это межгосударственный стандарт, система стандартов по информации, библиотечному и издательскому делу. Отчет о научно-исследовательской работе. Структура и правила оформления.В рамках данного проекта была разработана интеллектуальная система, способная анализировать визуальное оформление документов и выявлять отклонения от стандарта ГОСТ 7.32. Одной из ключевых задач стало не только построение нейросетевой модели, но и создание полноценной программной среды, удобной для конечного пользователя. Основной акцент был сделан на визуальный анализ, поскольку предварительное исследование показало, что использование исключительно текстовых моделей, таких как BERT, LSTM или GRU, не позволяет корректно оценить параметры оформления: поля, отступы, выравнивание, структуру заголовков и таблиц, межстрочный интервал и другие элементы.Это стало основанием для перехода к архитектурам, ориентированным на обработку изображений. В качестве ядра интеллектуального помощника была выбрана свёрточная нейронная сеть ResNet (рисунок 1) [4], обладающая остаточными соединениями, обеспечивающими устойчивость градиентов при увеличении глубины сети. Такая структура позволяет эффективно извлекать визуальные признаки оформления и классифицировать страницы по признаку соответствия ГОСТ: «соответствует» или «не соответствует».Рис. 1. Архитектура ResNetДля подготовки выборки были сформированы две категории изображений: страницы, полностью соответствующие ГОСТ 7.32 (созданные вручную по требованиям кафедры) [5], и страницы с намеренно внесёнными нарушениями — смещённые заголовки, неправильные поля, шрифты, отсутствие обязательных элементов (рисунок 2).Рис. 2. Пример одинакового фрагмента работы, слева работа по ГОСТу, справа работа не соответствует ГОСТ.Это позволило повысить устойчивость модели к разнообразным видам оформления. В процессе обучения наблюдался устойчивый рост точности: к 50-й эпохе валидационная точность составила 92,63%, при этом график обучения, (рисунок 3), не демонстрирует признаков переобучения, что подтверждает корректность выбора архитектуры и подхода к формированию датасета.Рис. 3. График обучения модели.Особое внимание в проекте было уделено разработке пользовательского интерфейса, который реализован с использованием библиотеки Tkinter (рисунок 4).Программа устроена следующим образом: пользователь загружает документ в формате DOCX через интерфейс, после чего файл автоматически преобразуется в PDF с помощью библиотеки docx2pdf, затем каждая страница конвертируется в изображение через pdf2image и подаётся на вход модели ResNet.Рис 4. Принцип работы пользовательского интерфейса.Модель производит анализ и выдает оценку для каждой страницы, после чего формируется итоговый отчёт, в котором отражаются выявленные несоответствия с указанием их типа и локализации (например, нарушение отступов, неправильное выравнивание заголовков и прочее). Таким образом, вся логика от загрузки до вывода результатов реализована внутри одной программы, не требующей от пользователя технических знаний. В проект включены иллюстрации, демонстрирующие работу интерфейса, результаты анализа и пример визуального отчета.В ходе выполнения проекта была успешно реализована интеллектуальная система автоматической проверки визуального оформления документов на соответствие стандарту ГОСТ 7.32. Разработанный программный комплекс сочетает в себе методы компьютерного зрения, современные архитектуры глубокого обучения и интуитивно понятный пользовательский интерфейс. Применение модели ResNet позволило эффективно решать задачу классификации страниц на основе визуальных признаков, игнорируемых при текстовом анализе. Практическая реализация проекта охватывает весь цикл — от загрузки документа пользователем до генерации наглядного отчета.
Номер журнала Вестник науки №6 (87) том 4
Ссылка для цитирования:
Жидкин Г.А. РАЗРАБОТКА ИНТЕЛЛЕКТУАЛЬНОГО ПОМОЩНИКА ДЛЯ ПРОВЕРКИ ДОКУМЕНТОВ НА СООТВЕТСТВИЕ ГОСТ 7.32 // Вестник науки №6 (87) том 4. С. 1148 - 1154. 2025 г. ISSN 2712-8849 // Электронный ресурс: https://www.вестник-науки.рф/article/24683 (дата обращения: 13.12.2025 г.)
Вестник науки © 2025. 16+