'
Шильцина Е.А.
ПРИМЕНЕНИЕ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПРОГНОЗИРОВАНИЯ ВРЕМЕННЫХ РЯДОВ *
Аннотация:
в данной работе рассматриваются методы машинного обучения для прогнозирования временных рядов, включая линейную регрессию, деревья решений и нейронные сети. Обсуждаются их плюсы и минусы в различных сферах. Исследование подчеркивает эффективность нейронных сетей в анализе сложных данных и выявлении долгосрочных зависимостей.
Ключевые слова:
машинное обучение, временные ряды, прогнозирование, нейронные сети
В последнее время наблюдается значительный рост интереса к искусственному интеллекту, в частности к методам машинного обучения для проведения анализа и прогнозирования временных рядов. Временные ряды - последовательности данных, собранных или измеренных в определенные моменты времени. Их анализ играет ключевую роль в различных областях, таких как экономика, финансы и здравоохранение. Прогнозирование временных рядов позволяет принимать более рациональные решения на основе данных, что значительно повысит эффективность в условиях постоянно меняющихся тенденций.Традиционные методы прогнозирования, такие как авторегрессионные модели (ARIMA) и экспоненциальное сглаживание, долгое время оставались стандартом в этой области. Однако, с развитием технологий и значительным увеличением объемов данных возникла потребность в более сложных моделях. Машинное обучение, обладая способностью выявлять скрытые закономерности и обрабатывать большие объемы информации, дает исследователям помогает повысить точность прогнозов.Данная работа направлена на исследование применения методов машинного обучения для прогнозирования временных рядов. Будут рассмотрены основные алгоритмы, такие как регрессия, деревья решений, нейронные сети и ансамблевые методы, а также их положительные и отрицательные стороны.В рамках данного исследования будут рассмотрены несколько ключевых алгоритмах машинного обучения, которые хорошо показали себя в задачах прогнозирования временных рядов. Одним из наиболее простых и распространенных методов является линейная регрессия. Этот подход позволяет установить линейные зависимости между переменными и часто используется как базовая модель для сравнения с более сложными методами. Линейная регрессия может быть эффективной при наличии линейных трендов данных, однако ограничения не позволяют сделать реалистичный вывод, когда данные демонстрируют сложные нелинейные зависимости или сезонные колебания. [1]Деревья решений представляют собой еще один мощный инструмент для анализа временных рядов. Эти модели предлагают высокую гибкость и могут эффективно моделировать сложные нелинейные зависимости. Ансамблевые методы, такие как Random Forest и Gradient Boosting, объединяют несколько деревьев решений для повышения точности прогнозов и снижения риска переобучения. Эти подходы полезны в тех ситуациях, когда данные содержат шум, так как они способны адаптироваться к различным паттернам без значительной потери точности.Рекуррентные нейронные сети (RNN), а также их модификации, такие как LSTM (Long Short-Term Memory) и GRU (Gated Recurrent Unit), позволяют эффективно обрабатывать последовательные данные и учитывать временные зависимости. Эти модели способны выявлять сложные паттерны в больших объемах данных, что делает их подходящими для задач прогнозирования в областях с высокими требованиями к точности, например, финансовые рынки.[2]Рекуррентная нейронная сеть без сохранения состояния представляет собой разновидность нейронной сети, в которой данные передаются в виде перекрывающихся окон. В конце каждого окна формируется вектор состояния, который затем сбрасывается и не используется дальше. Эта особенность усложняет запоминание длительных паттернов временного ряда, так как сеть может удерживать информацию только о нескольких десятков временных шагов. [2]Рис. 1. Пример работы «развернутой» рекуррентной нейросети (RNN).Long Short-Term Memory (LSTM) - это метод, который позволяет рекуррентным нейронным сетям запоминать долгосрочные последовательности данных. Нейросеть LSTM обладает более продолжительной памятью, что позволяет ей закреплять паттерны/модели, охватывающие более 100 временных шагов. Несмотря на это, работа с очень длинными последовательностями может представлять трудности.Кроме того, LSTM решает проблему исчезающих градиентов, которая часто возникает при использовании стандартных рекуррентных нейронных сетей и требует внесения определенных изменений. Данные нейронные сети эффективны в задачах классификации, обработки и прогнозирования временных рядов.Forget gate - это слой с функцией активации, определяющий, какую информацию из долгосрочного вектора состояния следует «забыть».Input gate - этот слой решает, когда новая информация из рекуррентной нейросети должна быть добавлена в долгосрочный вектор состояния.Output gate - слой, который определяет, какая часть долгосрочного вектора состояния будет передана на следующий временной шаг.Рис. 2. Составляющие LSTM ячейки.Важно понимать, что каждый из перечисленных методов имеет свои преимущества и ограничения. Линейная регрессия, хотя и проста в интерпретации, может не справляться с нелинейными зависимостями, что ограничивает ее применение в более сложных сценариях. Деревья решений хорошо работают с категориальными данными, но они могут быть чувствительными к шуму в данных, что иногда приводит к нужде в переобучении. Нейронные сети требуют огромные объемы данных для обучения. Не смотря на это, их способность выявлять сложные паттерны делает их отличным инструментом для прогнозирования. [3]В ходе нашей работы мы проведем сравнительный анализ эффективности различных методов из различных областей - от финансовых рынков до метеорологических показателей. Для этого мы будем использовать метрики оценки качества прогнозов, такие как средняя абсолютная ошибка (MAE), среднеквадратичная ошибка (RMSE) и коэффициент детерминации (R²). Эти метрики позволят объективно оценить производительность каждого метода и выявить наиболее эффективные подходы для конкретных задач. [5]Метрики, играют ключевую роль в оценке точности моделей прогнозирования временных рядов. Эти метрики используются в различных областях, включая финансы, энергетику и здравоохранение. Рассмотрим несколько конкретных примеров их применения на практике.В финансовом секторе нейронные сети активно используются для прогнозирования цен акций, валютных курсов и других финансовых инструментов. Например, компания Goldman Sachs применяет LSTM для анализа исторических данных о ценах на золото и других активов. Модель обучается на больших объемах данных, включая информацию о предыдущих ценах, объемах торгов и даже новостях. После обучения, такая модель пытается предсказать предстоящие значения цен. В данном случае, такие метрики, как RMSE и MAPE, помогают трейдерам оценивать качество прогнозов. Например, если внедрение LSTM модели приводит к снижению MAPE на 5%, это может значительно повысить прибыльность торговых стратегий. [5]Другим примером является использование нейронных сетей компанией Tesla, которая применяет машинное обучение не только для автомобилей, но и для прогнозирования цен на свои акции. Используя данные о ценах акций, Tesla разрабатывает модели, которые помогают предсказывать будущие колебания цен, что помогает компании спланировать свои финансовые стратегии.В энергетическом секторе нейронные сети находят широкое применение для прогнозирования потребления электроэнергии. Компания Pacific Gas and Electric (PG&E) использует RNN для прогнозирования потребления электроэнергии. Модель учитывает сезонные колебания (увеличение спроса в зимний период из-за отопления). Применение LSTM позволяет эффективно обрабатывать долгосрочные зависимости, что важно для точного прогнозирования пикового потребления. Метрика RMSE позволяет энергетическим компаниям оценивать точность своих моделей и корректировать планы управления ресурсами.В здравоохранении нейронные сети применяются для выявления распространения заболеваний. Исследовательская группа из Массачусетского технологического института использует RNN для предсказания вспышек гриппа на основе медицинских данных о заболеваемости. Учитываются различные факторы, такие как сезонность и социальные мероприятия.Ещё одним примером является использование нейронных сетей для прогнозирования распространения COVID-19. Исследователи из Университета Джонса Хопкинса разработали модели на основе LSTM для анализа данных о заболеваемости и предсказания будущих вспышек. Это позволило правительственным учреждениям заранее принимать меры по предотвращению распространения заболевания.Проведено исследование, в котором сравнивали нейронные модели, где рассматривалась эффективность различных архитектур (LSTM, GRU, RNN), в сравнении с традиционными статистическими методами (ARIMA, ETS). Основное внимание уделялось тому, как нейронные сети справляются с задачами прогнозирования временных рядов, с учетом изменений в различных условиях сезонности и трендов.Исследование показывает, что нейросетевые модели значительно превосходят устоявшиеся методы по точности прогнозов. В местах где использовались сложные и многогранные данные, нейронные сети показали более точные результаты. LSTM и GRU, благодаря способности запоминать долгосрочные зависимости, демонстрируют лучшие результаты в задачах с выраженной сезонностью. Это связано с тем, что они могут эффективно обрабатывать временные зависимости и выявлять паттерны, которые традиционные методы могут не учесть.Авторы также подчеркивают важность комбинированных подходов. Одновременное использование гибридных моделей, состоящих из нейронных сетей и ARIMA, позволяет достичь наиболее высокой точности.В данной статье было проведено исследование применения методов машинного обучения для прогнозирования временных рядов. Анализ показал, что устоявшиеся методы, имеют свои ограничения, особенно в контексте сложных данных. В то же время, нейронные сети, продемонстрировали выдающиеся результаты благодаря своей способности захватывать долгосрочные зависимости и выявлять сложные паттерны. [5]Рассмотрены гибридные подходы, которые комбинируют различные методы машинного обучения. Такой подход актуален в динамичных областях, как финансы и здравоохранение, где точность имеет высокое значение.Следует сказать, что дальнейшие исследования в этой области могут привести к новым разработкам, способным улучшить качество прогнозирования. Это открывает новые горизонты для практического применения машинного обучения в различных отраслях, способствуя более проинформированным решениям и эффективному управлению ресурсами.
Номер журнала Вестник науки №5 (86) том 2
Ссылка для цитирования:
Шильцина Е.А. ПРИМЕНЕНИЕ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПРОГНОЗИРОВАНИЯ ВРЕМЕННЫХ РЯДОВ // Вестник науки №5 (86) том 2. С. 953 - 960. 2025 г. ISSN 2712-8849 // Электронный ресурс: https://www.вестник-науки.рф/article/22945 (дата обращения: 20.07.2025 г.)
Вестник науки © 2025. 16+
*