Сравнительный анализ регрессионных моделей для аппроксимации и прогнозирования ежегодных максимальных объемов воды Токтогульского водохранилища Кыргызской Республики

Автор: Ташполотов Ы. Адылова Э.С.

Журнал: Бюллетень науки и практики @bulletennauki

Рубрика: Естественные науки

Статья в выпуске: 6 т.11, 2025 года.

Бесплатный доступ

Представлен сравнительный анализ различных моделей регрессии, включая линейную, полиномиальную, экспоненциальную, синусоидальную и сплайновую регрессию, для аппроксимации ежегодных максимальных объемов воды Токтогульского водохранилища Кыргызской Республики. Целью исследования является определение наиболее адекватной модели для описания динамики наполнения водохранилища, что имеет важное значение для планирования водохозяйственной деятельности и прогнозирования водных ресурсов в регионе. Проведен сравнительный анализ прогнозных возможностей моделей на основе имеющихся данных. Результаты демонстрируют различную степень соответствия моделей наблюдаемым данным, что подчеркивает необходимость тщательного выбора метода регрессионного анализа в гидрологических исследованиях. Анализ показал, что простые модели, такие как линейная, оказались недостаточными, в то время как сплайн- регрессия продемонстрировала значительно лучшие результаты.

Еще

Регрессионный анализ, аппроксимация данных, Токтогульское водохранилище, линейная регрессия, полиномиальная регрессия, экспоненциальная регрессия, синусоидальная регрессия, сплайн-регрессия, прогнозирование

Короткий адрес: https://sciup.org/14132779

IDR: 14132779   |   DOI: 10.33619/2414-2948/115/05

Текст научной статьи Сравнительный анализ регрессионных моделей для аппроксимации и прогнозирования ежегодных максимальных объемов воды Токтогульского водохранилища Кыргызской Республики

Бюллетень науки и практики / Bulletin of Science and Practice Т. 11. №6 2025

УДК 556.55:519.23(575.2)                          

Токтогульское водохранилище, расположенное на реке Нарын в Кыргызской Республике, является крупнейшим водоемом страны и играет ключевую роль в обеспечении электроэнергией и водой для орошения обширных территорий Центральной Азии. Эффективное управление водными ресурсами водохранилища требует точного понимания динамики его наполнения, в частности, ежегодных максимальных объемов воды [1, 2].

Регрессионный анализ представляет собой мощный статистический инструмент для моделирования зависимостей между переменными и может быть использован для аппроксимации и прогнозирования гидрологических временных рядов. Выбор адекватной модели регрессии является критически важным для получения достоверных результатов [3, 4].

Целью данной работы является сравнительный анализ различных типов регрессионных моделей для аппроксимации ежегодных максимальных объемов воды Токтогульского водохранилища. В рамках исследования будут рассмотрены как простые (линейная), так и более сложные (полиномиальная, экспоненциальная, синусоидальная, сплайновая) модели регрессии, и проведена оценка их способности описывать наблюдаемые данные.

Материалы и методы

В качестве исходных данных использовались ежегодные максимальные объемы воды в Токтогульском водохранилище КР с 2012 по 2024 годы (Таблица 1).

Таблица 1

МАКСИМАЛЬНЫЕ ОБЪЕМЫ ВОДЫ В ТОКТОГУЛЬСКОМ ВОДОХРАНИЛИЩЕ КЫРГЫЗСКОЙ РЕСПУБЛИКИ с 2012 по 2024 годы (млрд. м3)

2012  2013  2014  2015  2016  2017   2018  2019  2020   2021   2022   2023   2024

13,645    10,54    9,975    13,18    17.8    17,266    16,151    13,37    10,852    11,069    10,852    10,072    13,026

Для аппроксимации данных были применены следующие модели регрессии [3‒9]:

у = 0.05 х² - 1.2 х + 15.5.(4)

  • 3.    Экспоненциальная регрессия. Экспоненциальная регрессия используется для моделирования экспоненциального роста или спада и выражается в виде формулы:

  • 4.    Синусоидальная регрессия. Если в данных наблюдается периодичность или волнообразное поведение, можно использовать тригонометрические функции, например синус:

у = a * exp(bх).(5)

Для применения такой модели часто применяют логарифмическое преобразование y , чтобы привести уравнение к линейному виду:

ln(у) = ln(a) + bх.(6)

Затем можно использовать линейную регрессию для определения ln(a) и b , а затем вернуться к исходным параметрам a и b . На основе такого подхода, используя данные таблицы 1 получили следующее уравнение:

у=14.028 exp(-0.016x).(7)

у = а sin(b x + c) + d.(8)

где a — амплитуда, b — частота, c — фаза, d — вертикальное смещение.

Использование такой модели может быть более сложным и часто требует применения нелинейных методов оптимизации.

y=4,932sin(0.51x – 1.045) +12.031(9)

  • 5.    Сплайн –регрессия [7]. Регрессионные модели, в которых функции меняется в одной или нескольких точках на шкале значений предикторов, называется сплайнами, либо кусочными полиномами, а сами точки функции называются узловыми точками (узлами).

Сплайн-регрессия не параметрический метод, позволяющий гибко моделировать нелинейные зависимости путем построения кусочных полиномиальных функций. В данном исследовании использовали кубический сплайн с определенным количеством узлов: параметры сплайна определялись эмпирически [8] на основе анализа данных, представленные в Таблице 1.

Результаты и обсуждение

Результаты применения различных моделей регрессии к данным ежегодных максимальных объемов воды Токтогульского водохранилища представлены в табличной форме (Таблица 2).

Оценка адекватности каждой модели проводилась на основе сравнения прогнозных значений с фактическими данными, а также (опционально) с использованием статистических метрик, таких как средняя абсолютная ошибка, среднеквадратическая ошибка и коэффициент детерминации (R²). Анализ результатов, представленных в Таблице 2 показал, что простая линейная регрессия не способна адекватно описать наблюдаемую динамику объемов воды, демонстрируя значительные отклонения от фактических значений. Полиномиальная регрессия второй степени показала некоторое улучшение, улавливая криволинейной зависимости, однако также имела существенные расхождения в отдельных точках. Экспоненциальная и синусоидальная регрессии в данном случае оказались наименее подходящими, не отражая характерных особенностей временного ряда.

Таблица 2

СРАВНЕНИЕ ФАКТИЧЕСКИХ И ПРОГНОЗНЫХ ЗНАЧЕНИЙ ЕЖЕГОДНЫХ МАКСИМАЛЬНЫХ ОБЪЕМОВ ВОДЫ ТОКТОГУЛЬСКОГО ВОДОХРАНИЛИЩА КЫРГЫЗСТАНА (млрд. м3)

Годы (X)

s 'В Ь

9 "

§ i

3

§ § § в 1 -^§

в it

О г: О к

О') ^

В S '?

и Q

^^

2012

13.00

13.337

14.350

14.028

13.899

13.579

2013

11.25

13.494

13.600

13.809

11.978

11.688

2014

10.10

13.651

12.950

13.595

10.416

10.284

2015

13.00

13.808

12.400

13.386

9.351

13.080

2016

17.50

13.965

11.950

13.182

8.821

17.479

2017

17.20

14.122

11.600

12.983

8.867

17.056

2018

16.10

14.279

11.350

12.789

9.533

15.275

2019

13.40

14.436

11.200

12.600

10.860

13.370

2020

11.00

14.593

11.150

12.415

12.881

11.786

2021

11.10

14.750

11.200

12.235

15.628

11.069

2022

10.90

14.907

11.350

12.059

19.133

11.664

2023

10.00

15.064

11.600

11.888

23.429

11.915

2024

13.00

15.221

11.950

11.721

28.548

11.267

2025

----

15.378

12.400

11.559

34.523

13.63

2026

----

15.535

12.950

11.401

41.387

12.80

Сплайн-регрессия продемонстрировала наибольшую гибкость и наилучшее соответствие фактическим данным, плавно следуя их изменениям. Это подчеркивает эффективность непараметрических методов для моделирования сложных нелинейных зависимостей в гидрологических процессах.

Выводы

  • 1.    Сравнительный анализ различных моделей регрессии показал, что выбор метода имеет решающее значение для адекватной аппроксимации ежегодных максимальных объемов воды в водохранилище. Простые модели, такие как линейная, оказались недостаточными, в то время как более гибкие подходы, например, сплайн-регрессия, продемонстрировали значительно лучшие результаты.

  • 2.    Полученные результаты подчеркивают важность учета нелинейности и потенциальной сложности гидрологических процессов при их моделировании.

Дальнейшие исследования будут направлены на оптимизацию параметров сплайн-регрессии (выбор оптимального количества и расположения узлов), а также на исследование других нелинейных методов и моделей временных рядов для повышения точности прогнозирования водных ресурсов КР.

Статья научная