Оценка применимости моделей машинного обучения для прогноза гидроэкологического состояния малых рек
Резюме
Актуальность работы. Водосборная территория р. Белая вблизи г. Луганска подвергается природным и антропогенным факторам, которые связаны с закрытием угольных шахт. Использование современных методов машинного обучения позволит спрогнозировать расход воды в реке и наметить пути по достаточному обеспечению промышленности и населения. Цель исследования. Месячное прогнозирование расхода воды на основе нескольких методов машинного обучения (ARIMA, SARIMAX, LSTM, CatBoost). Методы исследования. Рассмотрены данные по расходу воды, средней температуре воздуха, средней скорости ветра, суточной сумме осадков и рассчитанному в результате химического анализа сухому остатку из проб воды на уровнемерном посту, который находится ближе всего к Исаковскому водохранилищу. На оригинальных данных построены прогностические модели, рассчитаны соответствующие средние абсолютные ошибки и показана возможность построения эффективной системы для месячного прогнозирования расхода воды. С целью оценки взаимовлияния задаваемых данных предлагается использовать факторный анализ. Результаты. В результате исследования выявлена достаточная для практических целей применимость алгоритма градиентного бустинга (CatBoost), использующего задаваемую гидрометеорологическую информацию на водосборе. Реализация моделей выполнена с использованием открытых программных библиотек на языке Python, что подтверждает возможность широкого использования описанных методик для научных исследований и решения прикладных задач. Дополнительно сформированы группы взаимовлияния факторов и дана их оценка. Полученные результаты являются одним из важных составляющих для программно-технического инструментария, необходимого для выявления закономерностей многофакторного процесса формирования стока поверхностных водных объектов и прогнозирования расхода воды для рассматриваемой водосборной территории.
Литература
Артамонов Н.В., Ивин Е.А., Курбацкий А.Н., Фантаццини Д. Введение в анализ временных рядов. Вологда: ВолНЦ РАН, 2021. – 134 с.
Борщ С.В., Симонов Ю.А., Христофоров А.В. Прогнозирование стока рек России. М.: Гидрометцентр России, 2023. ‒ 200 с.
Данилов А.М., Гарькина И.А. Интерполяция, аппроксимация, оптимизация: анализ и синтез сложных систем. Пенза: ПГУАС, 2014. – 168 с.
Долгих В.П., Рыбалка С.В., Боблева И.С. Краткосрочное прогнозирование водного режима рек и водохранилищ методом Брауна. // Экологический вестник Донбасса. – 2024. – № 12. – С. 9–15.
Коптева А.К. О влиянии подземной добычи угля на водные ресурсы реки Белая и наполняемость Исаковского водохранилища в Луганской народной Республике. // Экологический вестник Донбасса. – 2023. – № 9. – С. 47–55.
Крамаренко А.А., Коптева А.К., Лысенко И.Л. О формировании стока малых рек в условиях углеразработок и о выборе рек-аналогов. // Экологический вестник Донбасса. – 2022. – № 7. – С. 37–50.
Мотовилов Ю.Г. Гидрологическое моделирование речных бассейнов в различных пространственных масштабах. 1. Алгоритмы генерализации и осреднения. // Водные Ресурсы. – 2016а. – Т. 43. № 3. – С. 243–253. DOI: 10.7868/S0321059616030111.
Мотовилов Ю.Г. Гидрологическое моделирование речных бассейнов в различных пространственных масштабах. 2. Результаты испытаний. // Водные Ресурсы. – 2016б. – Т. 43. № 5. – С. 467–475. DOI: 10.7868/S0321059616050096.
Погорелов А.В., Липилин Д.А., Яроцкая Е.В. Геоинформационный анализ современных изменений гидрографических характеристик речной сети на Азово-Кубанской равнине (бассейн реки Ея). // Геология и геофизика Юга России. – 2023. – Т 13. № 2. – С. –161–179. DOI: 10.46698/VNC.2023.35.64.001.
Правила эксплуатации Исаковского гидроузла. Луганск: ОКП «Луганская областная топливно-энергетическая компания», 2003. – 17 с.
Свод правил по проектированию и строительству. СП 529.1325800.2023. Определение основных расчетных гидрологических характеристик. М.: Госстрой России, 2023. – 103 с.
Смирнова И.В., Вознюк Ю.С. Расчёт подземного стока в реку Белая гидрохимическими методами. // Экологический вестник Донбасса. – 2023. – № 9. – С. 41–46.
Beven K. Deep learning, hydrological processes and the uniqueness of place. // Hydrological Processes. – 2020. – Vol. 34. Issue 16. – pp. 3608–3613. DOI: 10.1002/hyp.13805.
Borsch S., Simonov Y., Khristoforov A., Semenova N., Koliy V., Ryseva E., Krovotyntsev V., Derugina V. Russian Rivers Streamflow Forecasting Using Hydrograph Extrapolation Method. // Hydrology. – 2022. – Vol. 9. DOI: 10.3390/hydrology9010001.
Daniel C. Pandas for everyone: Python data analysis, 2nd edition. Addison-Wesley Data & Analytics Series. – 2023. – 512 p.
Douglas C.M., Cheryl L.J., Kulahci M. Introduction to time series analysis and forecasting. – John Wiley & Sons, Inc., Hoboken, New Jersey, 2015 – 671 p.
Deepali R.V., Gresha S. Bhatia python machine learning projects. – BPB Publications. – 2023. – 260 p.
Hancock J., Khoshgoftaar T. CatBoost for big data: an interdisciplinary review. // Journal of Big Data. – 2020. – Vol. 7(1). DOI: 10.1186/s40537-020-00369-8.
Prokhorenkova L., Gusev G., Vorobev A. CatBoost: unbiased boosting with categorical features. // Advances in Neural Information Processing Systems. – 2018. – Vol. 31.
Stewart J. Python for Scientists, 3rd Edition. – Cambridge University Press. – 2023. – 228 p.
Trancart T., Acou A., De Oliveira E. Forecasting animal migration using SARIMAX: An efficient means of reducing silver eel mortality caused by turbines. // Endangered Species Research. – 2013. – Vol. 21(2). – pp. 181–190. DOI: 10.3354/esr00517.
Vennerod Ch.B., Kjаrran A., Bugge E.S. Long short-term memory RNN. – 2021. – 16 p.
