توسعه مدل های تلفیقی یادگیری ماشین مبتنی بر روش تجزیه مد تجربی گروهی کامل در برآورد جریان ورودی به سد (مطالعه موردی سد دز)

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشگاه شهید چمران اهواز دانشکده مهندسی آب و محیط زیست

2 استاد گروه هیدرولوژی ومنابع آب، دانشکده مهندسی علوم آب، دانشگاه شهید چمران اهواز

3 استادیار دانشگاه شهید چمران اهواز

چکیده

برآورد جریان ورودی به مخزن سدها در برنامه‌ریزی و مدیریت بهینه منابع آب، تامین آب مورد نیاز بخش‌های مختلف و مدیریت سیلاب از اهمیت ویژه‌ای برخوردار است. بنابراین در پژوهش حاضر سعی گردید تا عملکرد مدل‌های یادگیری ماشین جنگل‌های تصادفی (RF) و رگرسیون فرآیند گاوسی (GPR) با استفاده از روش پیش‌پردازش داده‌های تجزیه مد تجربی گروهی کامل (CEEMD) در برآورد جریان ماهانه ورودی به سد دز در دوره آماری 51-1350 تا 97-1396 مورد بررسی قرار گیرد. بدین منظور الگوهای ورودی در چهار سناریوی مختف شامل استفاده از داده‌های جریان با تاخیرهای زمانی، ترکیب داده‌های جریان و بارش با تاخیر‌های زمانی و اضافه‌ کردن خاصیت تناوبی به دو حالت قبل آماده و به مدل‌های منفرد معرفی شدند. نتایج نشان داد که هر مدل با سناریوهای متفاوتی به حداکثر دقت خود دست می‌یابد و در این بین مدل GPR با شاخص RMSE برابر با (m3/s) 49/97 بهترین عملکرد را داشت. پس از تعیین الگوهای برتر ورودی در هر سناریو، داده‌های مربوطه توسط روش CEEMD تجزیه و فرآیند مدل‌سازی با روش‌های RF و GPR انجام شد. بر اساس معیار‌های ارزیابی، کاهش خطا و افزایش دقت در مدل‌های تلفیقی توسعه داده شده به طور قابل ملاحظه‌ای مشهود بود. به طوریکه مدل CEEMD-GPR تواتست مقدار شاخص RMSE را به طور متوسط حدود 47 مترمکعب بر ثانیه کاهش دهد. همین روند برای مدل CEEMD-RF نیز مشاهده شد. به طور کلی عملکرد CEEMD-GPR در مقایسه با کلیه مدل‌های توسعه داده شده (منفرد یا تلفیقی) مناسب‌تر بوده و برای پیش‌بینی جریان ورودی به سد دز توصیه می‌شود.

کلیدواژه‌ها


عنوان مقاله [English]

Development of Integrated Machine Learning Models Based on Complete Ensemble Empirical Mode Decomposition Method for Estimating Dam Inflow (case study: Dez Dam)

نویسندگان [English]

  • Navid Mousazadeh 1
  • Ali mohammad Akhund ali 2
  • Farshad Ahmadi 3
1 Faculty of Water and Environmental Engineering, Shahid Chamran University of Ahvaz, Ahvaz.
2 Professor, Faculty of Water Sciences Engineering, Shahid Chamran University of Ahvaz, Iran.
3 Shahid Chamran university of Ahvaz
چکیده [English]

Estimating the inflow to the reservoir of dams is of particular importance in planning and optimal management of water resources, water supply needed by different sectors and flood management. Therefore, in the current research, it was tried to evaluate the performance of random forest (RF) and Gaussian process regression (GPR), machine learning models by using the preprocessing method of complete ensemble experimental mode decomposition (CEEMD) for estimating the monthly inflow to Dez Dam in the period of 1971 to 2017. For this purpose, the input patterns in four different scenarios, including the use of flow data with time delays, the combination of flow and precipitation data with time delays, and adding periodic term to the previous two modes, were prepared and introduced to standalone models. The results showed that each model achieves its maximum accuracy with different scenarios, and in the meantime, the performance of the GPR model was the best with an RMSE value of 97.49 (m3/s). After determining the best input patterns in each scenario, the relevant data were analyzed by CEEMD method and the modeling process was performed with RF and GPR methods. Based on the evaluation criteria, the error reduction and accuracy increase in the developed integrated models were significantly evident. So that the CEEMD-GPR model was able to reduce the value of the RMSE index by about 47 (m3/s). The same behavior was observed for the CEEMD-RF model. In general, the performance of CEEMD-GPR is more suitable compared to all the developed models (single or integrated) and it is recommended for predicting the inflow to Dez Dam.

کلیدواژه‌ها [English]

  • Intrinsic mode function
  • Delay time
  • Hybrid model
  • Standalone model
ثاقبیان، س. م. 1399. پیش بینی زمانی و مکانی دبی جریان با استفاده از روش های تلفیقی هوش مصنوعی و پیش پردازش و پس پردازش سری زمانی. نشریه آبیاری و زهکشی ایران، 14(4): 1137-1151.
منتصری، م. و زمان زاد قویدل، س. 1395. مقایسه عملکرد مدل های هوش مصنوعی در تخمین پارامترهای کیفی آب رودخانه در دوره های کم آبی و پرآبی. آب و خاک، 30(6): 1733-1747.
رضازاده جودی، ع. و ستاری، م. ت. 1395. ارزیابی عملکرد روش های مبتنی بر کرنل در تخمین میزان بار رسوبی معلق رودخانه (مطالعۀ موردی: رودخانۀ صوفی‌چای مراغه). پژوهش های جغرافیای طبیعی، 48(3): 413-429.
احمدی، ف. 1399. ارزیابی عملکرد روش‌های ماشین‌بردار پشتیبان و سیستم استنتاج عصبی فازی تطبیقی در پیش‌بینی جریان ماهانه رودخانه‌ها (مطالعه موردی رودخانه‌های نازلو و سزار). تحقیقات آب و خاک ایران، 51(3): 673-683.
روشنگر، ک. و قاسم پور، ر. 1399. بهبود پیش بینی بارش ماهانه با استفاده از مدل تلفیقی بر پایه روش کرنل- تبدیل موجک و تجزیه ی یکپارچه مد تجربی کامل. نشریه مهندسی عمران امیرکبیر، 52(10): 2649-2660.
Abda, Z., Zerouali, B., Chettih, M., Guimaraes Santos, C.A., de Farias, C.A.S. and Elbeltagi, A. 2022. Assessing machine learning models for streamflow estimation: a case study in Oued Sebaou watershed (Northern Algeria). Hydrological Sciences Journal. 67(9): 1328-1341.
Ahmadi, F., Mehdizadeh, S. and Nourani, V. 2022. Improving the performance of random forest for estimating monthly reservoir inflow via complete ensemble empirical mode decomposition and wavelet analysis. Stochastic Environmental Research and Risk Assessment. 1-16.
Al-Abadi, A. M., and Shahid, S. 2016. Spatial mapping of artesian zone at Iraqi southern desert using a GIS-based random forest machine learning model. Modeling Earth Systems and Environment. 2: 1-17.
Ali, M., Prasad, R., Xiang, Y. and Yaseen, Z.M. 2020. Complete ensemble empirical mode decomposition hybridized with random forest and kernel ridge regression model for monthly rainfall forecasts. Journal of Hydrology. 584: 624-647.
Beven, K. 2020. Deep learning, hydrological processes and the uniqueness of place. Hydrological Processes. 34(16): 3608-3613.
Breiman, L. 2001. Random forests. Machine Learning. 45(1): 5-32.
Darbandsari, P. and Coulibaly, P. 2020. Introducing entropy-based Bayesian model averaging for streamflow forecast. Journal of Hydrology. 591: 125-177.
Elbeltagi, A., Pande, C.B., Kumar, M., Tolche, A.D., Singh, S.K., Kumar, A. and Vishwakarma, D.K., 2023. Prediction of meteorological drought and standardized precipitation index based on the random forest (RF), random tree (RT), and Gaussian process regression (GPR) models. Environmental Science and Pollution Research. 6: 1-20.
Fang, W., Huang, S., Ren, K., Huang, Q., Huang, G., Cheng, G. and Li, K. 2019. Examining the applicability of different sampling techniques in the development of decomposition-based streamflow forecasting models. Journal of Hydrology. 568: 534-550.
Fathabadi, A., Seyedian, S.M., and Malekian, A. 2022. Comparison of Bayesian, k-Nearest Neighbor and Gaussian process regression methods for quantifying uncertainty of suspended sediment concentration prediction. Science of the Total Environment. 818: 151-160.
Hosseinzadeh, P., Nassar, A. Boubrahimi S.F. and Hamdi S.M. 2023. ML-Based Streamflow Prediction in the Upper Colorado River Basin Using Climate Variables Time Series Data. Hydrology. 10(2): 29-45.
Huang, N.E., Shen, Z., Long, S.R., Wu, M.C., Shih, H.H., Zheng, Q., Yen, N.C., Tung, C.C. and Liu, H.H. 1998. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis. Proceedings of the Royal Society of London. Series A: Mathematical, Physical and Engineering Sciences. 454(1971): 903-995.
Huang, N., Lu, G. and Xu, D. 2016. A permutation importance-based feature selection method for short-term electricity load forecasting using random forest. Energies. 9(10): 767.
Ikram, R.M.A., Goliatt, L., Kisi, O., Trajkovic, S. and Shahid, S. 2022. Covariance matrix adaptation evolution strategy for improving machine learning approaches in streamflow prediction. Mathematics. 10(16): 49-71.
Katipoğlu, O. M. 2023. Prediction of streamflow drought index for short-term hydrological drought in the semi-arid Yesilirmak Basin using Wavelet transform and artificial intelligence techniques. Sustainability. 15(2): 110-119.
Keshvari R. Imani M. and Parsa Moghaddam M. 2022. Short Term Load Forecasting Using Empirical Mode Decomposition, Wavelet Transform and Support Vector Regression. Signal and Data Processing. 19(3): 35-48.
Latifoğlu, L. 2022. A novel approach for prediction of daily streamflow discharge data using correlation based feature selection and random forest method. International Advanced Researches and Engineering Journal 6 (1): 1-7.
Li, X., Sha, J. and Wang, Z.L. 2019. Comparison of daily streamflow forecasts using extreme learning machines and the random forest method. Hydrological Sciences Journal. 64(15): 1857-1866.
Lin, Y., Wang, D., Wang, G., Qiu, J., Long, K., Du, Y., Xie, H., Wei, Z., Shangguan, W. and Dai, Y. 2021. A hybrid deep learning algorithm and its application to streamflow prediction. Journal of Hydrology. 601: 126-136.
Meng, E., Huang, S., Huang, Q., Fang, W., Wang, H., Leng, G., Wang, L. and Liang, H. 2021. A Hybrid VMD-SVM model for practical streamflow prediction using an innovative input selection framework. Water Resources Management. 35(4): 1321-1337.
Niu, W. J. and Feng, Z. K. 2021. Evaluating the performances of several artificial intelligence methods in forecasting daily streamflow time series for sustainable water resources management. Sustainable Cities and Society. 64: 102-122.
Orellana-Alvear, J., Célleri, R., Rollenbeck, R., Muñoz, P., Contreras, P. and Bendix, J. 2020. Assessment of native radar reflectivity and radar rainfall estimates for discharge forecasting in mountain catchments with a random forest model. Remote Sensing 12(12): 19-86.
Saray, M.H., Eslamian, S.S., Klöve, B. and Gohari, A. 2020. Regionalization of potential evapotranspiration using a modified region of influence. Theoretical and Applied Climatology. 140(1): 115-127.
Shannon, C.E. 2001. A mathematical theory of communication. ACM SIGMOBILE Mobile Computing and Communications Review. 5(1): 3-55.
Shen, Y., Ruijsch, J., Lu, M., Sutanudjaja, E.H. and Karssenberg, D. 2022. Random forests-based error-correction of streamflow from a large-scale hydrological model: Using model state variables to estimate error terms. Computers & Geosciences. 159: 105019.
Sun, N., Zhang, S., Peng, T., Zhang, N., Zhou, J. and Zhang, H. 2022. Multi-Variables-Driven Model Based on Random Forest and Gaussian Process Regression for Monthly Streamflow Forecasting. Water. 14(11): 18-28.
Torres, M.E., Colominas, M.A., Schlotthauer, G. and Flandrin, P. 2011. A complete ensemble empirical mode decomposition with adaptive noise. In 2011 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (pp. 4144-4147). IEEE.
Wang, J. 2020. An intuitive tutorial to Gaussian processes regression. ArXiv preprint arXiv: 2009.10862.
Were, K., Bui, D.T., Dick, B. and Singh, B.R. 2015. A comparative assessment of support vector regression, artificial neural networks, and random forests for predicting and mapping soil organic carbon stocks across an Afromontane landscape. Ecological Indicators. 52: 394-403.
Willmott, C.J., Robeson, S.M. and Matsuura, K. 2012. A refined index of model performance. International Journal of Climatology. 32(13): 2088-2094.
Wu, Z. and Huang, N.E. 2009. Ensemble empirical mode decomposition: a noise-assisted data analysis method. Advances in Adaptive Data Analysis. 1(01): 1-41.
Zhu, S., Luo, X., Xu, Z. and Ye, L. 2019. Seasonal streamflow forecasts using mixture-kernel GPR and advanced methods of input variable selection. Hydrology Research. 50(1): 200-214.