Compare KNN and M5 decision tree models in anticipation of evaporation and comparison with empirical equations (Case Study of Birjand)

Document Type : Original Article

Authors

1 PhD student of water Science Engineering, University of Birjand

2 Associate professor, Department of water Science Engineering, University of Birjand

Abstract

Evaporation from the soil surface is an important component of the water balance in the arid and semi-arid areas .In this study, to estimate the evaporation from open water surface, the empirical equations of Hefner, Shahtin, Marciano, Tichomirof, Ivanof, America Land Development Authority and Meyer have been used and modified in the study area. KNN model and M5 decision tree model were built ones data mining method to estimate the evaporation from open water surface. In so doing, data from meteorological stations in Birjand, Iran were used for finding the best effective input data on evaporation. Meanwhile, Gamma test was conducted to find the best combination of input parameters for estimating evaporation. To compare the results, the statistics of root mean square error (RMSE), correlation coefficient (R2) and mean absolute error (MAE) were analyzed. The results showed that M5 decision tree model reached the most optimum results than KNN model in most cases but the modified Meyer’s equation for Birjand area represented better estimation of open water surface evaporation due to 0.81 correlation coefficient and 2.06 errors.

Keywords


ﺑﺴﺎﻟﺖﭘﻮر،ع،ا.، حاج عباسی،م،ع.، اﯾﻮﺑﯽ،ش،ا. 1392. اﺳﺘﻔﺎده از آزﻣﻮن ﮔﺎﻣﺎ ﺑﺮای اﻧﺘﺨﺎب ورودی‌های ﺑﻬﯿﻨﻪ در مدل‌سازی ﻣﻘﺎوﻣﺖ ﺑﺮﺷﯽ ﺧﺎک ﺑﺎ اﺳﺘﻔﺎده از شبکه‌های ﻋﺼﺒﯽ ﻣﺼﻨﻮﻋﯽ. ﻣﺠﻠﻪ پژوهش‌های ﺣﻔﺎﻇﺖ آب ‌و خاک ﺟﻠﺪ ﺑﯿﺴﺘﻢ. 1 : 97-114.
رحمتی،ع.، منتظری،م.، گندمکار،ا.، لشنی­زند،م. 1394. پیش‌بینی تبخیر ﺑﺎ اﺳﺘﻔﺎده از ﺷﺒﮑﻪ ﻋﺼﺒﯽ ﻣﺼﻨﻮﻋﯽ و سیگنال‌ها اﻗﻠﯿﻤﯽ در ﺣﻮﺿﻪ دز. ﻓﺼل­ناﻣﻪ ﺗﺤﻘﯿﻘﺎت ﺟﻐﺮاﻓﯿﺎﯾﯽ. ﺳﺎل 30. 2. 117 :262- 274.
سامتی،م.، قهرمان،ن.، قربانی،خ. 1390. کاربرد مدل داده‌کاوی M5 در پیش‌بینی تبخیر  -تعرق پتانسیل (مطالعه موردی: ایستگاه شیراز). اولین کنفرانس ملی هواشناسی و مدیریت آب کشاورزی،کرج، ایران.
ستاری،م،ت.، رضازاده جودی،ع.، نهرین،ف. 1393. پیش‌بینی مقادیر بارش ماهانه با استفاده از شبکه‌های عصبی مصنوعی و مدل درختی M5 (مطالعه موردی: ایستگاه اهر). پژوهش‌های جغرافیای طبیعی. سال 46. 2 : 247-260.
شریفان،ح.، قربانی،خ. 1393. بهبود ﺑﺮآورد ﺗﺒﺨﻴﺮ - ﺗﻌﺮق ﭘﺘﺎﻧﺴﻴﻞ ﺑﺎ اﺳﺘﻔﺎده از ﺿﺮﻳﺐ اﺻﻼﺣﻲ ﺑﻪ ﻛﻤﻚ ﻣﺪل درﺧﺖ ﺗﺼﻤﻴﻢ M5. ﻧﺸﺮﻳﻪ آﺑﻴﺎری و زﻫﻜﺸﻲ اﻳﺮان. 8. 1 :53-61.
شریف آذری،س.، عراقی­نژاد،ش. 1392. ﺗﻮسعه ﻣﺪل ناپارامتری شبیه‌ساز داده‌های ﻣﺎﻫﺎنه ﻫﻴﺪروﻟﻮژﻳﻜﻲ. مجله مدیریت آب و آبیاری. 3. 1: 83-95.
شیرزاد،ا.، ﺳﻠﻄﺎﻧﻲ،ف.، زارع ابیانه،ح. 1387. شبیه‌سازی آب­شستگی در ﭘﺎﻳﺎب سازه‌های مستهلک کننده اﻧﺮژی ﺑﺎ اﺳﺘﻔﺎده از اﻟﮕﻮرﻳﺘﻢ K -نزدیک‌ترین ﻫﻤﺴﺎﻳﮕﻲ (KNN) و سیستم اﺳﺘﻨﺘﺎج ﺗﻄﺒﻴﻘﻲ ﻋﺼﺒﻲ- ﻓﺎزی ( ANFIS). اولین اجلاس بین‌المللی بحران آب. دانشگاه زابل.
طالبی،ع.، اکبری،ز. 1392. بررسی کارایی مدل درختان تصمیم‌گیری در برآورد رسوبات معلق رودخانه‌ای (مطالعه موردی: حوضه سد ایلام). مجله علوم و فنون کشاورزی و منابع طبیعی. علوم آب ‌و خاک. سال 17. 63 : 109-121.
ﻋﻠﻴﺰﺍﺩﻩ،ﺍ. ۱۳۸۳. ﺍﺻﻮﻝ هیدرولوژی کاربردی. ﺍﻧﺘﺸﺎﺭﺍﺕ ﺩﺍﻧﺸﮕﺎﻩ ﺍﻣﺎﻡ ﺭﺿﺎ. ص291 و 237.
ﭘﻨﺠﻤـﻴﻦ ﻛﻨﻔﺮاﻧﺲ ﺳﺮاﺳﺮی آﺑﺨﻴﺰداری و ﻣﺪﻳﺮﻳﺖ ﻣﻨﺎﺑﻊ آب‌ و خاک ﻛﺸﻮر. ﻛﺮﻣﺎن.
قمرنیا،ه.، رضوانی،و.، فتحی،پ. 1391. ارزیابی و واسنجی مدل­های تبخیر و تعرق گیاه مرجع با توجه به اثر دوره محاسباتی برای اقلیم نیمه­خشک سرد. مجله مدیریت آب و آبیاری. 2. 2: 37-25.
ﻣﺸﻜﺎﻧﻲ،ع.، ﻧﺎﻇﻤﻲ،ع. 1388. مقدمه‌ای ﺑﺮ داده‌کاوی. ﻣﺸﻬﺪ. موسسه چاپ و اﻧﺘﺸﺎرات داﻧﺸﮕﺎه ﻓﺮدوﺳﻲ.
یوسف،م.، طالبی،ع.، پورشرعیاتی،ر. 1393. کاربرد هوش مصنوعی در علوم آب و خاک انتشارات دانشگاه یزد.
Agalbjorn,S., Konar,N and Jones,A.J. 1997. A note on the gamma test. Neural Comput ing & Applications. 5. 3: 131-133.
Ahmadi,A., Han,D., Karamouz,M and Remesan,R.  2009.  Input  data  selection for solar radiation  estimation. Hydrological Processes. 23: 2754-2764.
Alberg,D.,Last,M and Kandel,A. 2012. Knowledge discovery in data streams with regression tree methods. WIREs Data Mining Know Discover. 2: 69-78.
Ghabaei sough,M., Mosaedi,A., Hesam,M and Hezarjaribi,A. 2010. Evaluation effect of input parameters preprocessing in artificial neural networks (ANNs) by using stepwise regression and Gamma Test techniques for fast estimation of daily evapotranspiration. Journal of Water and Soil. 24.3: 610-624.
Hand.D., Heikki,M and Padhraic,S. 2001. Principles of Data Mining. A Bradford book. The MIT press. Cambridge, Massachusetts, London, England.
Jagtap,S.S., Lall,U., Jones,J.W., Gijsman,A.J and Ritchie,J.T. 2004.  A Dynamic nearest-neighbor method for estimating soil water parameters. Trans ASAE. 47:1437-1444.
Jain,S.K. Das,A and Srivastsva,D.k. 1999. Application of ANN for reservoir inflow prediction and operation. Journal of Water Resources Planning and Management. 125.5: 263-271.
Moghaddamnia,A., Remesan,R., Hassanpour Kashani,M., Mohammadi,M., Han,D and Piri,J. 2009. Comparison of LLR, MLP, Elman, NNARX and ANFIS Models  with a case study in solar radiation estimation. Journal of Atmospheric and Solar-Terrestrial Physics. 71: 975-982.
Moghaddamnia,A., GhafariGousheh,M., Piri,J., Amin,S and Han,D. 2008. Evaporation estimation using artificial neural networks and adaptive neurofuzzy inference system techniques. Advances in Water Resources. 32: 88-97.
Quinlan,J.R. 1992. Learning with continuous classes. In: Adams, Sterling (Eds.). Proceedings of AI’92. World Scientific. 343-348.
Remesan,R.  Shamim,M.A. and  Han,D.  2008.  Model  data  selection  using gamma  testfor  daily  solar  radiation  estimation.  Hydrological Processes. 22:4301-4309.
Rahimi Khoob,A. 2008.  Artificial neural network estimation of reference evapo transpiration from pan evaporation in a semi-arid environment. Journal of Irrigation Science. 27.1: 35-39.
Singh,D. Ganju,A and Singh,A. 2005. Weather prediction using nearest-neighbor model. Current science. 88: 8. 25.
Twarakavi,N.K.C., Šimůnek,J and Schaap,M.G. 2009. Development of Pedotransfer Functions for Estimation of Soil Hydraulic Parameters using Support Vector Machines. Soil oil Science Society of America Journal. 73:1443-1452.