بررسی تاثیر پیش‌پردازش داده‌ها و عوامل مدل‌سازی برنامه‌ریزی بیان‌ژن در دقت پیش‌بینی سری‌های ‌زمانی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 کارشناس ارشد مهندسی منابع آب، پردیس کشاورزی و منابع طبیعی، دانشگاه رازی، کرمانشاه، ایران

2 استادیار گروه مهندسی آب، پردیس کشاورزی و منابع طبیعی، دانشگاه رازی، کرمانشاه، ایران

چکیده

سری‌‌زمانی هیدرولوژیک عاملی وابسته به زمان است که یافتن نحوه تغییرات و پیش‌بینی آن مهم‌ترین هدف تجزیه و تحلیل سری‌های‌زمانی می‌باشد. هدف این تحقیق بررسی همزمان خصوصیات سری‌زمانی و پیش‌پردازش آنها و پارامترهای مهم مدل برنامه‌ریزی بیان‌ژن جهت پیش-بینی‌های با دقت بالا در مراحل آموزش و صحت‌سنجی می‌باشد. در این پژوهش از سری‌های‌زمانی عمق آب زیرزمینی ایستگاه دشت چمچمال واقع در استان کرمانشاه با دوره‌زمانی 12‌ساله و اقلیم کوهستانی و سری‌زمانی ماهانه دمای آلاسکا با دوره‌زمانی 50‌ساله و اقلیم سرد و خشک استفاده شده‌است. برای مدل‌سازی سری‌های‌‌زمانی مذکور از نرم‌‌افزارGenexprotools5.0 استفاده‌شده‌است.
نتایج این تحقیق، نشان‌داد تناوبی بودن خصوصیات داده موجود در سری‌زمانی دما، سبب بروز نتایج همبستگی بالای 90% در مراحل مختلف آموزش و صحت‌سنجی گردید به‌طوریکه اثر پارامترهای مختلف بیان‌ژن کمتر از 10‌درصد در بهبود نتایج می‌باشد. از سوی دیگر با بررسی سری-زمانی عمق آب زیرزمینی که فاقد خصوصیت تناوبی و دارای شکلACF نزولی است، نتایج پیش‌بینی مدل GEP با هر پارامتر تاثیرگذار بیان‌ژن،R بیش از 44% در مرحله صحت‌سنجی حاصل‌نشد. این بدان معنی است که پیش‌پردازش سری‌زمانی اثرگذاری بیشتری در نتایج پیش-بینی دارد. به‌طوریکه با حذف ترم تناوب نتایج پیش‌بینی در همه مراحل مدل‌سازی به طرز معنی‌داری کاهش‌می‌یابد. در این حالت بهترین R‌ برای قسمت صحت‌سنجی50 درصد می‌باشد.

کلیدواژه‌ها


عنوان مقاله [English]

Assessment effects of data preprocessing and modeling parameters of Gene Expression Programming on accuracy of time series forecasting

نویسندگان [English]

  • maryam salehi 1
  • Seyed Ehsan Fatemi 2
1 Master of Water Resources, Water Engineering Department, Campus of Agricultur and Natural Resources, Razi University, Iran
2 Assistant Professor, Water Engineering Department, Campus of Agricultur and Natural Resources, Razi University, Iran
چکیده [English]

Hydrological time-series is a time-dependent hydrological variable that finding the model of changes and predicting is the most important goal of time-series analysis. The purpose of this study is to simultaneously study the characteristics of time series and their prediction and the important parameters of the GEP for high-precision predictions in the training and validation. In this study, groundwater depth time-series of Chamchamal plain station located in Kermanshah province with a 12-year period and mountainous climate and the monthly time-series of Alaska temperature with a 50-year period and cold and dry climate have been used. Genexprotools5.0 software has been used to model time-series by GEP.
The results of studying with GEP showed that the periodicity of data properties that existed in the time series of temperature caused correlation results above 90% in different stages of training and validation. So that the effect of different parameters of GEP is less than 10% in improving results. On the other hand, by examining the time-series of groundwater depth, which lacks periodicity and has a descending ACF shape, the prediction results of the GEP with any effective expression parameter, R more than 44% in the validation wasn't obtained. This means that the time-series preprocessing has a greater impact on the prediction results. So that by eliminating the semester, the prediction results in all stages of modeling are significantly reduced. In this case, the best R for the validation is 50%.

کلیدواژه‌ها [English]

  • time series
  • Gene expression
  • Forecasting
  • Periodicity
  • preprocessing
امامقلی زاده، ص.، کریمی‌دمنه.، ر. و مهدی پناه، ح. 1395. برآورد رواناب حوضه آبریز کسیلیان با استفاده از روش برنامه­ریزی بیان ژن. مجله مطالعات منابع طبیعی،محیط‌زیست و کشاورزی. 2 (4 و5): 1-7.
ثانی خانی، ه.، نیک پور، م.، فرسادی‌زاده، د. و معیری م.م. 1394. پیش‌بینی بار معلق رودخانه با استفاده از سامانه‌های هوشمند. مجله پژوهش آب ایران. 9(2):165-168.
جعفر زاده، ج.، رستم زاده، ه. و اسدی، ا. 1396. مدل‌سازی زمانی تراز آب زیرزمینی با استفاده از روش‌های پایه تحلیل سری‌‌های زمانی (مطالعه موردی: دشت اردبیل). نشریه دانش آب‌وخاک. 27(4): 185-196 .
حافظ پرست مودت،م. و رحیمی، ب. 1399. مقایسه مدل‌های SVM ، GEP و IHACRES در پیش‌بینی تغییرات رواناب ناشی از تغییر اقلیم (مطالعه موردی: سد جامیشان). نشریه تحقیقات آب‌وخاک ایران. 59(10): 2483-2499.
خادم پور، ف. خاشعی سیوکی، ع. و امیرآبادی زاده، م. 1397. بررسی عملکرد روش برنامه‌ریزی بیان ژن در پیش‌بینی تابش خورشیدی روزانه در گستره ایران. نشریه پژوهش‌های اقلیم‌شناسی. 9(36): 43-56.
زمانی، ر.، احمدی، ف. و رادمنش، ف.، 1393. مقایسه روش­های برنامه­ریزی بیان ژن، سری زمانی غیرخطی، خطی و شبکه عصبی مصنوعی در تخمین دبی روزانه (مطالعه موردی: رودخانه کارون)، نشریه آب‌وخاک (علوم و صنایع کشاورزی). 28 (6) : 1172-1182.
سلگی، ا.، زارعی، ح.، دارابی، م. و ده کهنه، ص. 1397. پیش­بینی بارش ماهانه با استفاده از مدل­های برنامه­ریزی بیان ژن و ماشین بردار پشتیبان، نشریه تحقیقات کاربردی علوم جغرافیایی. 18 (50):091-103.
ظهیری، ع. و قربانی، خ. 1392. شبیه‌سازی دبی جریان در مقاطع مرکب به کمک مدل درخت تصمیمM5 . نشریه پژوهش‌های حفاظت آب‌وخاک.20 (3):113-132.
عباسی، ع.، خلیلی،ک.، بهمنش، ج. و شیرزاد، ا. 1399. کاربرد برنامه‌ریزی بیان ژن در پیش‌بینی خشک‌سالی ( مطالعه موردی: ایستگاه سینوپتیک تبریز). مجله محیط‌زیست و مهندسی آب. 5 (1):1-14.
علی دادی ده کهنه، ص.، سلگی، ا.، شهنی دارابی، م. و زارعی، ح. 1398. ارزیابی مدل‌های ژنتیکی جهت مدل‌سازی جریان رودخانه. مهندسی آبیاری و آب ایران, 9(35 ): 1-17.
قبادیان، ر.، قربانی، م.ع. و خلج م. 1392. بررسی عملکرد روش برنامه­ریزی بیان ژن درروند یابی سیلاب رودخانه زنگمار در مقایسه با روش موج دینامیکی. نشریه آب‌وخاک (علوم و صنایع کشاورزی) 27 (3): 592-602 .
کاوه کار، ش.، نعمتی، س. و ازانی. ع. 1392. ساختار درختی برنامه‌ریزی بیان ژن جهت شبیه‌سازی نوسانات تراز آب، کنفرانس بین‌المللی عمران، معماری و توسعه پایدار شهری، تبریز، دانشگاه آزاد اسلامی واحد تبریز.
مهدی زاده، س.، 1396. مدل‌سازی و پیش‌بینی برخی از پارامترهای مورد استفاده در مدیریت آب و کشاورزی با استفاده از مدل‌های هوش مصنوعی و تلفیق مدل‌های مذکور با روش‌های استوکاستیک. رساله دکتری تخصصی. دانشگاه ارومیه.
یونسی، م. و نوذری، ح. 1399. ارزیابی مدل‌های تلفیقی شبکه‌ی عصبی مصنوعی-موجک و برنامه‌ریزی بیان‌ژن-موجک در پیش‌بینی کردن خشک‌سالی کوتاه‌مدت. نشریه پژوهش‌های آبخیزداری (پژوهش و سازندگی). 33(1): 39-55.
 
 
 
Adib A., Mahmoudian Kafshgar Kalaee M., Mahmoudian Shoushtari M., Khalili K. 2017. Using of gene expression programming and climatic data for forecasting flow discharge by considering trend, normality, and stationarity analysis. Arabian Journal of Geosciences 10(9): 208.
Aytek A., Kisi O. 2008. A genetic programming approach to suspended sediment modeling. Journal of Hydrology 351(3-4): 288-298.
Azamathulla H.Md., Zahiri A. 2012. Flow discharge prediction in compound channels using linear genetic programming. Journal of Hydrology.454-455(6): 203-207.
Ferreira C. 2001. Gene expression programming: a new adaptive algorithm for solving problems.complex Systems.13 (2):87-129.
Ferreira C. 2006. Gene expression programming: Mathematical Modeling by an Artifical Intelligence. 2nd edn. Springer-Verlag Germany.463 p.
Lopes H.S., Weinert W.R. 2004. EGIPSYS: An enhanced gene expression programming approach for symbolic regression problems. International Journal of Applied Mathematics and Computer Science, 14(3): 375-384.
Moeeni H., Bonakdari H., Fatemi S.E., Zaji A.H. 2017. Assessment of Stochastic Models and a Hybrid Artificial Neural Network-Genetic Algorithm Method in Forecasting Monthly Reservoir Inflow. INAE Letters. 2(1): 13-23.
Moeeni, H., Bonakdari H., Fatemi, S.E, 2017.  Stochastic model stationarization by eliminating the periodic term and its effect on time series prediction. Journal of Hydrology. 547: 348-364.
Salas J. D., Delleur j.w, Yevjevich v. and Lane,w.l. 1996. Applied Time Series in Hydrology, Mc Graw Hill.
Shiri J., Kisi O. 2011. Comparison of genetic programming with neuro-fuzzy systems for predicting short-term water table depth fluctuations. Comput. Geosci. 37: 1692-1701.
Traore S., Guven A. 2012. Regional-specific numerical models of evapotranspiration using gene-expression programming interface in Sahel. Water Resources. Management. 26: 4367-4380.
Wang Sh., Lian J., Peng Y., Hu B., Chen H. 2019. Generalized reference evapotranspiration models with limited climatic data based on random forest and gene expression programming in Guangxi, China. Agricultural Water Management. 221: 220–230.