عنوان پایان‌نامه

کاربرد چند الگوریتم داده کاوی در تخمین تبخیر تعرق پتانسیل



    دانشجو در تاریخ ۱۹ بهمن ۱۳۹۰ ، به راهنمایی ، پایان نامه با عنوان "کاربرد چند الگوریتم داده کاوی در تخمین تبخیر تعرق پتانسیل" را دفاع نموده است.


    محل دفاع
    کتابخانه مرکزی پردیس کشاورزی و منابع طبیعی شماره ثبت: 4797;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 52302
    تاریخ دفاع
    ۱۹ بهمن ۱۳۹۰
    دانشجو
    مهسا سامتی
    استاد راهنما
    نوذر قهرمان

    بین اجزاء مختلف چرخه هیدرولوژی، اندازه گیری تبخیرتعرق پتانسیل با توجه به واکنش های بین خاک- هوا و گیاه مشکل است. مدلهای فیزیکی و نیمه تئوری پیشنهاد شده برای مدلسازی تبخیرتعرق پتانسیل ، اغلب پیچیده بوده و به متغیرهای هواشناسی زیادی نیاز دارند. به همین دلیل مدلها و تکنیک های دیگری نظیر رگرسیون چندگانه، تحلیل عاملی، شبکه عصبی مصنوعی و روش های نوین داده کاوی جهت برآورد این کمیت و تعیین عوامل تاثر گذار به کار می روند. اخیرا روش های جدید داده کاوی به طرز موفقیت آمیزی در علوم محیطی استفاده شده اند. داده کاوی فرایندی تحلیلی است که برای کاوش داده ها ( معمولا حجم عظیمی از داده ها) صورت می‌گیرد و یافته‌ها ‌با به‌کارگیری الگوهایی‌، اعتبارسنجی می‌شوند. بطورکلی اهداف این مطالعه، تعیین موثرترین متغیرهای موثر بر مدلسازی تبخیرتعرق پتانسیل، بهبود مدل های تبخیرتعرق پتانسیل با بکارگیری چند الگوریتم داده کاوی، آزمون عمکرد مدل در ایستگاه های مختلف و بررسی موثر بودن الگوریتم های داده کاوی درتخمین دمای بیشینه و کمینه بعنوان متغیرهای مهم موثر بر تبخیرتعرق پتانسیل می باشد. به این منظور، از داده های روزانه ی 7 ایستگاه دارای آمار طویل المدت و معتبر سازمان هواشناسی کشور شامل بوشهر، تبریز، تهران، زاهدان، کرمان، کرمانشاه و مشهد در دوره آماری 1995-2004 استفاده گردید. این داده ها شامل : بارش، دمای بیشینه، دمای کمینه و متوسط دما، متوسط رطوبت نسبی، متوسط سرعت باد، متوسط فشار بخار، ساعات آفتابی و در صورت امکان تابش، هستند. تبخیرتعرق پتانسیل به روش های پنمن-مونتیث و هارگرویز-سامانی محاسبه شده و سپس از الگوریتم های داده کاوی M5، M5Rules، REPTree، Kstar، ANN، CART و CHAID به منظور برآورد تبخیرتعرق استفاده شده و عملکرد آنها با استفاده از شاخص¬های آماری آزمون شده است. نتایج نشان داد در روش پنمن-مونتیث به جز ایستگاه تهران، در تمامی ایستگاهها، مدل درختی M5P بهترین عملکرد را در بین الگوریتم ها داشته است. پس از مدل درختی M5P، الگوریتم های M5Rules و سپس ANN رتبه های دوم و سوم را به خود اختصاص داده اند.در تمامی ایستگاه ها، متغیرهای اصلی موثر بر تبخیرتعرق پتانسیل متوسط دمای روزانه، ساعات آفتابی و سرعت باد تعیین شدند. در ایستگاههای بوشهر، تبریز، تهران، کرمانشاه و مشهد از دمای نقطه شبنم و در ایستگاه زاهدان از فشاربخار واقعی استفاده شده است. در ایستگاه های زاهدان، کرمان، کرمانشاه و مشهد، متوسط رطوبت نسبی نیز از متغیرهای تاثیرگذار بوده است. در روش هارگرویز-سامانی، استفاده از دمای بیشینه و کمینه بجای متوسط دما، عملکرد را بهبود بخشید. سه الگوریتم برتر در این روش عبارت بودند از M5P، M5Rules و ANN. دراین روش نیز متغیرهای مشترک موثر بر تبخیرتعرق پتانسیل متوسط دمای بیشینه و کمینه، ساعات آفتابی و سرعت باد بودند.در مدلسازی دمای بیشینه و کمینه، در ایستگاه های مطالعاتی، معادله منتخب از ترکیب متفاوتی از متغیرها بدست آمد. اما بطور کلی عملکرد مدل درختی M5P در مدلسازی دمای بیشینه بالاتر از دمای کمینه بود. در مدلسازی دمای بیشینه، متغیرهای مشترک در تمامی ایستگاه ها شامل ساعات آفتابی، متوسط رطوبت نسبی و فشاربخارواقعی بودند و موثرترین متغیر متوسط رطوبت نسبی بود. نتیجه مدلسازی دمای کمینه نیز نشان داد متغیرهای مشترک شامل دمای کمینه روز قبل، متوسط رطوبت نسبی و ساعات آفتابی و موثرترین متغیر متوسط رطوبت نسبی بود.
    Abstract
    By considering interactions between soil-air and plant, the measurement of evapotranspiration, which is an important part of the water cycle, is difficult. The physical and semi-theoretical methods that have been proposed for modeling of potential evapotranspiration, are highly complex and require lots of meteorological variables. Hence, other models and techniques like multivariate regression, principle factor analysis, artificial neural network and new methods of data mining have been used for estimating evapotranspiration and determination of most significant important factors that influence on it. Recently, data mining approaches has been used successfully in environmental sciences. Data mining is an analytic process that is used for searching data (usually huge volume of data) and achievements validate by application of some algorithms.The purpose of this study is determining the most significant variables affecting potential evapotranspiration, and investigating efficiency of data mining algorithms in estimating maximum and minimum temperature. in eight study stations as. Daily data of 7 stations including Bushehr, Tabriz, Tehtan, Zahedan, Kerman, Kermanshah and Mashhadduring the period of 1996-2004 have been used. These data include: precipitation, maximum, minimum and mean temperature, average of relative humidity, wind speed, average of vapor pressure, sunshine hours and probably radiation. By using meteorological data of different stations, data mining algorithms of M5P, M5Rules, REPTree, Kstar, ANN, CART and CHAID have been used to estimate evapotranspiration and their performance was investigated through statistical indices. Resaults showed that in Penman-Monteith method, except Tehran station, M5P model tree had the highest performance between other algorithms. Next to M5P model tree, M5Rules and ANN ranked as second and third in performance. In all stations, the most important and main variables that influence on evapotranspiration were average of air temperature, sunshine hours and wind speed. Except Kerman station, in all other stations only average of dew point temperature or actual vapor pressure has been used because of their high correlation. In Bushehr, Tabriz, Tehran, Kermanshah and mashhad stations average of dew point temperature and in zahedan station, average of relative humidity has been used. In Zahedan, Kerman, Kermansheh and Mashhad, average of relative humidity was also significant.In Hargreaves-samani method, using maximum and minimum temperature instead of average of daily temperature improved performance of model. Three better algorithms in this method were M5P, M5Rules and ANN. In this method the common variables that influence on evapotranspiration were maximum and minimum temperature, sunshine hours and wind speed. Except Bushehr station, in other stations the actual vapor pressure was important. Then, In Bushehr station, average of relative humidity, in Tabriz station average of relative humidity, dew point temperature and precipitation, in Tehran station, dew point temperature and in Kermansheah station average of relative humidity and dew point temperature were important variables. Generally Penman-Monteith did a better job comparing to Hargreaves-Samani method. In modeling of maximum and minimum temperature, the best performance gained from different combination of variables but in general in all stations most significant variables were sunshine hours, average of relative humidity and actual vapor pressure and relative humidity was the most important variable. In modeling of minimum temperature, common effective variables were minimum temperature of previous day, average of relative humidity and sunshine hours and average of relative humidity was the most important variable.