عنوان مقاله :
مقايسه عملكرد مدلهاي درختي و شبكه عصبي بهمنظور يافتن دادههاي گمشده تبخير از تشت در استان خوزستان
عنوان فرعي :
Comparison between neural network and M5 model tree for reconstructing missing evaporation data of Khuzestan
پديد آورندگان :
وهابيمشهور، مرجان نويسنده دانشآموخته كارشناسيارشد گروه مهندسي آبياري و زهكشي، پرديس ابوريحان، دانشگاه تهران Vahabi Mashhor, M. , رحيميخوب، علي نويسنده استاد گروه مهندسي آبياري و زهكشي، پرديس ابوريحان، دانشگاه تهران Rahimi Khoob, A.
اطلاعات موجودي :
فصلنامه سال 1394 شماره 0
كليدواژه :
Missing data , Neural network model , Reconstructing data , Tree model , بازسازي دادهها , خوزستان , دادههاي گمشده هواشناسي , مدل شبكه عصبي مصنوعي , Khuzestan , مدل درختي
چكيده فارسي :
سابقه و هدف: دادههاي تبخير از تشت براي برآورد نياز آبي گياهان استفاده ميشود ولي اين دادهها در بعضي موارد بهعلت عدم دقت لازم در اندازهگيريها و يا خرابي تجهيزات ناقص شده و بهعنوان دادههاي گمشده از آن ياد ميگردد. از آنجاييكه پيوستگي دادهها براي برنامهريزي آبياري مهم است، بنابراين ضرورت دارد اين نواقص آماري برطرف گردد. روشهاي زيادي براي يافتن دادههاي گمشده مورد استفاده قرار گرفتند در اين ميان مدلهاي درختي و شبكههاي عصبي از دقت خوبي برخوردار بودهاند ولي تاكنون اين دو روش مورد مقايسه و ارزيابي قرار نگرفتند. هدف از انجام اين پژوهش مقايسه دو مدل درختي و شبكههاي عصبي براي بازسازي دادههاي گمشده تبخير روزانه
4 ايستگاه هواشناسي استان خوزستان است.
مواد و روشها: در اين پژوهش دادههاي مورد نياز از 4 ايستگاه هواشناسي شامل آغاجاري، بندر ماهشهر، ايذه و بستان واقع دراستان خوزستان جمعآوري شد. اقليم اين ايستگاهها براساس طبقهبندي دومارتن خشك ميباشد. دادهها مربوط به سالهاي 1997 تا 2008 ميلادي و شامل مقادير روزانه تبخير از تشت، سرعت باد، حداكثر و حداقل دماي هوا، رطوبت نسبي هوا، ساعات آفتابي و تابش برونزميني بودند. اين دادهها به دو دوره چهار ساله (2005 تا 2008) و 12 ساله (1997 تا 2008) تقسيم شدند و در هر دوره پس از حذف عمدي 5%، 10% و 20% دادههاي اندازهگيري شده، مقادير آنها با استفاده از مدلهاي درختي و شبكه عصبي برآورد شدند و نتايج اين دو مدل با استفاده از شاخصهاي آماري مورد مقايسه قرار گرفتند.
يافتهها: در مدل درختي مقادير ضريب تبيين براي دوره 4 ساله با حذف 5%، 10% و 20% دادهها بهترتيب برابر 85/0، 75/0 و 85/0 و براي دوره 12 ساله برابر 90/0، 83/0 و 84/0 بهدست آمد. در مورد مدل شبكه عصبي مقادير ضريب تبيين براي دوره 4 ساله با حذف 5%، 10% و 20% دادهها بهترتيب برابر 85/0، 75/0 و 85/0 و براي دوره 12 ساله برابر 90/0، 82/0 و 85/0 بهدست آمد. بيشتر بودن مقادير ضريب تبيين براي دوره آماري 12 ساله نشان داد، مدلها هنگام تخمين دادههاي گمشده براي دورههاي آماري طولانيتر داراي عملكرد بهتري هستند. با افزايش دادههاي گمشده از 5% به 20% نيز از دقت اين مدلها كاسته شد. همچنين مقايسه اين دو مدل نشان داد كه هردو داراي دقت مشابهي در برآورد دادههاي گمشده ميباشند.
نتيجهگيري: با توجه به نتايج بهدست آمده از اين پژوهش، هر دو مدل شبكه عصبي و درختي در صورت موجود بودن بيش از 10 سال دادههاي آماري، نتايج نسبتاً مطلوبي خواهند داشت. همچنين هنگامي كه تعداد دادههاي گمشده كمتر باشند و يا در بازههاي كوتاهتري گم شده باشند، مقادير تخمين زده شده به مقادير واقعي نزديكتر خواهد بود. بهمنظور بهبود و تكميل نتايج اين پژوهش پيشنهاد ميشود تخمين دادههاي گمشده براي دورههاي آماري مختلف نظير 8 و يا 15 سال نيز تكرار و بهترين دوره آماري براي بهترين عملكرد مدلها مشخص گردد.
چكيده لاتين :
Background and Objectives: Pan Evaporation data was used to estimate crop water requirements, but in some cases due to lack of accurate data on measurements or defective equipments failure and lost data were referred as missing data. Since data integration is important for irrigation planning, it is necessary to correct the statistical errors. Many methods were used for finding missing data, In the meantime, neural network and tree models have high degree of accuracy, however these models were not compared and evaluated. The aim of this study is to compare the model tree and neural network for reconstructing missing daily evaporation data for four stations in Khuzestan province.
Materials and Methods: In this study, the required data from four stations include Aghajari, Bandar Mahshahr, Izeh and Bostan located in Khuzestan province were collected. On the basis of the Koppen climate classification, the climate of these stations is arid. The data related to the years 1997 to 2008 that include daily values of pan evaporation, wind speed, maximum and minimum air temperature, relative humidity, sunshine and the extraterrestrial radiation. The data were divided to two four-year period (2005 to 2008) and 12 years (1997 to 2008) and at any period after intentional removal of 5%, 10% and 20% of the measured data, their values were estimated with the use of tree and neural network models. The results of the model were compared using statistical indices.
Results: In tree model coefficient of determination for four years period were: 85%, 75% and 85% and for 12 years period were: 90%, 83% and 84% respectively. In neural network model coefficient of determination for 4 years period were: 85%, 75% and 85% and for 12years period were: 90%, 82% and 85% respectively. A higher coefficient value for 12 years period showed that models are more accurate to estimate missing data for longer term statistical data. By increasing missing data from 5% to 20%, accuracy of models was diminished. This research also indicated that both models have similar accuracy in the estimation of missing data.
Conclusion: According to the results of this study, when more than 10 years of data are available, both neural network and tree models will have relatively good results. Also, when the number of missing data are less or missed in shorter periods, estimated values will be closer to the actual values. In order to improve and complete results, it is suggested that statistical estimates of missing data for different periods, such as 8 or 15 years are repeated and are the best period to determine for best practice models.
عنوان نشريه :
پژوهش هاي حفاظت آب و خاك
عنوان نشريه :
پژوهش هاي حفاظت آب و خاك
اطلاعات موجودي :
فصلنامه با شماره پیاپی 0 سال 1394
كلمات كليدي :
#تست#آزمون###امتحان