شماره ركورد :
1080224
عنوان مقاله :
ارزيابي عملكرد رگرسيون چندمتغيره، شبكه عصبي مصنوعي و برنامه‌ريزي بيان ژن در تخمين برخي خصوصيات خاك
عنوان به زبان ديگر :
Assessing Performance of Multivariate Linear Regression (MLR), artificial neural network (ANN) and Gene Expression Programming (GEP) in estimating soil
پديد آورندگان :
محمودآبادي، ابراهيم داﻧﺸﮕﺎه ﻓﺮدوﺳﯽ ﻣﺸﻬﺪ - داﻧﺸﮑﺪه ﮐﺸﺎورزي - ﮔﺮوه ﻋﻠﻮم ﺧﺎك , كريمي، عليرضا داﻧﺸﮕﺎه ﻓﺮدوﺳﯽ ﻣﺸﻬﺪ - داﻧﺸﮑﺪه ﮐﺸﺎورزي - ﮔﺮوه ﻋﻠﻮم ﺧﺎك , حق نيا، غلام حسين داﻧﺸﮕﺎه ﻓﺮدوﺳﯽ ﻣﺸﻬﺪ - داﻧﺸﮑﺪه ﮐﺸﺎورزي - ﮔﺮوه ﻋﻠﻮم ﺧﺎك , سپهر، عادل داﻧﺸﮕﺎه ﻓﺮدوﺳﯽ ﻣﺸﻬﺪ - داﻧﺸﮑﺪه ﻣﻨﺎﺑﻊ ﻃﺒﯿﻌﯽ و ﻣﺤﯿﻂ زﯾﺴﺖ - ﮔﺮوه ﻣﺪﯾﺮﯾﺖ ﻣﻨﺎﻃﻖ ﺧﺸﮏ و ﺑﯿﺎﺑﺎﻧﯽ
تعداد صفحه :
22
از صفحه :
23
تا صفحه :
44
كليدواژه :
ﺷﺒﮑﻪ ﻋﺼﺒﯽ ﻣﺼﻨﻮﻋﯽ , ﺳﻨﺠﺶ از دور , ﻣﺪل اﺳﮑﻮرﭘﻦ , اﻟﮕﻮرﯾﺘﻢ ﺑﯿﺎن ژن , ﻣﺪل ﺳﺎزي ﺧﺎك
چكيده فارسي :
سابقه و هدف: با ظهور سيستم‌هاي كامپيوتري در كنار سامانه‌ اطلاعات جغرافيايي و دسترسي به داده‌هاي رقومي مكاني، روش‌هاي مختلف داده‌كاوي، مدل‌سازي و تخمين خصوصيات خاك، جايگاه خود را در علوم خاك و پدومتري باز كرده است. داده‌كاوي خصوصيات خاك با استفاده از روش‌هاي آماري كامپيوتر- محور به كشف الگوهاي پنهان در بانك اطلاعاتي داده‌ها مي‌پردازد كه در نهايت منجر به برازش مدل به منظور استفاده و تخمين خصوصيات خاك مي‌گردد. يكي از كاربردهاي مهم اين روش‌ها استفاده در معادله اسكورپن مي‌باشد. دو جز اصلي معادله اسكورپن شامل متغيرهاي محيطي و برنامه يادگيري مي‌باشد. اين مطالعه با هدف ارزيابي و مقايسه سه مدل عددي شامل روش رگرسيون چندگانه خطي، شبكه عصبي مصنوعي و برنامه‌ريزي بيان ژن به عنوان برنامه يادگيري (تابع f) در معادله اسكورپن با استفاده از داده‌هاي دورسنجي، توپوگرافي و پوشش گياهي به عنوان داده‌هاي كمكي به منظور تخمين خصوصيات خاك از جمله كربنات كلسيم معادل، رس، چگالي ظاهري، نيتروژن كل، كربن آلي، شن، سيلت و ظرفيت رطوبت اشباع انجام گرفت. مواد و روش‌ها: اين پژوهش، در مراتع بخش باجگيران در استان خراسان رضوي و با مساحت 1225 هكتار انجام شد. به منظور بررسي پوشش گياهي و خاك، تعداد 137 واحد مورد بررسي قرار گرفت. در هر واحد كاري 3 تا 5 پلات با فاصله 10 متر و در امتداد يك برش انتخاب شدند و نوع و تعداد گونه گياهي و درصد پوشش گياهي درون پلاتها ثبت گرديد. سپس يك نمونه خاكي در هر برش و در مجموع 137 نمونه خاكي از سطح منطقه مورد مطالعه برداشته شد. داده‌هاي توپوگرافي منطقه از نقشه DEM، داده‌هاي طيفي و باندهاي مختلف از تصاوير سنجنده ETM و شاخص‌هاي تنوع گياهي و درصد پوشش گياهي اندازه‌گيري شد و به عنوان متغيرهاي كمكي در پيش‌بيني كربنات كلسيم معادل، رس، چگالي ظاهري، نيتروژن كل، كربن آلي، شن، سيلت و ظرفيت رطوبت اشباع به كار گرفته شدند. به منظور كاهش تعداد داده ورودي در شبكه عصبي مصنوعي و برنامه‌ريزي بيان ژن از نتايج PCR استفاده گرديد سپس عمليات نرمال‌سازي و استانداردسازي بر روي داده‌ها صورت گرفت. يافته‌ها: نتايج حاصل از ارزيابي مدل‌هاي رگرسيون چندگانه، شبكه عصبي مصنوعي و برنامه‌ريزي بيان ژن براساس آماره‌هاي ارزيابي شامل ميانگين اريبي خطا (MBE)، ريشه ميانگين مربعات خطا (RMSE) و ضريب تبيين (R2) در فاز آزمون نشان داد كه شبكه عصبي مصنوعي پرسپترون، با توجه به مقادير ضريب تبيين بالاتر براي كربنات كلسيم، رس، نيتروژن كل، كربن آلي، شن، سيلت، ظرفيت رطوبتي و چگالي ظاهري به ترتيب با مقادير 72/0، 46/0، 67/0، 77/0، 62/0، 7/0، 85/0 و 69/0 و همچنين مقادير خطاي RMSE كمتر با مقادير به ترتيب 46/7، 46/4، 03/0، 27/0، 6/5، 55/3 و 4/ 3 درصد براي كربنات كلسيم معادل، درصد رس، نيتروژن كل، كربن آلي، درصد شن، درصد سيلت، ظرفيت رطوبت اشباع و 08/0 گرم بر سانتي مترمكعب براي چگالي، بهترين نتايج را از بين روشهاي مورد مقايسه نشان داد. روش شبكه عصبي مصنوعي توانست 60 تا 85 درصد تغييرپذيري خصوصيات مورد بررسي را نشان دهد كه از بين خصوصيات مختلف، بهترين تخمين براي ظرفيت رطوبت اشباع خاك با 85/0R2= و كربن آلي با 77/0R2= بود. نتيجه‌گيري: نتايج ارزيابي تخمين خصوصيات خاك از طريق سه مدل عددي كه بهترين نتايج بدست آمده براي مدل شبكه عصبي مصنوعي پرسپترون بدست آمد. نتايج اعتبارسنجي مدل شبكه عصبي مصنوعي نشان داد كه مقدارMBE مدل براي متغيرها نزديك به صفر بوده و اين امر مؤيد اين مطلب است كه برازش، توسط مدل ايجاد شده نااريب بوده است. مقدار RMSE پايين مدل نيز نشان دهنده دقت مناسب و قابل قبول برآورد براي متغيرهاي خاك مي‌باشد. نتايج الگوريتم بيان ژن نيز حاكي از دقت بالاتر اين روش نسبت به رگرسيون خطي براي اكثر خصوصيات خاك بود.
چكيده لاتين :
Background and Objectives: With the emergence of computers and geographic information system (GIS), as well as access to spatial digital data, different methods of data mining, modeling and estimation of soil properties found their place in soil sciences. Data mining of soil properties using computer-based statistical methods uncovers hidden patterns in the database which ultimately leads to the fitness of a model for estimation of soil properties. These methods can be used in the scorpan equation. Two main components of scorpan model include environmental variables and learning program. In the present study, three different methods including multiple linear regression (MLR), artificial neural network (ANN) and Gene Expression Programming (GEP) as “f’ function in scorpan model were evaluated and compared in estimating of soil properties using auxiliary data such as vegetation data, topography and remote sensing data. Material and methods: The study area with an area of 1225 ha was located in Bajgiran rangelands, Khorasan Razavi province, Iran. In order to investigate vegetation cover and soil 137 units were investigated in which 3-5 plots were selected with a distance of 10 meters apart along an accidental transect, and plant species names and numbers besides vegetation percentage were recorded. Next, one soil sample was taken from each transect (Totally 137 soil sample). Train attributes derived from digital elevation model; different bands derived from the ETM and used for computing spectral indices; and plant diversity indices were calculated using Simpson and Shannon-Wiener. These obtained parameters were used as covariate in estimating calcium carbonate equivalent, clay, density, nitrogen, carbon, sand, silt and saturated moisture capacity. Data deduction was done by PCA analysis to deduct the number of input data for ANN and GEP models, and finally, Normalization and standardization were carried out on the data. Results: The results obtained from the evaluation of three numerical methods based on root mean square error (RMSE), mean bias error (MBE) and coefficient of determination (R2) showed that ANN model had the highest accuracy in estimating soil properties, given the higher coefficients of determination for calcium carbonate equivalent , clay, density, nitrogen, carbon, sand, silt and saturated moisture capacity with the values of 0.72, 0.46, 0.69, 0.67, 0.77, 0.62, 0.7 and 0.85, respectively, moreover, lower RMSE with the values of 7.46, 4.46, 0.08, 0.03, 0.27, 5.6, 3.5 and 3.4, respectively. ANN could explain 60-85 percent of variability of soil properties, among which the best estimates were for saturated moisture capacity and soil organic carbon with R2 = 0.85 and R2 = 0.77, respectively. Conclusion: Evaluating the estimation of soil properties through three numerical models introduced ANN as the most accurate model. ANN validation results showed that mean bias error (MBE) for estimated soil properties were close to zero, and this confirms that the fitting has been created unbiased by model. Furthermore, the low RMSE of model verified accurate estimation of soil variables. The results also indicate that GEP had higher accuracy than the linear regression method for most soil properties.
سال انتشار :
1396
عنوان نشريه :
پژوهش هاي حفاظت آب و خاك
فايل PDF :
7669419
عنوان نشريه :
پژوهش هاي حفاظت آب و خاك
لينک به اين مدرک :
بازگشت