شماره ركورد :
960146
عنوان مقاله :
انتخاب ويژگي‌هاي مؤثر بر برخي شاخص‌هاي كيفيت فيزيكي خاك و پيش‌بيني آن‌ها با درخت تصميم و رگرسيون چند متغيره خطي
عنوان فرعي :
Determining Features Influencing Some Soil Physical Quality Indicators and their Predictions Using Decision Tree and Multiple Linear Regression Models
پديد آورنده :
شكفته حسین
پديد آورندگان :
دوستكی مریم نويسنده دانشجوی دكتری گروه خاكشناسی، دانشگاه ولیعصر رفسنجان، ایران doustaky maryam , مسعودي اعظم نويسنده
سازمان :
استادیار گروه خاكشناسی، دانشگاه جیرفت، ایران
تعداد صفحه :
16
از صفحه :
327
تا صفحه :
342
كليدواژه :
ظرفيت هوايي , ظرفيت زراعي نسبي , مدل‌سازي , مديريت خاك , آب قابل‌دسترس
چكيده فارسي :
اثر راهكارهای مدیریتی و استفاده از اراضی روی كیفیت خاك با شاخص¬های كیفیت فیزیكی خاك تعیین می¬شود كه با ویژگی¬های فیزیكی- شیمیایی تخمین زده می¬شوند. جهت پیش‌بینی این شاخص¬ها، انتخاب ویژگی‌های مؤثر بر آن¬ها امری ضروری می‌باشد. مسأله انتخاب زیرمجموعه ویژگی‌ها، به مفهوم شناسایی و انتخاب یك زیرمجموعه مفید از ویژگی‌ها از میان مجموعه داده اولیه می‌باشد. در این مطالعه از ضریب همبستگی پیرسون برای انتخاب ویژگی¬های مؤثر بر شاخص¬های كیفیت فیزیكی خاك (از جمله؛ ظرفیت هوایی (AC)، ظرفیت زراعی نسبی (RFC) و آب قابل دسترس گیاه (PAWC)) استفاده شد و در ادامه پیش¬بینی این شاخص¬های كیفیت با الگوریتم درخت تصمیم رگرسیونی و رگرسیون چند متغیره خطی انجام شد. بدین منظور از 104 نقطه از چهار اراضی باغ، جنگل، مرتع و زراعی شهرستان رابر واقع در استان كرمان نمونه¬برداری شد و پارامترهای از جمله؛ بافت، تخلخل، چگالی ظاهری و حقیقی، هدایت هیدرولیكی، اسیدیته كربنات كلسیم، ظرفیت هوایی، ظرفیت زراعی نسبی و آب قابل دسترس اندازه¬گیری شدند. نتایج نشان داد برای ظرفیت هوایی، ویژگی¬های تخلخل، چگالی ظاهری، رس و شن، برای ظرفیت زراعی نسبی، تخلخل، شن، رس و سیلت و برای آب قابل دسترس گیاه، چگالی ظاهری، رس، قابلیت هدایت الكتریكی، تخلخل، شن و سیلت به عنوان پارامترهای ورودی مهم انتخاب شدند. همچنین مقدار R2 به¬دست آمده برای مدل درخت تصمیم برای ظرفیت هوایی، ظرفیت زراعی نسبی و آب قابل دسترس به ترتیب 95/0، 84/0 و 85/0 بود در حالی¬كه در مدل رگرسیون چند متغیره خطی این شاخص¬ها به ترتیب 63/0، 62/0 و 61/0 مشاهده شدند. ویژگی¬های تخلخل و چگالی ظاهری بر ظرفیت هوایی، تخلخل بر ظرفیت زراعی نسبی و چگالی ظاهری بر روی آب قابل دسترس گیاه به عنوان مهم¬ترین پارامترهای مؤثر شناخته شدند. این پژوهش یك اساس برای پیش¬بینی و شناسایی پارامترهای مهم بر روی این سه ویژگی فیزیكی یا هیدرولیكی در خاك¬های كشاورزی، در منطقه نیمه خشك را فراهم كرد كه می¬توان به مناطق دیگر نیز تعمیم داده شود.
چكيده لاتين :
Introduction: Soil quality is defined as the capacity of a soil to function within different land uses and ecosystem boundaries, sustain biological productivity, maintain environmental quality and promote plant, animal, and human health. Soil quality cannot be directly measured but can be evaluated on the basis of several parameters; the type of parameter to be used depends on research scale and goals. Soil quality indicators (SQIs) are used to evaluate the effect of different management and types of land use on soil quality and can be achieved by easily-measured soil physicochemical properties. Soil quality indicators are measurable characteristics of the soil affecting the soil capacity for crop production or environmental performance. Air capacity (AC), relative field capacity (RFC) and plant available water (PAWC) are the most important indicators. Selection of appropriate input parameters is the first and most important step in predicting SQIs. Feature selection can be defined as the identification and selection of a subset of useful features among the primary data collected. One of the methods for choosing the features is the Pearson coefficient, which shows the correlation between the input variables and target variable. When the coefficient is close to one, there is a strong relationship between the input and the target variable. The features having a correlation coefficients of greater than or equal to 0.9 are considered important and less than that are considered non-important. Decision tree algorithm is one of the prediction approaches in statistics and data mining literature. This algorithm can select the property with the highest separation capability. Working with this algorithm and interpret its results is very straightforward. The aims of this study were to select the best set of input properties influencing SQIs using Pearson correlation coefficient and then model the effect of the input properties by decision tree and multiple linear regression. Materials and Methods: In this study, the Pearson correlation coefficient was used for selecting effective soil properties influencing SQIs and these indices were modeled and predicted by the decision tree algorithm with selected input properties. For this purpose, 104 soil samples were collected from the soil surface (0-15 cm depth) of four land uses including a garden with 20 year-old walnut trees, pasture, agriculture and a mountain almond in a semi-arid area in Iran (Rabor region, 29 27′ N to 38 54′ N and 56 45′ E to 57 16′ E). A multiple linear regression (MLR) model was constructed as the benchmark for the comparison of performances. Sensitivity analysis of decision tree model was performed with input variables using StatSoft method. The predictive capabilities of the proposed models were evaluated by the mean absolute error (MAE), root mean square error (RMSE), and coefficient of determination (R2) between measured and predicted SQIs values. Results and Discussion: The soil properties including porosity, bulk density, clay and sand content for air capacity, porosity and sand, clay and silt content for relative field capacity, and bulk density, electrical conductivity, porosity, and sand, clay and silt content for plant available water were selected as important input parameters. In addition, the values of r2 for the decision tree model for air capacity, relative field capacity and plant available water were 0.95, 0.84 and 0.85, respectively, while the r2 values for multiple linear regression for AC, RFC and PAWC were 0.63, 0.62 and 0.61, respectively. According to the evaluation indices, it appears that the conventional regression model was poor in predicting SQIs. Therefore, conventional regression techniques (i.e., multiple-linear regression) may not be reliable for predicting the SQIs. The results of sensitivity analysis for decision tree model showed that porosity and bulk density for air capacity, porosity for relative field capacity and bulk density for plant available water had the greatest influence. Conclusion: This research work provided a basis for predicting soil physical quality indicators and identifying important parameters impacting these indicators in agricultural soils, grassland and forests in semi-arid regions which can be generalized to other areas. Further studies are needed to assess the effects of selected input variables under different conditions.
سال انتشار :
1397
عنوان نشريه :
آب و خاك
عنوان نشريه :
آب و خاك
لينک به اين مدرک :
بازگشت