عنوان مقاله :
بررسي كارايي رويكردهاي باز نمونهگيري در بهبود كلاسبندي دادههاي نامتوازن در نقشه برداري رقومي خاك
پديد آورندگان :
ابراهيمي ميمند ، فاطمه دانشگاه گيلان - دانشكده كشاورزي - گروه علوم خاك , رمضانپور ، حسن دانشگاه گيلان - دانشكده كشاورزي - گروه علوم خاك , يغماييان ، نفيسه دانشگاه گيلان - دانشكده كشاورزي - گروه علوم خاك , افتخاري ، كامران سازمان تحقيقات، آموزش و ترويج كشاورزي - مؤسسه تحقيقات خاك و آب
كليدواژه :
بيش نمونه گيري , كم نمونه گيري , نرم افزارR , نقشه خاك , يادگيري ماشين
چكيده فارسي :
در سالهاي اخير، استفاده از روشهاي نقشهبرداري رقومي مبتني بر الگوريتمهاي يادگيري ماشين باهدف تهيه نقشه كلاسهاي خاك بطور گستردهاي توسعه يافته است. اساس اين روشها پيشبيني كلاسها يا ويژگيهاي خاك به كمك مدلسازي روابط بين آنها و متغيرهاي محيطي به عنوان نمايندگان عوامل خاكسازي، ميباشد. ماهيت نامتوازن توزيع خاكها در طبيعت كه منجر به بيشبرازش كلاسهاي با فراواني زياد و كم برازش كلاسهاي با فراواني كم و درنتيجه كاهش دقت فرآيند نقشهبرداري خاك شده، از چالشهاي موجود در اين روش ميباشد. بنابراين، پژوهش حاضر باهدف ارزيابي توانايي دو الگوريتم جنگل تصادفي و ماشينبردارپشتيبان در نقشهبرداريرقومي كلاسهاي فاميل خاك با توزيع نامتوازن، حاصل از 95 خاكرخ مطالعاتي در 4000 هكتار از اراضي زيرحوضه هنام، استان لرستان انجام گرفت. در اين مطالعه موضوع عدم توازن در فراواني كلاسهاي خاك با استفاده از 6 مجموعه داده، ازجمله مجموعه دادههاي اصلي و پنج مجموعه داده ايجادشده توسط چندين رويكرد نمونهگيري مجدد از دادههاي اصلي، شامل دو رويكرد طبقهبندي دستي و سه الگوريتم بيشنمونهگيري و كمنمونهگيري و بيشنمونهگيري اقليت مصنوعي در محيط نرم افزار R موردبررسي قرار گرفت. نتايج نشان داد عليرغم مقاير پائين آمارههاي اعتبارسنجي، شباهت گسترش خاكهاي با فراواني زياد در منطقه مطالعاتي در نقشههاي حاصل از مدل جنگل تصادفي و مجموعه دادههاي اصلي و همچنين الگوريتم بيشنمونهگيري اقليت مصنوعي با نقشه خاك تهيهشده به روش مرسوم قابلتوجه ميباشد. بنابراين فراواني كم ساير كلاسهاي خاك و در نتيجه آن عدم آموزش درست مدلها براي آنها را ميتوان يكي از دلايل اصلي صحتكلي كم مدلهاي بهكاررفته دانست.
عنوان نشريه :
مرتع و آبخيزداري
عنوان نشريه :
مرتع و آبخيزداري