شماره ركورد كنفرانس :
4117
عنوان مقاله :
بهبود تركيب نمونه انتخاب براي انتساب داده‌هاي گمشده با كمك الگوريتم‌هاي ماشين بردار پشتيبان وجستجوي گرانشي
پديدآورندگان :
نخعي بتول هنرآموز رايانه استان كرمان ناحيه 2 دانشگاه غيرانتفاعي بهمنياركرمان , ذوالفقاري روح الله هنرآموز رايانه استان سمنان شهرستان دامغان دانشگاه آزاداسلامي علوم و تحقيقات واحد سمنان
تعداد صفحه :
16
كليدواژه :
داده هاي ‌گمشده , ‌جستجوي ‌گرانشي , داده كاوي , الگوريتم طبقه بندي svm- دقت طبقه بندي
سال انتشار :
1396
عنوان كنفرانس :
دومين كنفرانس ملي پژوهش هاي نوين در مهندسي برق و كامپيوتر
زبان مدرك :
فارسي
چكيده فارسي :
گمشد ه گي ‌داده ‌در ‌تمامي ‌پژوهش‌هاي ‌علـوم ‌اجتمـاعي، ‌رفتـاري، ‌پزشـكي ‌وجود ‌دارد. ‌در ‌آمار ‌،گم‌شدن ‌داده ‌به ‌وضعيتي ‌گفته ‌مي‌شود ‌كه ‌تعدادي ‌از ‌اطلاعات ‌داده‌ها ‌گزارش ‌نشده ‌باشند. ‌گمشده گي ‌داده ‌باعث ‌كـاهش ‌تطـابق ‌جامعه ‌نمونه ‌با ‌جامعه ‌كل ‌شده ‌و ‌مي‌تواند ‌منجر ‌به ‌نتيجه-گيـري ‌اشـتباه ‌در ‌مورد ‌جمعيت ‌اصلي ‌شود. ‌گمشده گي ‌داده ‌يك ‌اتفاق ‌معمول ‌بوده ‌و ‌بسـته ‌بـه ‌ميـزان ‌آن، ‌مي-توانـد ‌اثـر ‌قابل‌توجهي ‌در ‌نتيجه گيري ‌به ‌دست ‌آمده ‌از ‌داده-ها ‌داشـته ‌باشـد. ‌تمـامي ‌روش‌هاي ‌برآورد ‌پارامترهـا ‌بـر ‌پايـه ‌فـرض ‌كامـل ‌بـودن ‌مجموعـه ‌داده-هـا ‌استوار ‌است ‌و ‌تحت ‌برقراري ‌ايـن ‌شـرايط ‌منجـر ‌بـه ‌برآوردهـايي ‌نااريـب ‌مي-شوند؛ ‌و ‌البته ‌بـا ‌افـزايش ‌نسـبت ‌گمشـدگي، ‌مقـدار ‌اريبـي ‌نيـز ‌افـزايش ‌خواهد ‌يافت.در ‌اين ‌پژوهش بدين صورت عمل گرديده است كه يك سري مجموعه داده واقعي بر حسب درصد گمشده گي مقاديري را از دست مي دهند سپس بر اساس الگوريتم جستجوي گرانشي مقادير گمشده تخمين زده مي شوند وبر اساس معيارميانگين خطاي مطلق ميزان درصد خطاي بدست آمده از روش جستجوي گرانشي نسبت به مقادير واقعي محاسبه مي شود كه اين معيار بر اساس نتايج ارزيابي ، خطاي كمتري را نشان ميدهد و هر چه داده ها بيشتر باشند اين معيار نيز به تناسب بيشتر مي شود.سپس با استفاده از الگوريتم طبقه بندي svm براي طبقه‌بندي داده‌ها بر اساس مقادير تعيين شده توسط الگوريتم جستجوي گرانشي دقت حاصل با دقت طبقه‌بندي بر روي داده‌هاي حاصل ازپر كردن با ميانگين ويژگي وهمچنين پركردن داده ها با الگوريتم نزديكترين همسايگي(K-NN) مقايسه مي‌گردد.كه در بخش ارزيابي نتايج نشان داده مي شود كه دقت طبقه بندي بر روي داده هاي بدست آمده از روش جستجوي گرانشي نسبت به روشهاي ديگر بالاتر است و هرچه درصد گمشدگي بيشتر شود اين دقت كمتر مي شود.
كشور :
ايران
لينک به اين مدرک :
بازگشت