شماره ركورد كنفرانس :
4117
عنوان مقاله :
بهبود تركيب نمونه انتخاب براي انتساب دادههاي گمشده با كمك الگوريتمهاي ماشين بردار پشتيبان وجستجوي گرانشي
پديدآورندگان :
نخعي بتول هنرآموز رايانه استان كرمان ناحيه 2 دانشگاه غيرانتفاعي بهمنياركرمان , ذوالفقاري روح الله هنرآموز رايانه استان سمنان شهرستان دامغان دانشگاه آزاداسلامي علوم و تحقيقات واحد سمنان
كليدواژه :
داده هاي گمشده , جستجوي گرانشي , داده كاوي , الگوريتم طبقه بندي svm- دقت طبقه بندي
عنوان كنفرانس :
دومين كنفرانس ملي پژوهش هاي نوين در مهندسي برق و كامپيوتر
چكيده فارسي :
گمشد ه گي داده در تمامي پژوهشهاي علـوم اجتمـاعي، رفتـاري، پزشـكي وجود دارد. در آمار ،گمشدن داده به وضعيتي گفته ميشود كه تعدادي از اطلاعات دادهها گزارش نشده باشند. گمشده گي داده باعث كـاهش تطـابق جامعه نمونه با جامعه كل شده و ميتواند منجر به نتيجه-گيـري اشـتباه در مورد جمعيت اصلي شود. گمشده گي داده يك اتفاق معمول بوده و بسـته بـه ميـزان آن، مي-توانـد اثـر قابلتوجهي در نتيجه گيري به دست آمده از داده-ها داشـته باشـد. تمـامي روشهاي برآورد پارامترهـا بـر پايـه فـرض كامـل بـودن مجموعـه داده-هـا استوار است و تحت برقراري ايـن شـرايط منجـر بـه برآوردهـايي نااريـب مي-شوند؛ و البته بـا افـزايش نسـبت گمشـدگي، مقـدار اريبـي نيـز افـزايش خواهد يافت.در اين پژوهش بدين صورت عمل گرديده است كه يك سري مجموعه داده واقعي بر حسب درصد گمشده گي مقاديري را از دست مي دهند سپس بر اساس الگوريتم جستجوي گرانشي مقادير گمشده تخمين زده مي شوند وبر اساس معيارميانگين خطاي مطلق ميزان درصد خطاي بدست آمده از روش جستجوي گرانشي نسبت به مقادير واقعي محاسبه مي شود كه اين معيار بر اساس نتايج ارزيابي ، خطاي كمتري را نشان ميدهد و هر چه داده ها بيشتر باشند اين معيار نيز به تناسب بيشتر مي شود.سپس با استفاده از الگوريتم طبقه بندي svm براي طبقهبندي دادهها بر اساس مقادير تعيين شده توسط الگوريتم جستجوي گرانشي دقت حاصل با دقت طبقهبندي بر روي دادههاي حاصل ازپر كردن با ميانگين ويژگي وهمچنين پركردن داده ها با الگوريتم نزديكترين همسايگي(K-NN) مقايسه ميگردد.كه در بخش ارزيابي نتايج نشان داده مي شود كه دقت طبقه بندي بر روي داده هاي بدست آمده از روش جستجوي گرانشي نسبت به روشهاي ديگر بالاتر است و هرچه درصد گمشدگي بيشتر شود اين دقت كمتر مي شود.