عنوان مقاله :
بهبود ردهبندي دادههاي نامتوازن با استفاده از معيارهاي شباهت فازي و خوشهبندي كاهشي
پديد آورندگان :
يثربي ناييني ، احسان دانشگاه تربت حيدريه - گروه برق و كامپيوتر , حاتمي ، مهلا دانشگاه شهيد باهنر كرمان
كليدواژه :
ردهبندي دادههاي نامتوازن , معيارهاي شباهت فازي , نمونهگيري , خوشهبندي كاهشي
چكيده فارسي :
يكي از قسمت هاي مهم در داده كاوي و كشف دانش از پايگاه داده، رده بندي است. در اغلب موارد داده هايي كه براي آموزش ردهبندها به كار مي روند از توزيع مناسبي برخوردار نيستند. اين توزيع نامناسب هنگامي رخ مي دهد كه يك رده تعداد نمونه هاي زيادي دارد؛ درحاليكه بهطور ذاتي نمونههاي رده ديگر كم است. بهطوركلي روشهاي حل اين نوع مسائل به دو دسته نمونهگيري كاهشي و نمونهگيري افزايشي تقسيم ميشود. در اين مقاله يك روش نمونهگيري كاهشي با استفاده از تركيب خوشهبندي و معيارهاي شباهت فازي ارائه شده است و عملكرد آنها ازنظر كارآمدي در ردهبندي دادههاي نامتوازن مورد تحليل و بررسي قرارگرفتهاند. بدين منظور در ابتدا خوشهبندي كاهشي انجام شده و دادههاي رده اكثريت خوشهبندي، سپس با استفاده از معيارهاي شباهت فازي نمونههاي هر خوشه رتبهبندي و بر اساس اين رتبهها نمونههاي مناسب انتخاب ميشود؛ نمونههاي انتخابشده به همراه رده اقليت مجموعه داده نهايي را تشكيل ميدهند. در اين پژوهش پيادهسازي در نرمافزار MATLAB، ارزيابي نتايج از طريق محاسبه معيار AUC و تحليل نتايج با استفاده از آزمونهاي آماري استاندارد انجام شده است. نتايج مطالعه نشاندهنده عملكرد بهتر روش پيشنهادي، نسبت به ساير روشهاي شناخته شده است.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها