شماره ركورد :
1312520
عنوان مقاله :
بهبود رده‌بندي داده‌هاي نامتوازن با استفاده از معيارهاي شباهت فازي و خوشه‌بندي كاهشي
پديد آورندگان :
يثربي ناييني ، احسان دانشگاه تربت حيدريه - گروه برق و كامپيوتر , حاتمي ، مهلا دانشگاه شهيد باهنر كرمان
از صفحه :
27
تا صفحه :
38
كليدواژه :
رده‌بندي داده‌هاي نامتوازن , معيارهاي شباهت فازي , نمونه‌گيري , خوشه‌بندي كاهشي
چكيده فارسي :
يكي از قسمت هاي مهم در داده كاوي و كشف دانش از پايگاه داده، رده بندي است. در اغلب موارد داده هايي كه براي آموزش رده‌بندها به كار مي روند از توزيع مناسبي برخوردار نيستند. اين توزيع نامناسب هنگامي رخ مي دهد كه يك رده تعداد نمونه هاي زيادي دارد؛ درحالي‌كه به‌طور ذاتي نمونه‌هاي رده ديگر كم است. به‌طوركلي روش‌هاي حل اين نوع مسائل به دو دسته نمونه‌گيري كاهشي و نمونه‌گيري افزايشي تقسيم مي‌شود. در اين مقاله يك روش نمونه‌گيري كاهشي با استفاده از تركيب خوشه‌بندي و معيارهاي شباهت فازي ارائه ‌شده است و عملكرد آن‌ها ازنظر كارآمدي در رده‌بندي داده‌هاي نامتوازن مورد تحليل و بررسي قرارگرفته‌اند. بدين منظور در ابتدا خوشه‌بندي كاهشي انجام‌ شده و داده‌هاي رده اكثريت خوشه‌بندي، سپس با استفاده از معيارهاي شباهت فازي نمونه‌هاي هر خوشه رتبه‌بندي و بر اساس اين رتبه‌ها نمونه‌هاي مناسب انتخاب مي‌شود؛ نمونه‌هاي انتخاب‌شده به همراه رده اقليت مجموعه داده نهايي را تشكيل مي‌دهند. در اين پژوهش پياده‌سازي در نرم‌افزار MATLAB، ارزيابي نتايج از طريق محاسبه معيار AUC و تحليل نتايج با استفاده از آزمون‌هاي آماري استاندارد انجام‌ شده است. نتايج مطالعه نشان‌دهنده عملكرد بهتر روش پيشنهادي، نسبت به ساير روش‌هاي شناخته ‌شده است.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها
لينک به اين مدرک :
بازگشت