شماره ركورد كنفرانس :
4658
عنوان مقاله :
يك الگوريتمِ كيسهبنديِ جديدِ مبتني بر شبكههايِ عصبي-فازي جهتِ ردهبنديِ دادههايِ نامتوازن
عنوان به زبان ديگر :
A new neuro-fuzzy network-based bagging algorithm for unbalanced data classification
پديدآورندگان :
مهدوي نيا هادي hadi.mahdavinia1365@gmail.com دانشگاه آزاد اسلامي واحد دولت آباد; , ربيعي اعظم azrabiee@gmail.com دانشگاه آزاد اسلامي واحد دولت آباد;
كليدواژه :
ردهبندي , دادههاي نامتوازن , كيسهبندي , رده اكثريت , رده اقليت
عنوان كنفرانس :
دومين كنفرانس بين المللي پژوهش هاي دانش بنيان در كامپيوتر و فن آوري اطلاعات
چكيده فارسي :
در اين تحقيق، سعي شده است يك الگوريتم كيسهبنديِ بهينه، مبتني بر شبكههايِ عصبي-فازيِ انفيس جهت ردهبنديِ دادههايِ نامتوازنِ ارائه شود. اين الگوريتم كيسهبندي با روشهاي شبكه عصبيِ مصنوعي ، جنگل تصادفي ، انفيس و يك روش تركيبي ديگر كه داراي فنون افزايش نمونههاي كلاس اقليت، كاهش نمونههاي كلاس اكثريت و هستهي درخت C4.5 است، مقايسه ميشود. براي مقايسه اين روشها با يكديگر از معيارهاي ارزيابي دقّت ، حساسيت ، ويژگي ، صحّت ، نرخ خطا ، G-mean، F-Measure، زمان و مساحت زير منحني ROC استفاده ميشود. در بخش نتيجهگيري، بيان ميشود كه روش پيشنهادي، داراي دقّت بيشتر، معادل 95/92% در مورد دادههاي آموزشي و 27/93% در مورد دادههاي آزمون ، نسبت به روشهاي رقيب ديگر است. همچنين مدّت زمان اجراي الگوريتم پيشنهادي، نسبت به روش هاي ديگر، با عدد 8/77 ثانيه، قابل قبول و مناسب است.
چكيده لاتين :
In this research, an optimal bagging algorithm based on ANFIS neural networks to is proposed for imbalanced datasets classification. This algorithm is compared with Artificial Neural Networks, Random Forest, ANFIS and another combination method that has the techniques of increasing minority class samples, reducing the majority class samples, and the C4.5 trees core. for compare these methods each other, are used from the criteria accuracy, sensitivity, specificity, accuracy, error rate, G-mean, F-Measure, time and area under the ROC curve. In the conclusion, it is stated that the proposed method has a higher accuracy of 92.95% for educational data and 93.27% for test data than for other competing methods. Also, the duration of the proposed algorithm is acceptable, and compared with other methods, with an average of 77.8 seconds.