عنوان مقاله :
روشي سريع تر براي تشخيص گزارش خطاي تكثير با حفظ صحت
پديد آورندگان :
امينالرعايائي ، زهرا موسسه آموزش عالي علامه نائيني , سليمانينيسياني ، بهزاد دانشگاه كاشان - دانشكده مهندسي برق و كامپيوتر , نديميشهركي ، محمدحسين دانشگاه آزاد اسلامي واحد نجفآباد - دانشكده مهندسي كامپيوتر
كليدواژه :
استخراج ويژگي , تشخيص گزارش خطاي تكثير , الگوريتمهاي طبقهبندي , دقت , زمان اجرا
چكيده فارسي :
امروزه يكي از مهمترين چالشهاي سيستمهاي رديابي گزارشهاي خطاي كاربران، تشخيص گزارشهاي خطاي تكراري است. بسياري از محققان از روشها و ابزارهاي بازيابي اطلاعات براي حل اين مشكل استفاده كردهاند كه در اين پژوهش نيز از آنها با معرفي چندين ويژگي استخراج شده جديد مبتني بر كمينه و بيشينه و ميانگين تعداد تكرار كلمات مشابه در دو گزارش بهره گرفته شده است. ابتدا با در نظر گرفتن مجموعه دادههايي از 4 مخزن بزرگ گزارش خطاي Android Mozilla, OpenOffice, و Eclipse تعداد 162 ويژگي جديد با تركيب ويژگيهاي موجود در كارهاي گذشته بهدست آمده است. سپس بسياري از اين ويژگيها، به دليل اهميت ناچيز و طولاني كردن زمان اجراي الگوريتمهاي طبقهبندي، با اعمال روشهاي كاهش بعد حذف شدهاند. نتايج پيادهسازي نشان ميدهد كه زمان اجراي الگوريتمهاي طبقهبندي با ويژگيهاي كاهش يافته نسبت به زمان اجراي تمام ويژگيها، از ميزان چندين دقيقه به چندين ثانيه كاهش يافته است و در عين حال نيز باعث بهبود تشخيص گزارش خطاي تكراري بين %1 الي %6 شده است. همچنين نتايج به دليل وجود ويژگيهاي جديد، بيانگر دقت بالاي 96% و نرخ فراخواني بالاي 90/ 0 نسبت به ديگر تحقيقات پيشين شده است.
عنوان نشريه :
علوم رايانش و فناوري اطلاعات
عنوان نشريه :
علوم رايانش و فناوري اطلاعات