عنوان مقاله :
يادگيري انتقالي با روش تلفيقي از انتقال نمونه و نمايش ويژگي براي پيشبيني نقص بين پروژهاي نرمافزار
عنوان به زبان ديگر :
Compilation Instance Transfer and Feature-representation Transfer for Cross Project Defect Prediction
پديد آورندگان :
شريفات زاده، سعاد دانشگاه يزد - گروه مهندسي كامپيوتر , زارع چاهوكي، محمدعلي دانشگاه يزد - گروه مهندسي كامپيوتر
كليدواژه :
پيشبيني نقص نرمافزار , پيشبيني نقص بينپروژهاي , يادگيري ماشين , يادگيري انتقالي
چكيده فارسي :
پيشبيني نقص نرمافزار، نقش مهمي در بهبود كيفيت نرمافزار دارد. به طوريكه منابع محدود آزمون نرمافزار، بهجاي كل ماژولهاي نرمافزار به ماژولهاي مستعد نقص اختصاص داده ميشوند. در پيشبيني نقص درونپروژهاي، براي ساخت مدل پيشبيني، دادههاي برچسبدار محلي استفاده ميشود. ولي ساخت اين مدل در مورد پروژههايي كه فاقد دادههاي برچسبدار محلي هستند، تقريباً غيرممكن است. لذا، پيشبيني نقص بينپروژهاي مطرح ميشود، كه براي ساخت و آموزش مدل، از دادههاي ساير پروژهها استفاده ميكند. در اين حوزه، توزيع دادهاي بخشهاي آموزش و آزمون متفاوت است. ازاينرو، پژوهشهاي انجامشده روي كاهش اثر منفي تفاوت توزيع بخشهاي آموزش و آزمون تمركز دارند. در اين پژوهش، روش بازه تخمين دانش پيشنهاد شده است. در اين روش نمونههايي از بخش آموزش كه از نظر توزيع دادهاي، مشابه نمونههاي بخش آزمون هستند، انتخاب ميشود. سپس، نمونههاي منتخب به مدل آموزشي داده ميشود. براي افزايش اثربخشي، قبل از اعمال روش بازه تخمين دانش، تكنيك استخراج ويژگي روي بخشهاي آموزش و آزمون اعمال ميشود. نتايج حاصل از ارزيابي روش پيشنهادي روي 10 مجموعه داده از دادگان ناسا و SoftLab با معيار AUC بيانگر اثربخشي اين روش در پيشبيني ماژولهاي مستعد نقص است. روش پيشنهادي بهطور ميانگين 38.1 درصد نسبت به پيشبيني نقص درونپروژهاي افزايش دقت دارد.
چكيده لاتين :
Software defect prediction is critical for software quality improvement. So that, limited resources for software testing is allocated only to fault-prone instead of all software modules. In project defect prediction, to build a prediction model, usually local labeled dataset are used. But, building the predicting model for projects without local labeled data is almost impossible. Thus, cross project defect perdition is proposed for training the prediction model with data from other projects. In cross project defect perdition, training data and test data distribution are different. Therefore, researches in this area have focused for reduction the negative impact of different distribution between training and test data. In this research, the Knowledge Estimation Interval (KEI) method is proposed. In this method, instances of training data by similar distribution with test set are selected. Then, selected instances are given as training to the prediction model. To increase the effectiveness of the proposed approach, feature extraction techniques are applied on training and test set before KEI. The evaluation results of the proposed approach on 10 datasets from NASA and SoftLab with AUC indicate the effectiveness of this approach to predict the fault-prone modules. The proposed method has increased an average value of 38.1% in the accuracy compared to within project defect prediction models.
عنوان نشريه :
مهندسي برق دانشگاه تبريز
عنوان نشريه :
مهندسي برق دانشگاه تبريز