شماره ركورد :
1003840
عنوان مقاله :
يادگيري انتقالي با روش تلفيقي از انتقال نمونه و نمايش ويژگي براي پيش‌بيني نقص بين‌ پروژه‌اي نرم‌افزار
عنوان به زبان ديگر :
Compilation Instance Transfer and Feature-representation Transfer for Cross Project Defect Prediction
پديد آورندگان :
شريفات زاده، سعاد دانشگاه يزد - گروه مهندسي كامپيوتر , زارع چاهوكي، محمدعلي دانشگاه يزد - گروه مهندسي كامپيوتر
تعداد صفحه :
12
از صفحه :
101
تا صفحه :
112
كليدواژه :
پيش‌بيني نقص نرم‌افزار , پيش‌بيني نقص بين‌پروژه‌اي , يادگيري ماشين , يادگيري انتقالي
چكيده فارسي :
پيش‌بيني نقص نرم‌افزار، نقش مهمي در بهبود كيفيت نرم‌افزار دارد. به‌ طوري‌كه منابع محدود آزمون نرم‌افزار، به‌جاي كل ماژول‌هاي نرم‌افزار به ماژول‌هاي مستعد نقص اختصاص داده مي‌شوند. در پيش‌بيني نقص درون‌پروژه‌اي، براي ساخت مدل پيش‌بيني، داده‌هاي برچسب‌دار محلي استفاده مي‌شود. ولي ساخت اين مدل در مورد پروژه‌هايي كه فاقد داده‌هاي برچسب‌دار محلي هستند، تقريباً غيرممكن است. لذا، پيش‌بيني نقص بين‌پروژه‌اي مطرح مي‌شود، كه براي ساخت و آموزش مدل، از داده‌هاي ساير پروژه‌ها استفاده مي‌كند. در اين حوزه، توزيع داده‌اي بخش‌هاي آموزش و آزمون متفاوت است. ازاين‌رو، پژوهش‌هاي انجام‌شده روي كاهش اثر منفي تفاوت توزيع بخش‌هاي آموزش و آزمون تمركز دارند. در اين پژوهش، روش بازه تخمين دانش پيشنهاد شده است. در اين روش نمونه‌هايي از بخش آموزش كه از نظر توزيع داده‌اي، مشابه نمونه‌هاي بخش آزمون هستند، انتخاب مي‌شود. سپس، نمونه‌هاي منتخب به مدل آموزشي داده مي‌شود. براي افزايش اثربخشي، قبل از اعمال روش بازه تخمين دانش، تكنيك استخراج ويژگي روي بخش‌هاي آموزش و آزمون اعمال مي‌شود. نتايج حاصل از ارزيابي روش پيشنهادي روي 10 مجموعه داده از دادگان ناسا و SoftLab با معيار AUC بيانگر اثربخشي اين روش در پيش‌بيني ماژول‌هاي مستعد نقص است. روش پيشنهادي به‌طور ميانگين 38.1 درصد نسبت به پيش‌بيني نقص درون‌پروژه‌اي افزايش دقت دارد.
چكيده لاتين :
Software defect prediction is critical for software quality improvement. So that, limited resources for software testing is allocated only to fault-prone instead of all software modules. In project defect prediction, to build a prediction model, usually local labeled dataset are used. But, building the predicting model for projects without local labeled data is almost impossible. Thus, cross project defect perdition is proposed for training the prediction model with data from other projects. In cross project defect perdition, training data and test data distribution are different. Therefore, researches in this area have focused for reduction the negative impact of different distribution between training and test data. In this research, the Knowledge Estimation Interval (KEI) method is proposed. In this method, instances of training data by similar distribution with test set are selected. Then, selected instances are given as training to the prediction model. To increase the effectiveness of the proposed approach, feature extraction techniques are applied on training and test set before KEI. The evaluation results of the proposed approach on 10 datasets from NASA and SoftLab with AUC indicate the effectiveness of this approach to predict the fault-prone modules. The proposed method has increased an average value of 38.1% in the accuracy compared to within project defect prediction models.
سال انتشار :
1397
عنوان نشريه :
مهندسي برق دانشگاه تبريز
فايل PDF :
7441187
عنوان نشريه :
مهندسي برق دانشگاه تبريز
لينک به اين مدرک :
بازگشت