عنوان مقاله :
ارائه يك روش فازي-تكاملي براي تشخيص خطاهاي نرمافزار
عنوان به زبان ديگر :
Proposing an evolutionary-fuzzy method for software defects detection
پديد آورندگان :
افتخاري، مهدي دانشگاه شهيد باهنر كرمان , مجيدي مومن آبادي، مريم دانشگاه شهيد باهنر كرمان , خمر، مجتبي دانشگاه شهيد باهنر كرمان
كليدواژه :
منطق فازي , مجموعه دادههاي نامتوازن , طبقهبندي , تشخيص خطاي نرمافزار، , الگوريتم هاي تكاملي
چكيده فارسي :
تشخيص خطاهاي نرمافزار، يكي از بزرگترين چالشهاي توسعه نرمافزاراست و بيشترين بودجه را در فرآيند توسعه نرمافزار به خود اختصاص ميدهد. با توجه به اهميت تشخيص خطاهاي نرمافزار، در اين مقاله روشي بر مبناي مجموعههاي فازي و الگوريتمهاي تكاملي ارائه ميشود. از آنجا كه ماهيت مجموعهدادههاي تشخيص خطاي نرمافزار نامتوازن است، از مزاياي الگوريتمهاي خوشهبندي فازي بهمنظور نمونهبرداري از دادهها و توجه بيشتر به طبقه اقليت استفاده شده است. روش پيشنهادي درواقع يك الگوريتم تركيبي است كه در ابتدا از روش خوشهبندي c ميانگين فازي بهمنظور نمونهبرداري بوتاستراپ وزندار استفاده ميشود. وزن دادهها همان درجه عضويت آنهاست و درجه عضويت دادههاي طبقه اقليت افزايش مييابد. در گام بعدي، از الگوريتم خوشهبندي كاهشي براي ايجاد طبقهبند استفاده ميشود كه توسط دادههاي توليدشده در مرحله قبل آموزش ميبيند؛ همچنين از الگوريتم ژنتيك دودويي براي انتخاب ويژگيهاي مناسب استفاده ميشود. نتايج بهدستآمده و همچنين مقايسه آنها با چندين روش معروف در اين زمينه، كارايي مناسب روش پيشنهادي را نشان ميدهد. براي انجام آزمايشها از ده پايگاه داده معروف با گستره وسيعي از اندازه و نرخ عدم توازن، استفاده شده است و براي تأييد نتايج از آزمون آماري تي بهره بردهايم.
چكيده لاتين :
Software defects detection is one of the most important challenges of software development and it is the most prohibitive process in software development. The early detection of fault-prone modules helps software project managers to allocate the limited cost, time, and effort of developers for testing the defect-prone modules more intensively. In this paper, according to the importance of software defects detection, a method based on fuzzy sets and evolutionary algorithms is proposed. Due to the imbalanced nature of software defect detection datasets, benefits of fuzzy clustering algorithms were used to data sampling and more attention to the minority class. This method is a combined algorithm which, firstly has used fuzzy c-mean clustering as weighted bootstrap sampling. Weight of data (their membership’s degrees) increases for minority class. In the next step, the subtractive clustering algorithm is applied to produce the classifier which was trained by produced data in the previous step. The binary genetic algorithm was utilized to select appropriate features. The results and also comparisons with eight popular methods in software defect detection literature, show an acceptable performance of the proposed method. The experiments were performed on ten real-world datasets with a wide range of data sizes and imbalance rates. Also T-test is used as the statistical significance test for pair wise comparison of our proposed method against the others. The final results of T-test are shown in tables for three performance measures (G-mean, AUC and Balanced) over various datasets. (As the obtained results apparently show our proposed method has the ability to improve three aforementioned performance criteria simultaneously). Some methods just have improved the G-mean measure while the AUC and Balance criteria have lower values than the others. Securing a high level of three performance measures simultaneously illustrates the ability of our proposed algorithm for handling the imbalance problem of software defects detection datasets.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها