مرکز منطقه ای اطلاع رساني علوم و فناوري - ارائه يك روش تركيبي بهبود يافته جهت پيش بيني مولفه هاي آسيب پذير نرم افزار با رويكرد كاهش بُعد توسط گسسته سازي و انتخاب ويژگي

شماره ركورد كنفرانس :

4658

عنوان مقاله :

ارائه يك روش تركيبي بهبود يافته جهت پيش بيني مولفه هاي آسيب پذير نرم افزار با رويكرد كاهش بُعد توسط گسسته سازي و انتخاب ويژگي

عنوان به زبان ديگر :

Introducing an improved hybrid approach for predicting vulnerable software components using dimensionality reduction with discretization and feature selection technique

پديدآورندگان :

حسن پور سيدمهدي smahdi1991@gmail.com دانشگاه صنعتي مالك اشتر تهران; , عزمي رضا azmi.reza@gmail.com دانشگاه الزهرا (س); , ولوي محمدرضا valavi@mut.ac.ir دانشگاه صنعتي مالك اشتر;

تعداد صفحه :

كليدواژه :

انتخاب ويژگي , گسسته¬سازي , كاهش¬ بُعد , مدل¬هاي پيش¬بيني آسيب¬پذيري , آزمون فرض

سال انتشار :

1396

عنوان كنفرانس :

دومين كنفرانس بين المللي پژوهش هاي دانش بنيان در كامپيوتر و فن آوري اطلاعات

زبان مدرك :

فارسي

چكيده فارسي :

مشخصه اصلي مدل هاي پيش بيني مبتني بر تحليل كد كه از روش هاي متن‌كاوي و يادگيري ماشين بهره مي برند، آن است كه ويژگي ها از پيش تعيين‌شده و ثابت نيستند و با توجه به مجموعه داده ها كه شامل كد برنامه هاي مشخصي هست تعيين‌شده و بنابراين هر برنامه مدل اختصاصي خود را دارد كه الزاماً براي كاربردهاي مشابه قابل‌استفاده نيست. در الگوريتم ارائه‌شده علاوه بر مشخصه فوق يكي از چالش هاي اصلي اين زمينه، انتخاب ويژگي هاي مناسب و كاهش بُعد براي بهبود عملكرد مدل پيش‌بيني آسيب‌پذيري، در نظر گرفته‌شده است. در اين پژوهش رويكردي تركيبي مبتني بر آزمون فرض آماري براي كاهش حجم ويژگي هاي با قطعيت آماري پايين و اعمال دسته‌بندي از طريق گسسته سازي و انتخاب مناسب خصيصه ها براي افزايش دقت پيش بيني بكار گرفته‌شده است. ارزيابي روش بر روي مجموعه اي از كد برنامه هاي معروف جاواي اندرويد كه شامل بيش از 100هزار خط كد برنامه كه در پژوهش هاي مشابه استفاده‌شده، انجام پذيرفته است. نتايج حاصل حاكي از ثمربخش بودن آن در افزايش دقت در پيش بيني مؤلفه‌هاي آسيب پذير است.

چكيده لاتين :

The main characteristic of code analysis based prediction models which use text mining and machine learning, is that the features [they use], are not predefined and fixed, they are defined according to a dataset consisting specific source codes and therefore each application has its own specific model which is not necessarily applicable for similar applications. Aside from the aforementioned issue, in the proposed algorithm, the selection of proper features and dimensionality reduction for improving the performance of the model in vulnerability prediction has been considered as one of the main challenges in this field. In this paper, a novel hybrid approach based on hypothesis test for for reducing features with low statistical certainty and applying classification using discretization and proper attribute selection for improving prediction accuracy is used. The evaluation of the proposed approach is carried out using a collection of famous android java source codes some of which has more than 100K lines of code(LOC) which were also used in previous studies. Results show a 20% improvement in average in the cross-projects tests.

كشور :

ايران

لينک به اين مدرک :

https://search.ricest.ac.ir/dl/search/defaultta.aspx?DTC=36&DC=283231