شماره ركورد كنفرانس :
4658
عنوان مقاله :
ارائه يك روش تركيبي بهبود يافته جهت پيش بيني مولفه هاي آسيب پذير نرم افزار با رويكرد كاهش بُعد توسط گسسته سازي و انتخاب ويژگي
عنوان به زبان ديگر :
Introducing an improved hybrid approach for predicting vulnerable software components using dimensionality reduction with discretization and feature selection technique
پديدآورندگان :
حسن پور سيدمهدي smahdi1991@gmail.com دانشگاه صنعتي مالك اشتر تهران; , عزمي رضا azmi.reza@gmail.com دانشگاه الزهرا (س); , ولوي محمدرضا valavi@mut.ac.ir دانشگاه صنعتي مالك اشتر;
كليدواژه :
انتخاب ويژگي , گسسته¬سازي , كاهش¬ بُعد , مدل¬هاي پيش¬بيني آسيب¬پذيري , آزمون فرض
عنوان كنفرانس :
دومين كنفرانس بين المللي پژوهش هاي دانش بنيان در كامپيوتر و فن آوري اطلاعات
چكيده فارسي :
مشخصه اصلي مدل هاي پيش بيني مبتني بر تحليل كد كه از روش هاي متنكاوي و يادگيري ماشين بهره مي برند، آن است كه ويژگي ها از پيش تعيينشده و ثابت نيستند و با توجه به مجموعه داده ها كه شامل كد برنامه هاي مشخصي هست تعيينشده و بنابراين هر برنامه مدل اختصاصي خود را دارد كه الزاماً براي كاربردهاي مشابه قابلاستفاده نيست. در الگوريتم ارائهشده علاوه بر مشخصه فوق يكي از چالش هاي اصلي اين زمينه، انتخاب ويژگي هاي مناسب و كاهش بُعد براي بهبود عملكرد مدل پيشبيني آسيبپذيري، در نظر گرفتهشده است. در اين پژوهش رويكردي تركيبي مبتني بر آزمون فرض آماري براي كاهش حجم ويژگي هاي با قطعيت آماري پايين و اعمال دستهبندي از طريق گسسته سازي و انتخاب مناسب خصيصه ها براي افزايش دقت پيش بيني بكار گرفتهشده است. ارزيابي روش بر روي مجموعه اي از كد برنامه هاي معروف جاواي اندرويد كه شامل بيش از 100هزار خط كد برنامه كه در پژوهش هاي مشابه استفادهشده، انجام پذيرفته است. نتايج حاصل حاكي از ثمربخش بودن آن در افزايش دقت در پيش بيني مؤلفههاي آسيب پذير است.
چكيده لاتين :
The main characteristic of code analysis based prediction models which use text mining and machine learning, is that the features [they use], are not predefined and fixed, they are defined according to a dataset consisting specific source codes and therefore each application has its own specific model which is not necessarily applicable for similar applications. Aside from the aforementioned issue, in the proposed algorithm, the selection of proper features and dimensionality reduction for improving the performance of the model in vulnerability prediction has been considered as one of the main challenges in this field. In this paper, a novel hybrid approach based on hypothesis test for for reducing features with low statistical certainty and applying classification using discretization and proper attribute selection for improving prediction accuracy is used. The evaluation of the proposed approach is carried out using a collection of famous android java source codes some of which has more than 100K lines of code(LOC) which were also used in previous studies. Results show a 20% improvement in average in the cross-projects tests.