عنوان مقاله :
شناسايي جريان هاي ناشناخته مخرب در شبكه با به كارگيري يادگيري جمعي در داده هاي نامتوازن
عنوان به زبان ديگر :
Detection of Unknown Malicious Network Streams Using Ensemble Learning in Imbalanced Data
پديد آورندگان :
راد، فرهاد دانشگاه آزاد اسلامي، ياسوج - گروه مهندسي كامپيوتر , رضازاده، فرهاد دانشگاه آزاد اسلامي، بوشهر - گروه مهندسي كامپيوتر , پروين، حميد دانشگاه آزاد اسلامي، نورآباد ممسني - گروه مهندسي كامپيوتر
اطلاعات موجودي :
فصلنامه سال 1396 شماره 20
كليدواژه :
هاني نت , حملات ناشناخته , يادگيري جمعي , داده هاي نامتوازن , راي گيري وزني , آزمون هاي آماري
چكيده فارسي :
يكي از حوزه هاي امنيتي كه در شرايط جديد جهاني بسيار مورد اهميت قرار گرفته است، امنيت سايبري است. در اين مقاله براي مطالعه بر روي حملات ناشناخته در شبكه هاي كامپيوتري، دو هاني نت آزمايشگاهي مجازي در دو مكان مختلف طراحي و همچنين از ساير مجموعه داده هاي علمي استفاده شده است. در داده هاي شبكه اي، مشكل داده هاي نامتوازن اغلب اتفاق مي افتد كه اين امر كارايي پيش بيني رده هايي كه در اقليت هستند را كاهش ميدهد. براي حل اين مشكل در اين مقاله، از روش هاي يادگيري جمعي براي ارايه مدلي خودكار استفاده شده است تا با استفاده از فنون مختلف و يادگيري مدل، حملات شبكه به ويژه حملات ناشناخته به درستي شناسايي شوند. روش تحقيق انجام شده، بر اساس تحليل هاي آماري است كه در راستاي بررسي ميزان صحت (دقت) نتايج و ميزان اتكاپذيري آنها صورت گرفته است. در پايان به كمك فنون و آزمايش هاي آماري نشان داده شده است كه عملكرد الگوريتم طراحي شده با راي گيري وزني پيشنهادي براساس الگوريتم ژنتيك، نسبت به دوازده طبقه بند ديگر به ميزان چشمگيري بهبود داشته است. رويكرد پيشنهادي توانسته است در بستر واقعي آزمايشگاهي از نظر معيار اندازه گيري فيشر در جايگاه نخست و در مجموعه داده هاي استاندارد در جايگاه دوم قرار بگيرد.
چكيده لاتين :
Security is a significant issue in this world and is given several dimensions by varying circumstances. Among different security areas، cyber security can be claimed to have one of the most important places in new circumstances of this world. In this study، two virtual honeynets were designed in two different laboratories to help study unknown attacks. Other scientific datasets were also used for this purpose. Imbalanced data always cause problems for network datasets and reduce the efficiency for the prediction of minority classes. To cope with this problem، ensemble learning methods were applied in order to detect network attacks، and most specifically، unknown attacks، while taking advantage of different techniques and action model learning. Statistical analysis was used as the research method in order to measure the reliability and validity of the findings. Finally، statistical techniques and tests were applied to show that the algorithm designed by weighted voting that is based on the genetic algorithm has a better performance than other twelve classifiers. According to the Fisher's criterion، the proposed approach was in the first place in the actual laboratory context and in the second place in the standard data set.
عنوان نشريه :
پدافند الكترونيكي و سايبري
عنوان نشريه :
پدافند الكترونيكي و سايبري
اطلاعات موجودي :
فصلنامه با شماره پیاپی 20 سال 1396