عنوان مقاله :
انتخاب ويژگي با الگوريتم بهينه سازي حاصلخيزي زمينهاي كشاورزي براي تشخيص صفحات وب هرز
پديد آورندگان :
سخي دل هوسين ، محمد دانشگاه آزاد اسلامي واحد اروميه - گروه مهندسي كامپيوتر , سليمانيان قره چپق ، فرهاد دانشگاه آزاد اسلامي واحد اروميه - گروه مهندسي كامپيوتر
كليدواژه :
صفحات وب هرز , طبقه بندي , الگوريتم حاصلخيــزي زمين هاي كشــاورزي , الگوريتم بيز ســاده , انتخاب ويژگي
چكيده فارسي :
در فضاي اينترنت، امكان بهكارگيري انواع سرويسها و خدمات متعدد براي كاربران مهيا شده است. همزمان با رشد و گسترش استفاده از اينترنت، تعداد هرزنويسان وب افزايش يافته است. صفحات وب هرز به اشكال مختلفي چون تبليغات تجاري و ويروسهايي نهان شده در صفحات وب جايگذاري ميشود. صفحات وب هرز علاوه بر تهديد امنيت كاربران در وب، موجب هدر رفتن منابع سيستم و ايجاد ترافيك مخرب نيز ميگردند؛ لذا ارايه راهكارهايي جهت مقابله با وب هرز ضروري به نظر ميرسد. يكي از روشهاي شناسايي و مقابله با صفحات وب هرز، طبقهبندي صفحات با استفاده از الگوريتمهاي يادگيري ماشين است. در اين مقاله، مدلي جديد برمبناي الگوريتم حاصلخيزي زمينهاي كشاورزي و بيز ساده با عنوان FFANB براي تشخيص صفحات وب هرز پيشنهاد شده است. در مدل FFANB از الگوريتم حاصلخيزي زمينهاي كشاورزي براي انتخاب ويژگي و بيز ساده براي طبقهبندي نمونهها استفاده شده است. هدف مدل FFANB كاهش ويژگيها به منظور افزايش صحت بااستفاده از الگوريتم حاصلخيزي زمينهاي كشاورزي ميباشد كه از مجموعه داده WEBSPAM-UK2007 كه از معتبرترين مجموعه داده در زمينه شناسايي صفحات وب هرز ميباشد استفاده شده است. اين مجموعه داده شامل سه دسته ويژگي با عناوين ويژگيهاي مبتني بر محتوا (96 ويژگي)، ويژگيهاي مبتني بر پيوند (41 ويژگي) و ويژگيهاي مبتني بر پيوند تبديل يافته (138 ويژگي) ميباشد كه تعداد كل ويژگيها برابر با 275 ويژگي است. نتايج ارزيابيهاي صورت گرفته برروي مدل FFANB نشان دهنده درصد دقت 0.9241 و صحت 0.9584 ميباشند كه حاكي از برتري مدل FFANB در مقايسه با بسياري از روشهاي پيشين ميباشد.
عنوان نشريه :
علوم رايانشي
عنوان نشريه :
علوم رايانشي