شماره ركورد :
1328956
عنوان مقاله :
انتخاب ويژگي با الگوريتم بهينه سازي حاصلخيزي زمينهاي كشاورزي براي تشخيص صفحات وب هرز
پديد آورندگان :
سخي دل هوسين ، محمد دانشگاه آزاد اسلامي واحد اروميه - گروه مهندسي كامپيوتر , سليمانيان قره چپق ، فرهاد دانشگاه آزاد اسلامي واحد اروميه - گروه مهندسي كامپيوتر
از صفحه :
83
تا صفحه :
92
كليدواژه :
صفحات وب هرز , طبقه بندي , الگوريتم حاصلخيــزي زمين هاي كشــاورزي , الگوريتم بيز ســاده , انتخاب ويژگي
چكيده فارسي :
در فضاي اينترنت، امكان به‌كارگيري انواع سرويس‌ها و خدمات متعدد براي كاربران مهيا شده است. همزمان با رشد و گسترش استفاده از اينترنت، تعداد هرز‌نويسان وب افزايش يافته است. صفحات وب هرز به اشكال مختلفي چون تبليغات تجاري و ويروس‌هايي نهان شده در صفحات وب جايگذاري مي‌شود. صفحات وب هرز علاوه بر تهديد امنيت كاربران در وب، موجب هدر رفتن منابع سيستم و ايجاد ترافيك مخرب نيز مي‌گردند؛ لذا ارايه راهكارهايي جهت مقابله با وب هرز ضروري به نظر مي‌رسد. يكي از روش‌هاي شناسايي و مقابله با صفحات وب هرز، طبقه‌بندي صفحات با استفاده از الگوريتم‌هاي يادگيري ماشين است. در اين مقاله، مدلي جديد برمبناي الگوريتم حاصلخيزي زمين‌هاي كشاورزي و بيز ساده با عنوان‌ FFANB براي تشخيص صفحات وب هرز پيشنهاد شده است. در مدل FFANB از الگوريتم حاصلخيزي زمين‌هاي كشاورزي براي انتخاب ويژگي و بيز ساده براي طبقه‌بندي نمونه‌ها استفاده شده است. هدف مدل FFANB كاهش ويژگي‌ها به منظور افزايش صحت بااستفاده از الگوريتم حاصلخيزي زمين‌هاي كشاورزي مي‌باشد كه از مجموعه داده WEBSPAM-UK2007 كه از معتبرترين مجموعه داده در زمينه شناسايي صفحات وب هرز مي‌باشد استفاده شده است. اين مجموعه داده شامل سه دسته ويژگي با عناوين ويژگي‌هاي مبتني بر محتوا (96 ويژگي)، ويژگي‌هاي مبتني بر پيوند (41 ويژگي) و ويژگي‌هاي مبتني بر پيوند تبديل يافته (138 ويژگي) مي‌باشد كه تعداد كل ويژگي‌ها برابر با 275 ويژگي است. نتايج ارزيابي‌هاي صورت گرفته برروي مدل FFANB نشان دهنده درصد دقت 0.9241 و صحت 0.9584 مي‌باشند كه حاكي از برتري مدل FFANB در مقايسه با بسياري از روش‌هاي پيشين مي‌باشد.
عنوان نشريه :
علوم رايانشي
عنوان نشريه :
علوم رايانشي
لينک به اين مدرک :
بازگشت