عنوان مقاله :
شناسائي عملي كليكهاي هرز در وب با استفاده از الگوريتمهاي دستهبندي
پديد آورندگان :
فلاح ، مهديه داﻧﺸﮕﺎه ﻳﺰد - داﻧﺸﻜﺪه ﺑﺮق و ﻛﺎﻣﭙﻴﻮﺗﺮ , ظريفزاده ، سجاد داﻧﺸﮕﺎه ﻳﺰد - داﻧﺸﻜﺪه ﺑﺮق و ﻛﺎﻣﭙﻴﻮﺗﺮ
كليدواژه :
كليك هرز , شناسائي ربات ها , ناهنجاري , يادگيري ماشين
چكيده فارسي :
امروزه اكثر سرويسهاي اينترنتي از بازخورد كاربران براي بهبود كيفيت سرويسدهي به آنان استفاده مينمايند. به عنوان مثال، موتورهاي جستجو از اطلاعات كليك كاربران به عنوان يك فاكتور مهم در فرآيند رتبهبندي نتايج جستجو بهره ميبرند. از همينرو، برخي وب سايتها براي كسب رتبه بالاتر در بين مجموعه نتايج جستجو به انجام كليك بر روي نتايج خود ميپردازند. چون اين كليكها توسط كاربران واقعي انجام نگرفته، اصطلاحاً به آنها كليكهاي هرز گفته ميشود. براي اين منظور، وب سايتها معمولاً از برنامههاي نرمافزاري به نام رباتها استفاده ميكنند تا به صورت خودكار و توزيعشده به انجام اين كار بپردازند. در اين مقاله، روش جديدي مبتني بر دستهبندي نشستهاي كاربران جهت شناسائي كليكهاي هرز به صورت سريع و كارآمد پيشنهاد ميشود. ما در ابتدا نشستهاي كاربران را به صورت مجموعهاي از ويژگيها مدل ميكنيم و سپس با اعمال الگوريتم دستهبندي پيشنهادي، اقدام به شناسائي نشستهاي غير نرمال و در نتيجه كليكهاي هرز مينماييم. روش مطرح شده با لاگ واقعي يك موتور جستجوي فارسي مورد تحليل قرار گرفته است. نتايج بررسيها نشان ميدهد كه روش پيشنهادي ميتواند كليكهاي هرز را با دقتي بيش از 96% تشخيص دهد كه در مقايسه با كارهاي قبلي در حدود 5 درصد بهبود از خود نشان ميدهد.
عنوان نشريه :
علوم رايانش و فناوري اطلاعات
عنوان نشريه :
علوم رايانش و فناوري اطلاعات