تشخيص اسپم در شبكه اجتماعي توييتر با استفاده از رويكرد يادگيري تركيبي

پديد آورندگان

فصيحي ، مريم دانشگاه علم و فرهنگ - گروه مهندسي كامپيوتر , شايگان فرد ، محمدجواد دانشگاه علم و فرهنگ - گروه مهندسي كامپيوتر , حسيني مقدم ، زهرا سادات دانشگاه علم و فرهنگ - گروه مهندسي كامپيوتر , سجده ، زهرا دانشگاه علم و فرهنگ - گروه مهندسي كامپيوتر

از صفحه

284

تا صفحه

290

كليدواژه

توييتر , شناسايي اسپم , شبكه عصبي , Autoencoder , Softmax

چكيده فارسي

امروزه شبكه‌هاي اجتماعي، نقش مهمي در گسترش اطلاعات در سراسر جهان دارند. توييتر يكي از محبوب‌ترين شبكه‌هاي اجتماعي است كه در هر روز 500 ميليون توييت در اين شبكه ارسال مي‌شود. محبوبيت اين شبكه در ميان كاربران منجر شده تا اسپمرها از اين شبكه براي انتشار پست‌هاي هرزنامه استفاده كنند. در اين مقاله براي شناسايي اسپم در سطح توييت از تركيبي از روش‌هاي يادگيري ماشين استفاده شده است. روش پيشنهادي، چارچوبي مبتني بر استخراج ويژگي است كه در دو مرحله انجام مي‌شود. در مرحله اول از Stacked Autoencoder براي استخراج ويژگي‌ها استفاده شده و در مرحله دوم، ويژگي‌هاي مستخرج از آخرين لايه Stacked Autoencoder به‌‌عنوان ورودي به لايه softmax داده مي‌شوند تا اين لايه پيش‌بيني را انجام دهد. روش پيشنهادي با برخي روش‌هاي مشهور روي پيكره متني Twitter Spam Detection با معيارهاي Accuracy، -Score1F، Precision و Recall مورد مقايسه و ارزيابي قرار گرفته است. نتايج تحقيق نشان مي‌دهند كه دقت كشف روش پيشنهادي به 78/1% مي‌رسد. در مجموع، اين روش با استفاده از رويكرد اكثريت آرا با انتخاب سخت در يادگيري تركيبي، توييت‌هاي اسپم را با دقت بالاتري نسبت به روش‌هاي CNN، LSTM و SCCL تشخيص مي‌دهد.

عنوان نشريه

مهندسي برق و مهندسي كامپيوتر ايران

عنوان نشريه

مهندسي برق و مهندسي كامپيوتر ايران

لينک به اين مدرک

https://search.isc.ac/dl/search/defaultta.aspx?DTC=8&DC=1374457