شماره ركورد كنفرانس :
3822
عنوان مقاله :
آشكارسازي خودكار طعنه در متون برخط فارسي با كمك الگوريتم‌هاي رده‌بندي
پديدآورندگان :
حسين زاده مرضيه دانشجوي كارشناسي ارشد دانشگاه آزاد اسلامي واحد دولت آباد , بصيري محمد احسان عضو هيئت علمي دانشگاه شهركرد , ربيعي اعظم باشگاه پژوهشگران جوان و نخبگان، واحد دولت‌آباد، دانشگاه آزاد اسلامي، اصفهان، ايران
تعداد صفحه :
13
كليدواژه :
الگوريتم‌هاي رده‌بندي , متون فارسي , طعنه كاوي , آشكارسازي خودكار , نظر كاوي.
سال انتشار :
1396
عنوان كنفرانس :
چهارمين كنفرانس ملي فناوري اطلاعات، كامپيوتر و مخابرات
زبان مدرك :
فارسي
چكيده فارسي :
استفاده گسترده از وب براي ابراز نظر و عقيده افراد باعث ايجاد حوزه مطالعاتي به نام نظركاوي شده است؛ هدف اصلي اين حوزه آشكارسازي نظرات مثبت و منفي نهفته در متن است يكي از زيرمجموعه‌هاي نظركاوي، طعنه كاوي است. در طعنه كاوي نيز نظرات مثبت و منفي به شكل معكوس ابراز مي‌شوند. هدف اين مقاله ارائه يك مدل با الگوريتم‌هاي رده‌بندي براي آشكارسازي طعنه است؛ كه متن را به‌عنوان طعنه‌آميز يا غير طعنه‌آميز رده‌بندي مي‌كند. تاكنون مطالعات مختلفي غالباً براي زبان انگليسي بر روي مسئله رده‌بندي متن طعنه‌آميز يا غير طعنه‌آميز انجام شده است؛ اما تاكنون تحقيقي روي زبان فارسي در اين حوزه گزارش نشده است. در اين مقاله، مدلي مبتني بر يادگيري ماشين براي رده‌بندي متن طعنه‌دار و بدون طعنه ارائه مي‌شود و براي يافتن بهترين الگوريتم‌هاي رده‌بندي، روش نايوبيز، ماشين بردار پشتيبان، درخت تصميم، رگرسيون لجستيك در مدل پيشنهادي آزمايش مي‌شود. براي اين كار يك مجموعه داده شامل 1320 توييت فارسي از سايت توييتر جمع‌آوري‌شده است. طبق نتايج آزمايشات، بهترين الگوريتم رده‌بندي با بالاترين درستي براي مدل پيشنهادي، الگوريتم رده‌بندي نايوبيز بدست آمد. اين الگوريتم و روش انتخاب ويژگيِ تكرار واژه بر روي اين مجموعه داده، درستي 06/91 درصد را به دست آورد.
كشور :
ايران
لينک به اين مدرک :
بازگشت