شماره ركورد كنفرانس :
3822
عنوان مقاله :
آشكارسازي خودكار طعنه در متون برخط فارسي با كمك الگوريتمهاي ردهبندي
پديدآورندگان :
حسين زاده مرضيه دانشجوي كارشناسي ارشد دانشگاه آزاد اسلامي واحد دولت آباد , بصيري محمد احسان عضو هيئت علمي دانشگاه شهركرد , ربيعي اعظم باشگاه پژوهشگران جوان و نخبگان، واحد دولتآباد، دانشگاه آزاد اسلامي، اصفهان، ايران
كليدواژه :
الگوريتمهاي ردهبندي , متون فارسي , طعنه كاوي , آشكارسازي خودكار , نظر كاوي.
عنوان كنفرانس :
چهارمين كنفرانس ملي فناوري اطلاعات، كامپيوتر و مخابرات
چكيده فارسي :
استفاده گسترده از وب براي ابراز نظر و عقيده افراد باعث ايجاد حوزه مطالعاتي به نام نظركاوي شده است؛ هدف اصلي اين حوزه آشكارسازي نظرات مثبت و منفي نهفته در متن است يكي از زيرمجموعههاي نظركاوي، طعنه كاوي است. در طعنه كاوي نيز نظرات مثبت و منفي به شكل معكوس ابراز ميشوند. هدف اين مقاله ارائه يك مدل با الگوريتمهاي ردهبندي براي آشكارسازي طعنه است؛ كه متن را بهعنوان طعنهآميز يا غير طعنهآميز ردهبندي ميكند. تاكنون مطالعات مختلفي غالباً براي زبان انگليسي بر روي مسئله ردهبندي متن طعنهآميز يا غير طعنهآميز انجام شده است؛ اما تاكنون تحقيقي روي زبان فارسي در اين حوزه گزارش نشده است. در اين مقاله، مدلي مبتني بر يادگيري ماشين براي ردهبندي متن طعنهدار و بدون طعنه ارائه ميشود و براي يافتن بهترين الگوريتمهاي ردهبندي، روش نايوبيز، ماشين بردار پشتيبان، درخت تصميم، رگرسيون لجستيك در مدل پيشنهادي آزمايش ميشود. براي اين كار يك مجموعه داده شامل 1320 توييت فارسي از سايت توييتر جمعآوريشده است. طبق نتايج آزمايشات، بهترين الگوريتم ردهبندي با بالاترين درستي براي مدل پيشنهادي، الگوريتم ردهبندي نايوبيز بدست آمد. اين الگوريتم و روش انتخاب ويژگيِ تكرار واژه بر روي اين مجموعه داده، درستي 06/91 درصد را به دست آورد.