شماره ركورد كنفرانس :
3376
عنوان مقاله :
بهبود نظركاوي فارسي با استفاده از كشف عبارات دووجهي
عنوان به زبان ديگر :
Improving Persian Sentiment Analysis Using Opposing Polarity Phrases
پديدآورندگان :
بت شكنان دهكردي بتول Batoul_botshekanan@yahoo.com مؤسسه غيرانتفاعي صفاهان , بصيري محمد احسان basiri@eng.sku.ac.ir دانشگاه شهركرد
تعداد صفحه :
7
كليدواژه :
متن‏كاوي , نظركاوي , روش مبتني بر واژه‏نامه , عبارات دو وجهي , زبان فارسي
سال انتشار :
1397
عنوان كنفرانس :
چهارمين كنفرانس بين المللي وب پژوهي
زبان مدرك :
فارسي
چكيده فارسي :
امروزه بيشتر اطلاعات موجود در وب به صورت متن مي‏باشد، بنابراين متن‏كاوي و روش‏هاي مرتبط با آن اهميت زيادي يافته‏اند. رشد روزافزون وب باعث شده تا افراد نظرات خود را به راحتي بيان كنند و بتوانند از نظرات ديگران نيز آگاه شوند. كاوش ديدگاه‏ها و نظرات و تحليل احساسات به عنوان يكي از شاخه‏هاي كاوش متن در نظر گرفته‏ مي‏شود كه مهم‏ترين هدف آن كشف عقيده‏ي نويسنده‏ درباره‏ي يك موضوع است. رسيدن به اين هدف كار ساده‏اي نيست و احساسات يك جمله يا عبارت معمولاً از تركيب احساسات كلمات تشكيل دهنده‏ي آن تشخيص داده مي‏شود. در اين پژوهش بر روي عبارات دو وجهي يعني عباراتي كه شامل حداقل يك كلمه‏ي منفي و يك كلمه‏ي مثبت هستند تمركز مي‏شود. براي درنظر گرفتن عبارات دووجهي ابتدا عبارات با قطب مخالف از مجموعه داده‏ي PerSent استخراج مي‏شوند، سپس براساس كلمات تشكيل‏دهنده‏ي اين عبارات و با لحاظ قطبيت در جمله‏ي مربوطه امتيازدهي مي‏گردند. سپس امتياز هر جمله را با استفاده از واژه‏نامه‏ي CNRC به روش بيشينه قدرمطلق، تفاضل و ميانگين يك بار با در نظر گرفتن عبارات دووجهي و يك بار بدون درنظر گرفتن آنها، محاسبه مي‏نماييم. نتايج حاصل از پياده‏سازي روش پيشنهادي براي حل مسأله‏ي تعيين قطبيت و پيش‏بيني امتياز نشان مي‏دهد كه به‏كاربردن عبارت دووجهي باعث بهبود سيستم مبتني بر واژه‏نامه مي‏شود.
چكيده لاتين :
The increasing growth of Web has given people the ability to simply express their opinion and know others’ opinion. Mining viewpoints and opinion or sentiment analysis is considered as a subfield of text mining and its main goal is to find writer’s opinion about a topic. Meeting this goal is not a simple task since emotions in a sentence or a phrase are usually recognized by combining emotions of its words. In this paper, we concentrate on bipolar terms which are those phrases containing at least one positive and one negative word. In order to consider bipolar terms, phrases with opposing polarity are first extracted from PerSent dataset then, based on the words of these phrases and their polarity in the sentence the final score is computed. Then, the score of each sentence is calculated using CNRC lexicon and maximum of absolute values, difference, and average methods with and without considering bipolar terms. The results of implementation of the proposed method show that employing bipolar terms improves the lexicon-based approach for both polarity detection and score prediction problems.
كشور :
ايران
لينک به اين مدرک :
بازگشت