شماره ركورد كنفرانس :
4859
عنوان مقاله :
روش طبقهبندي نظرات در زبان فارسي با استفاده از روش طبقهبندي نظر جمعي GCM
عنوان به زبان ديگر :
Opinion Classification for Persian language by Global Consistency Maximization Approach
پديدآورندگان :
اله كرم نيلوفر N.allahkaram@yahoo.com جارت الكترونيك واحد علوم و تحقيقات دانشگاه آزاد اسلامي , ياري عليرضا A_yari@itrc.ac.ir پژوهشگاه ارتباطات و فناوري اطلاعات
كليدواژه :
نظركاوي , مستقل از زبان , مبتني بر پيوند , توئيتر
عنوان كنفرانس :
پنجمين كنفرانس بين المللي وب پژوهي
چكيده فارسي :
ﺗﻮييتر ﺑﺎ ﻓﺮاﻫﻢ ﻧﻤﻮدن ﺑﺴﺘﺮي ﺑﺮاي ﺑﯿﺎن اﺣﺴﺎﺳﺎت و نظرات در زﻣﯿﻨﻪﻫﺎي ﻣﺨﺘﻠﻒ، ﺑﺎ اﺳﺘﻘﺒﺎل ﺑﺴﯿﺎر روﺑﺮو ﺷﺪه اﺳﺖ. نظرﮐﺎوي را ميتوان از دو دﯾﺪﮔﺎه، ﻧﮕﺮش اﺣﺴﺎﺳﺎت ﻧﺴﺒﺖ ﺑﻪ ﻣﻮﺟﻮدﯾﺘﯽ ﺧﺎص و ﻧﮕﺮش اﺣﺴﺎﺳﺎت ﮐﻠﯽ ﯾﮏ ﺗﻮﺋﯿﺖ، ﻣﻮرد ﺑﺮرﺳﯽ ﻗﺮار داد ﮐﻪ در ﺗﻮييتر ﺑﯿﺸﺘﺮ ﺑﺮ روي دﯾﺪﮔﺎه دوم ﺗﺎﮐﯿﺪ ﻣﯽﮔﺮدد. ﺑﺮرﺳﯽ ﻧﮕﺮش ﮐﻠﯽ اﺣﺴﺎﺳﺎت ﯾﮏ ﺗﻮﺋﯿﺖ ﺑﻪ سه ﺷﯿﻮه آﻣﻮزش ﺑﺎ ﻧﻈﺎرت و ﺑﺮ ﭘﺎﯾﻪ ﻓﺮﻫﻨﮓ ﻟﻐﺎت و يا روش هاي تركيبي در زبان فارسي اﻧﺠﺎم ﻣﯽﺷﻮد اما در اين پژوهش ما سعي در ارائه روش نوين مبتني بر پيوند براي بهبود طبقهبندي نظرات در زبان فارسي داريم. اين روش با ويژگي مستقل از زبان بودن باعث بهبود الگوريتم هاي نظركاوي در زبان فارسي ميشود. نتايج بهدست آمده نشان ميدهد كه در زبان فارسي، بدليل پيچيدگيها و كمبود ابزار پيش پردازش، الگوريتمهاي مستقل از زبان بهتر عمل ميكنند. همچنين مقدار صحت در الگوريتم پيشنهادي براي نظرات موافق 98.87%، براي نظرات مخالف 97.87% و مقدار فراخواني براي نظرات موافق 99.24% و نظرات مخالف 96.84% ميباشد. اين الگوريتم پيشنهادي با دو الگوريتم تركيبي ديگر نظركاوي در زبان فارسي مقايسه شده است. در نتيجه در اين پژوهش ميزان بهبود صحت و فراخواني در مقايسه با ساير روشهاي زبان فارسي مشاهده ميشود.
چكيده لاتين :
Twitter has been so popular with providing a platform for sharing emotions and opinions. Because of vast application in two area of Social and political science and business, it gets more attention in opinion mining in social Medias. Opinion mining can be studied from two perspective, one from emotions about a specific entity and the other from general emotion of a tweet. In Twitter the focus is on second point of view. Studies of general emotions of a tweet in Persian are done by three approaches, supervised learning, lexicon based or a combination of both. In this work we try to recommend a novel approach based on linking for improve opinion classification in Persian. The results show language independent algorithms have better performance due to complexity and lack of pre-processing tools. The precision for Positive opinions is 98.87% and for negatives is 97.89%, also recall for positive opinions is 99.24% and for negatives is 96.84%. In this work, the language independent algorithm is compared to two lexicon based algorithms. The results show improvement in precision and recall compare to lexicon based methods.