شماره ركورد كنفرانس :
3299
عنوان مقاله :
ارائه يك روش در طبقه بندي نظرات كاربران با استفاده از يادگيري ماشين و الگوريتم راي گيري
پديدآورندگان :
مجيدي الهام دانشگاه كاشان - دانشكده مهندسي برق و كامپيوتر - گروه كارشناسي ارشد , باقري ايوب دانشگاه كاشان - دانشكده مهندسي برق و كامپيوتر - گروه كارشناسي ارشد
كليدواژه :
داده كاوي , متن كاوي , كلاس بندي متن , عقيده كاوي , نظرات آنلاين , كلاسيفاير
سال انتشار :
شهريور 1396
عنوان كنفرانس :
اولين كنفرانس بين المللي فناوري هاي نوين در علوم
زبان مدرك :
فارسي
چكيده فارسي :
با پيشرفت تكنولوژي و گسترش شبكه جهاني وب، وب بستر مناسبي براي آگاهي از يك محصول يا خدمات يا خريد محصول يا خدمات شده است. در بسياري از شبكههاي اجتماعي مثل اينستاگرام يا بلاگهاي شخصي يا وبسايت كمپانيها كاربران نظرات خود را راجع به يك محصول يا خدمات درج نمودهاند. اين نظرات از آن جهت با ارزش است كه باعث جذب يا دفع مشتري بالقوه ميشود يا ميتواند كمپاني را در گرفتن بازخورد از يك محصول و ارائه يك محصول بهتر يا استراتژي توليد محصول جديد ياري دهد. در نتيجه حجم زيادي اطلاعات به صورت غير ساخت يافته وجود دارد كه استخراج اطلاعات دلخواه از آنها كار دشواري است. عقيده كاوي فرآيند تحليل نظرات، عقايد و احساسات كاربران است كه از نقدها و نظراتي كه در مورد يك موضوع خاص نوشته اند استخراج ميشود. بيشترين و موفقترين روشهايي كه انجام شده با استفاده از روشهاي يادگيري ماشين است. در اين مقاله، در بين انواع روشهاي مختلف يادگيري ماشين، از الگوريتمي ابداعي به نام راي دهي استفاده شده است. اين الگوريتم از تلفيق الگوريتم هاي موجود و راي گرفتن از تمام آنها اقدام به جمع آوري رايها كرده و راي خود را مطابق راي اكثريت تعيين ميكند. در اين الگوريتم يك سري مجموعه استاندارد نظرات كاربران در مورد فيلم ها، براي آموزش و ارزيابي 1 الگوريتم به كار گرفته شده و اين نمونهها پيش پردازش و كلمات زائد آنها حذف شده است. ويژگيهاي اساسي اين نظرات به كمك روشهاي انتخاب واژگان انتخاب ميشود و با توجه به داده هاي آموزشي كه برچسب مثبت يا منفي دارند مشخص ميگردد كه كدام كلمات بار مثبت و منفي دارند سپس با استفاده از الگوريتم هاي پردازش زبان طبيعي 2 همچون بيز مدل آموزشي ساخته ميشود. الگوريتم هايي كه با اين داده هاي آموزشي مدل ميسازند 7 مورد هستند كه عبارتند از 1 - بيز ساده 3 شامل گاوسين 4 ، مالتينومينال 5 و برنولي 6 2 - ماشين بردار پشتيبان 7 شامل svc و svc خطي 3 - مدلهاي خطي شامل رگرسيون منطقي 8 و كلاسيفاير گراديان نزولي تصادفي 9 . حالا الگوريتم ارائه شده با نام الگوريتم راي دهي 10 براي هر قلم داده بررسي ميكند كه راي اكثريت با چيست و راي خود را راي اكثريت قرار ميدهد. هدف از روش پيشنهادي ارائه يك الگوريتم جديد براي شناسايي نظرات مثبت و منفي با بهترين مقادير ارزيابي نسبت به ساير روشها ميباشد.
چكيده لاتين :
With the development of technology and World Wide Web expansion, the Web has changed into a suitable place to get aware of a product or service or to buy that product or service. In many social networks such as Instagram, personal weblogs or company websites, users usually comment on a product or service. These comments are valuable as they attract or repel potential customers. They can also help a company to get feedbacks on its product and to provide a better product or new production strategy. Therefore, there is a lot of non-structured information which makes it difficult to extract the desired information. Opinion mining is the process of analyzing opinions, beliefs and emotions of users which are extracted form criticisms and ideas on a particular subject. Machine learning techniques are actually the best and mostly used techniques. In this article, an innovative algorithm known as Voting Algorithm has been used out of different kinds of machine learning techniques. Combining the existing algorithms and getting their votes, this algorithm gathers different votes and determines its vote based on the majority vote. In this algorithm a set of users’ comments standards about videos has been used for instruction and evaluation of the algorithm; these samples have been pre-processed and the unnecessary words have been omitted. The basic features of these comments are chosen based on word choice techniques; Also, based on the tutorial data which has a negative or positive tag, it can be clear which words have negative or positive connotation. Then using natural language processing algorithms, such as Bayes, the tutorial model is made. There are 7 algorithms which make models using these instructional data: 1. Naïve Bayes including Gaussian Naïve Bayes, Multi-nominal Naïve Bayes and Bernoulli Naïve Bayes, 2. Support Vector Machine including SVC and linear SVC, 3.linear models including Logistic Regression and Stochastic Gradient Descendant Classifier. Now, the Voting Algorithm investigates, for each kind of data, what the majority vote is and sets its vote based on the majority vote. The proposed method aims to provide a new algorithm to determine negative and positive comments, with the most optimum values of evaluation compared to other methods.
كشور :
ايران
تعداد صفحه 2 :
6
از صفحه :
1
تا صفحه :
6
لينک به اين مدرک :
بازگشت