عنوان مقاله :
نظركاوي افزايشي با استفاده از يادگيري فعال بر روي جريان متون
عنوان به زبان ديگر :
Incremental Opinion Mining Using Active Learning over a Stream of Documents
پديد آورندگان :
نوربهبهاني، فخرالدين دانشگاه خوانسار - گروه كامپيوتر
كليدواژه :
جريان داده ها , رانش مفهوم , نظركاوي , يادگيري افزايشي , يادگيري فعال
چكيده فارسي :
نظركاوي امروزه به عنوان يكي از كاربردهاي پراهميت پردازش زبان طبيعي مطرح است كه به دليل بالابودن حجم و نرخ نظرات توليدشده نياز به روشهاي ويژهاي براي پردازش دارد. امروزه با توجه به ماهيت جريان دادهاي نظرات كاربران در شبكههاي اجتماعي و سايتهاي تجارت الكترونيكي، استفاده از الگوريتمهاي دستهبندي غير افزايشي باعث ميگردد به مرور زمان كارايي مدل يادگرفتهشده براي كاوش نظرات كاهش يافته و عملاً غير قابل استفاده شود. علاوه بر اين به دليل نامحدودبودن تعداد نظرات، امكان برچسبگذاري تمام نظرات براي ايجاد نمونههاي آموزشي جديد و به روزرساني مدل يادگرفتهشده وجود ندارد. از آنجا كه ممكن است نظرات جديد داراي واژگان جديد بوده و يا توزيع دستههاي قطبيت تغيير كند، رانش مفهوم نيز ميبايست در نظركاوي افزايشي پشتيباني گردد. در اين مقاله يك روش جديد براي يادگيري قطبيت متون به صورت افزايشي ارائه ميگردد كه با استفاده از يادگيري فعال جريان دادهاي، متون ارزشمند براي بهروز رساني مدل دستهبندي را انتخاب ميكند و پس از تعيين برچسب آنها توسط متخصص انساني، از آنها براي بهبود مدل دستهبندي بهره ميگيرد. روش پيشنهادي به صورت برخط و بدون نياز به ذخيره متون، با استفاده از تعداد محدودي متون برچسبخورده آموزش ميبيند و قادر به تشخيص و پشتيباني از رانش مفهوم ميباشد. روش پيشنهادي با روشهاي شاخص افزايشي و غير افزايشي، با استفاده از مجموعه دادههاي معتبر و معيارهاي ارزيابي استاندارد مقايسه و ارزيابي ميشود.
چكيده لاتين :
Today, opinion mining is one the most important applications of natural language processing which requires special methods to process documents due to the high volume of comments produced. Since the users’ opinions on social networks and e-commerce websites constitute an evolving stream, the application of traditional non-incremental classification algorithm for opinion mining leads to the degradation of the classification model as time passes.
Moreover, because the users’ comments are massive, it is not possible to label enough comments to build training data for updating the learned model. Another issue in incremental opinion mining is the concept drift that should be supported to handle changing class distributions and evolving vocabulary.
In this paper, a new incremental method for polarity detection is proposed which with the application of stream-based active learning selects the best documents to be labeled by experts and updates the classifier. The proposed method is capable of detecting and handling concept drift using a limited labeled data without storing the documents. We compare our method with the state of the art incremental and non-incremental classification methods using credible datasets and standard evaluation measures. The evaluation results show the effectiveness of the proposed method for polarity detection of opinions.
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران