شماره ركورد :
1067454
عنوان مقاله :
نظركاوي افزايشي با استفاده از يادگيري فعال بر روي جريان متون
عنوان به زبان ديگر :
Incremental Opinion Mining Using Active Learning over a Stream of Documents
پديد آورندگان :
نوربهبهاني، فخرالدين دانشگاه خوانسار - گروه كامپيوتر
تعداد صفحه :
10
از صفحه :
291
تا صفحه :
300
كليدواژه :
جريان داده ها , رانش مفهوم , نظركاوي , يادگيري افزايشي , يادگيري فعال
چكيده فارسي :
نظركاوي امروزه به عنوان يكي از كاربردهاي پراهميت پردازش زبان طبيعي مطرح است كه به دليل بالابودن حجم و نرخ نظرات توليدشده نياز به روش‌هاي ويژه‌اي براي پردازش دارد. امروزه با توجه به ماهيت جريان داده‌اي نظرات كاربران در شبكه‌‌هاي اجتماعي و سايت‌هاي تجارت الكترونيكي، استفاده از الگوريتم‌هاي دسته‌بندي غير افزايشي باعث مي‌گردد به مرور زمان كارايي مدل يادگرفته‌شده براي كاوش نظرات كاهش يافته و عملاً غير قابل استفاده شود. علاوه بر اين به دليل نامحدودبودن تعداد نظرات، امكان برچسب‌گذاري تمام نظرات براي ايجاد نمونه‌هاي آموزشي جديد و به روزرساني مدل يادگرفته‌شده وجود ندارد. از آنجا كه ممكن است نظرات جديد داراي واژگان جديد بوده و يا توزيع دسته‌هاي قطبيت تغيير كند، رانش مفهوم نيز مي‌بايست در نظركاوي افزايشي پشتيباني گردد. در اين مقاله يك روش جديد براي يادگيري قطبيت متون به صورت افزايشي ارائه مي‌گردد كه با استفاده از يادگيري فعال جريان‌ داده‌اي، متون ارزشمند براي به‌روز رساني مدل دسته‌بندي را انتخاب مي‌كند و پس از تعيين برچسب آنها توسط متخصص انساني، از آنها براي بهبود مدل دسته‌بندي بهره مي‌گيرد. روش پيشنهادي به صورت برخط و بدون نياز به ذخيره متون، با استفاده از تعداد محدودي متون برچسب‌خورده آموزش مي‌بيند و قادر به تشخيص و پشتيباني از رانش مفهوم مي‌باشد. روش پيشنهادي با روش‌هاي شاخص افزايشي و غير افزايشي، با استفاده از مجموعه داده‌هاي معتبر و معيارهاي ارزيابي استاندارد مقايسه و ارزيابي مي‌شود.
چكيده لاتين :
Today, opinion mining is one the most important applications of natural language processing which requires special methods to process documents due to the high volume of comments produced. Since the users’ opinions on social networks and e-commerce websites constitute an evolving stream, the application of traditional non-incremental classification algorithm for opinion mining leads to the degradation of the classification model as time passes. Moreover, because the users’ comments are massive, it is not possible to label enough comments to build training data for updating the learned model. Another issue in incremental opinion mining is the concept drift that should be supported to handle changing class distributions and evolving vocabulary. In this paper, a new incremental method for polarity detection is proposed which with the application of stream-based active learning selects the best documents to be labeled by experts and updates the classifier. The proposed method is capable of detecting and handling concept drift using a limited labeled data without storing the documents. We compare our method with the state of the art incremental and non-incremental classification methods using credible datasets and standard evaluation measures. The evaluation results show the effectiveness of the proposed method for polarity detection of opinions.
سال انتشار :
1397
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
فايل PDF :
7603181
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
لينک به اين مدرک :
بازگشت