شماره ركورد كنفرانس :
5141
عنوان مقاله :
تحليل احساسات در زبان فارسي با استفاده از شبكه هاي عميق بازگشتي دو طرفه و بيشنمونه برداري
پديدآورندگان :
فولادي قلعه كاظم kfouladi@ut.ac.ir گروه مهندسي كامپيوتر، دانشكده مهندسي، دانشكدگان فارابي، دانشگاه تهران، ايران , عرب محمود علي aliarab.m@gmail.com گروه مهندسي كامپيوتر، دانشكده مهندسي، دانشكدگان فارابي، دانشگاه تهران، ايران
كليدواژه :
تحليل احساسات , يادگيري عميق , شبكه حافظه طولاني كوتاه مدت , واحد بازگشتي گيت گذاري شده , جاسازي كلمات
عنوان كنفرانس :
هفتمين كنفرانس پردازش سيگنال و سيستمهاي هوشمند ايران
چكيده فارسي :
گسترش روز افزون استفاده از شبكههاي اجتماعي باعث توليد حجم بزرگي از دادهها شده است كه درصد عمدهاي از آنها دادههاي متني هستند. روشهاي نوين پردازش زبان طبيعي مبتني بر يادگيري عميق براي استخراج اطلاعات از اين دادهها به ما كمك ميكند و باعث افزايش دقت و سرعت در كار ميشود. تحليل احساسات متن، يك مسئله در پردازش زبان طبيعي است كه هدف آن تعيين ميزان مثبت يا منفي بودن يك متن ميباشد. با وجود پتانسيل بالاي زبان فارسي، چالشهايي وجود دارد كه باعث عدم توسعهي يك مدل مناسب براي تحليل احساسات در زبان فارسي شده است. در اين پژوهش با تركيب دو مدل يادگيري عميق يعني مدلهاي حافظه كوتاهمدت طولاني دو طرفه ) BiLSTM ( و واحد بازگشتي گيتگذاري شده دو طرفه ) BiGRU ( و نيز استفاده از روشهاي پيشپردازش مناسب و جاسازي كلمات، مدلي براي تحليل احساسات در زبان فارسي ارائه شده است. با آموزش و ارزيابي اين مدل بر روي مجموعه داده SentiPers كه شامل نظرات كاربران وبسايت ديجيكالا است، پس از متوازن سازي دادهها، دقت 92.7 درصد به دست آمد.