عنوان مقاله :
طبقهبندي متون فارسي مبتني بر شبكههاي عصبي عميق
پديد آورندگان :
فيضيدرخشي ، محمدرضا دانشگاه تبريز - دانشكده مهندسي برق و كامپيوتر , متقي نيا ، زينب دانشگاه تبريز - دانشكده مهندسي برق و كامپيوتر , عسگري چناقلو ، ميثم دانشگاه تبريز - دانشكده مهندسي برق و كامپيوتر
كليدواژه :
طبقهبندي متون , شبكههاي عصبي عميق , بردار نمايش كلمات , تعبيه كلمات , يادگيري ماشين
چكيده فارسي :
امروزه با توجه به رشد روزافزون حجم اسناد الكترونيكي، طبقهبندي متون بر اساس روشهاي مختلفي در ميان محققين بازيابي اطلاعات و متون عموميت يافته است. با توجه به اهميت موضوع و كارهايي كه در اين زمينه در زبانهاي مختلف دنيا انجام گرفته است، نياز به طبقهبندي متون فارسي به خوبي احساس ميشود. به طور كلي روشهاي طبقهبندي متون را ميتوان به روشهاي سنتي (مبتني بر انتخاب ويژگي و يادگيري ماشين) و روشهاي مبتني بر يادگيري عميق تقسيمبندي كرد. روشهاي مبتني بر يادگيري عميق به دليل توانايي اشتراك وزن به طور قابل توجهي سبب كاهش تعداد متغيرهاي آزاد آموزشپذير شبكه و در نتيجه افزايش تعميمپذيري شده است و نتايج بهتري به نسبت ساير روشها ميدهد. در زبان فارسي روشهاي مبتني بر يادگيري عميق بسيار اندكي براي طبقهبندي متون ارائهشده است. در اين مقاله دو مدل شبكه عصبي عميق شامل شبكه عصبي پيچشي ParsCNN و شبكه عصبي با حافظه بلند كوتاه- مدت دوسويه سلسهمراتبي با لايه توجه ParsBiLSTM براي طبقهبندي متون فارسي تشريح شده است. كارايي سيستمهاي مبتني بر شبكه عصبي عميق بر روي مجموعه داده همشهري بررسي شده و از نظر سه معيار ارزيابي دقت، فراخواني و مقياس-F مورد مطالعه قرار گرفته است. نتايج آزمايشها نشان ميدهد كه روش ParsCNN ميزان دقت 0.69، فراخواني 0.7 و مقياس-F 0.69؛ همچنين روش ParsBiLSTM ميزان دقت 0.72، فراخواني 0.73 و مقياس-F 0.72 دارند كه نشاندهنده كارايي بالاتر اين روشها نسبت به روشهاي طبقهبندي متون فارسي مورد مطالعه است.
عنوان نشريه :
محاسبات نرم
عنوان نشريه :
محاسبات نرم