شماره ركورد :
1395342
عنوان مقاله :
طبقه‌بندي متون فارسي مبتني بر شبكه‌هاي عصبي عميق
پديد آورندگان :
فيضي‌درخشي ، محمدرضا دانشگاه تبريز - دانشكده مهندسي برق و كامپيوتر , متقي نيا ، زينب دانشگاه تبريز - دانشكده مهندسي برق و كامپيوتر , عسگري چناقلو ، ميثم دانشگاه تبريز - دانشكده مهندسي برق و كامپيوتر
از صفحه :
120
تا صفحه :
139
كليدواژه :
طبقه‌بندي متون , شبكه‌هاي عصبي عميق , بردار نمايش كلمات , تعبيه كلمات , يادگيري ماشين
چكيده فارسي :
امروزه با توجه به رشد روزافزون حجم اسناد الكترونيكي، طبقه‌بندي متون بر اساس روش‌هاي مختلفي در ميان محققين بازيابي اطلاعات و متون عموميت يافته است. با توجه به اهميت موضوع و كارهايي كه در اين زمينه در زبان‌هاي مختلف دنيا انجام گرفته است، نياز به طبقه‌بندي متون فارسي به خوبي احساس مي‌شود. به طور كلي روش‌هاي طبقه‌بندي متون را مي‌توان به روش‌هاي سنتي (مبتني بر انتخاب ويژگي و يادگيري ماشين) و روش‌هاي مبتني بر يادگيري عميق تقسيم‌بندي كرد. روش‌هاي مبتني بر يادگيري عميق به دليل توانايي اشتراك وزن به طور قابل توجهي سبب كاهش تعداد متغيرهاي آزاد آموزش‌پذير شبكه و در نتيجه افزايش تعميم‌پذيري شده است و نتايج بهتري به نسبت ساير روش‌ها مي‌دهد. در زبان فارسي روش‌هاي مبتني بر يادگيري عميق بسيار اندكي براي طبقه‌بندي متون ارائه‌شده است. در اين مقاله دو مدل شبكه عصبي عميق شامل شبكه عصبي پيچشي ParsCNN و شبكه عصبي با حافظه بلند كوتاه- مدت دوسويه سلسه‌مراتبي با لايه توجه ParsBiLSTM براي طبقه‌بندي متون فارسي تشريح شده است. كارايي سيستم‌هاي مبتني بر شبكه عصبي عميق بر روي مجموعه داده همشهري بررسي شده و از نظر سه معيار ارزيابي دقت، فراخواني و مقياس-F مورد مطالعه قرار گرفته است. نتايج آزمايش‌ها نشان مي‌دهد كه روش ParsCNN ميزان دقت 0.69، فراخواني 0.7 و مقياس-F 0.69؛ همچنين روش ParsBiLSTM ميزان دقت 0.72، فراخواني 0.73 و مقياس-F 0.72 دارند كه نشان‌دهنده كارايي بالاتر اين روش‌ها نسبت به روش‌هاي طبقه‌بندي متون فارسي مورد مطالعه است.
عنوان نشريه :
محاسبات نرم
عنوان نشريه :
محاسبات نرم
لينک به اين مدرک :
بازگشت