شماره ركورد كنفرانس :
2139
عنوان مقاله :
خلاصه سازي چكيده اي مبتني بر مشابهت جملات
پديدآورندگان :
پورغلامعلي فاطمه نويسنده , كاهاني محسن نويسنده , پورمعصومي آصف نويسنده
تعداد صفحه :
7
كليدواژه :
خلاصه سازي چكيده اي , شباهت معنايي , خلاصه سازي خودكار متن , خلاصه سازي گزينشي
سال انتشار :
1391
عنوان كنفرانس :
نخستين كنفرانس بين المللي پردازش خط و زبان فارسي
زبان مدرك :
فارسی
چكيده فارسي :
خلاصه سازی خودكار متن مبحثی مورد علاقه در زمینه های مختلف بازیابی اطلاعات می باشد. در یك تقسیم بندی كلی روش های خلاصه سازی خودكار متن به دو دسته تك سنده و چند سنده تقسیم بندی می شوند. روش ارائه شده در این مقاله در دسته دوم قرار می گیرد. این روش تركیبی از روش های گزینشی و چكیده ای می باشد. پس از پیش پردازش های لازم بر روی جملات اسناد و گزینش بهترین آنها از دیدگاه خلاصه سازی، یك معیار برای شباهت معنایی بین جملات ارائه می گردد. بر اساس این شباهت و بر مبنای نقش های معنایی جملات یك الگوریتم فشرده سازی به منظور حذف قسمت های غیر ضروری جملات اعمال می گردد. الگوریتم فشرده سازی پیشنهادی غیر نظارتی بوده و دارای نتایجی بهتر نسبت به روش های غیرنظارتی فشرده سازی جملات می باشد. پس از آن جملات به گروه هایی تقسیم شده و جملات موجود در هر گروه حذف و یا با یكدیگر ادغام می گردند. نتایج حاصل بر روی مجموعه داده DUC2007 نشانگر بهبود خلاصه سازی نسبت به بسیاری از روش مذكور می باشند.
شماره مدرك كنفرانس :
4474716
سال انتشار :
1391
از صفحه :
1
تا صفحه :
7
سال انتشار :
1391
لينک به اين مدرک :
بازگشت