شماره ركورد كنفرانس :
4163
عنوان مقاله :
سامانة خودكار خلاصه‌سازي با استفاده از روش‌ تعبية متن
عنوان به زبان ديگر :
Automatic text summarization using text embedding
پديدآورندگان :
كهن‌سال محمود kohansal@ut.ac.ir دانشگاه تهران , فيلي هشام hfaili@ut.ac.ir دانشگاه تهران , فرضي سعيد saeedfarzi@gmail.com دانشگاه خواجه‌نصيرالدين‌طوسي
تعداد صفحه :
21
كليدواژه :
خلاصه‌سازي خودكار , پردازش متن , تعبية كلمات , پردازش زبان طبيعي.
سال انتشار :
1396
عنوان كنفرانس :
چهارمين همايش ملي زبان شناسي رايانشي
زبان مدرك :
فارسي
چكيده فارسي :
گسترش استفاده از فناوري‌هاي نوين و در دسترس قرار گرفتن داده‌هاي زياد و متنوع، لزوم وجود ابزارهاي تسهيل‌كننده‌ را براي سرعت بخشيدن به كسب اطلاعات مفيد و مختصر بيشتر نمايان ساخته‌است. سامانه‌هاي خودكار خلاصه‌ساز متن يكي از كاربردي‌ترين ابزارهاي پردازش زبان طبيعي است. در پژوهش پيش‌ رو، يك سامانة خلاصه‌ساز استخراجي تك‌سندي معرفي شده‌است كه با استفاده از روش‌هاي تعبية متن، متن ورودي را به برداري از اعداد حقيقي تبديل مي‌كند و سپس جملات برتر را براي ايجاد خلاصه انتخاب مي‌كند. اين روند به‌صورت بدون ناظر و بدون استفاده از ويژگي‌هاي متن انجام مي‌شود. جهت ارزيابي اين سامانه از پيكرة استاندارد پاسخ استفاده شده‌است و سيستم پيشنهادي روي اين پيكره با سامانه‌هاي ايجاز و فارسي‌سام به‌عنوان دو سامانة موفق مقايسه شده‌اند كه نتايج نشان‌دهندة افزايش فراخواني حداقل دو درصدي سامانة پيشنهادي بر اساس معيار ROUGE است.
چكيده لاتين :
The spread of using new technologies and the availability of diverse data shows the need for facilitating tools to accelerate the acquisition of more useful and brief information. Automatic Text Summarization systems are one of the most useful natural language processing tools. In this research, an extractive single-document summarization system is introduced that uses text embedding methods to convert the input text into a vector of real numbers and then selects the superior sentences for generating a summary.This process is performed unsupervised and without using of text features. To evaluate the system, the Pasokh standard dataset has been used and the proposed system has been compared with Ijaz and FarsiSum as two successful summarization systems. Theresults shows at least two percent increasing of recall for the proposed system based on the ROUGE measure.
كشور :
ايران
لينک به اين مدرک :
بازگشت