شماره ركورد كنفرانس :
4163
عنوان مقاله :
سامانة خودكار خلاصهسازي با استفاده از روش تعبية متن
عنوان به زبان ديگر :
Automatic text summarization using text embedding
پديدآورندگان :
كهنسال محمود kohansal@ut.ac.ir دانشگاه تهران , فيلي هشام hfaili@ut.ac.ir دانشگاه تهران , فرضي سعيد saeedfarzi@gmail.com دانشگاه خواجهنصيرالدينطوسي
كليدواژه :
خلاصهسازي خودكار , پردازش متن , تعبية كلمات , پردازش زبان طبيعي.
عنوان كنفرانس :
چهارمين همايش ملي زبان شناسي رايانشي
چكيده فارسي :
گسترش استفاده از فناوريهاي نوين و در دسترس قرار گرفتن دادههاي زياد و متنوع، لزوم وجود ابزارهاي تسهيلكننده را براي سرعت بخشيدن به كسب اطلاعات مفيد و مختصر بيشتر نمايان ساختهاست. سامانههاي خودكار خلاصهساز متن يكي از كاربرديترين ابزارهاي پردازش زبان طبيعي است. در پژوهش پيش رو، يك سامانة خلاصهساز استخراجي تكسندي معرفي شدهاست كه با استفاده از روشهاي تعبية متن، متن ورودي را به برداري از اعداد حقيقي تبديل ميكند و سپس جملات برتر را براي ايجاد خلاصه انتخاب ميكند. اين روند بهصورت بدون ناظر و بدون استفاده از ويژگيهاي متن انجام ميشود. جهت ارزيابي اين سامانه از پيكرة استاندارد پاسخ استفاده شدهاست و سيستم پيشنهادي روي اين پيكره با سامانههاي ايجاز و فارسيسام بهعنوان دو سامانة موفق مقايسه شدهاند كه نتايج نشاندهندة افزايش فراخواني حداقل دو درصدي سامانة پيشنهادي بر اساس معيار ROUGE است.
چكيده لاتين :
The spread of using new technologies and the availability of diverse data shows the need for facilitating tools to accelerate the acquisition of more useful and brief information. Automatic Text Summarization systems are one of the most useful natural language processing tools. In this research, an extractive single-document summarization system is introduced that uses text embedding methods to convert the input text into a vector of real numbers and then selects the superior sentences for generating a summary.This process is performed unsupervised and without using of text features. To evaluate the system, the Pasokh standard dataset has been used and the proposed system has been compared with Ijaz and FarsiSum as two successful summarization systems. Theresults shows at least two percent increasing of recall for the proposed system based on the ROUGE measure.