عنوان مقاله :
خلاصهسازي متون فارسي با استفاده از رويكرد كدگذاري تنك و بازنمايي عصبي جملات
پديد آورندگان :
فتورهچي ، رامين دانشگاه صنعتي اميركبير - دانشكده مهندسي كامپيوتر , ممتازي ، سعيده دانشگاه صنعتي اميركبير - دانشكده مهندسي كامپيوتر
كليدواژه :
خلاصه سازي , پردازش زبان طبيعي , كدگذاري تُنُك , بازنمايي جملات
چكيده فارسي :
امروزه، گستردگي و تنوع اطلاعات متني باعث پيچيدگي فرايند يافتن دانش و الگوهاي مورد نظر از ميان آنها شده است. يكي از گامهاي مؤثر براي كاهش اين مشكل، خلاصهسازي است. در چند دهه گذشته مسئله خلاصهسازي با توجه به نمونههاي گوناگون از جهات و ابعاد مختلف بررسي شده است.خلاصهسازي فرايندي هوشمند است كه انجام آن حتي براي انسانها ساده نيست و هر فردي با توجه به ديدگاهش ميتواند نتيجه متفاوتي ارائه دهد. يك خلاصه مناسب بايد داراي سه ويژگي پوشش، تُنُكبودن و تنوع باشد. بدينمنظور در اين پژوهش براي در نظر گرفتن اين ويژگيها يك روش بر مبناي كدگذاري تُنُك ارائه ميشود. با بهكارگيري اين روش جملاتي بهعنوان خلاصه نهايي انتخاب ميشوند كه حداقل خطا را در بازسازي جملات متن ورودي داشته باشند. سپس، با استفاده از روشهاي عصبي در بازنمايي معنايي كلمات و همچنين متون به بهبود روش پيشنهادي پرداخته ميشود. براي ارزيابي روش پيشنهادي از مجموعه دادگان پاسخ استفاده شده و نشان داده ميشود كه روش پيشنهادي عملكرد بهتري نسبت به ساير پژوهشهاي انجامشده بر روي اين دادگان در زبان فارسي دارد. مدل پيشنهادي توانسته است به ميزان 10.02 درصد و 8.65 درصد و بهترتيب در معيار F روژ1 و روژ2 بهبود حاصل نمايد.
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات