شماره ركورد :
1219202
عنوان مقاله :
خلاصه‌سازي متون فارسي با استفاده از رويكرد كدگذاري تنك و بازنمايي عصبي جملات
پديد آورندگان :
فتوره‌چي ، رامين دانشگاه صنعتي اميركبير - دانشكده مهندسي كامپيوتر , ممتازي ، سعيده دانشگاه صنعتي اميركبير - دانشكده مهندسي كامپيوتر
از صفحه :
767
تا صفحه :
790
كليدواژه :
خلاصه سازي , پردازش زبان طبيعي , كدگذاري تُنُك , بازنمايي جملات
چكيده فارسي :
امروزه، گستردگي و تنوع اطلاعات متني باعث پيچيدگي فرايند يافتن دانش و الگو‌هاي مورد نظر از ميان آن‌ها شده ‌است. يكي از گام‌هاي مؤثر براي كاهش اين مشكل، خلاصه‌سازي است. در چند دهه گذشته مسئله خلاصه‌سازي با توجه به نمونه‌هاي گوناگون از جهات و ابعاد مختلف بررسي شده است.خلاصه‌سازي فرايندي هوشمند است كه انجام آن حتي براي انسان‌ها ساده‌ نيست و هر فردي با توجه به ديدگاهش مي‌تواند نتيجه متفاوتي ارائه دهد. يك خلاصه مناسب بايد داراي سه ويژگي پوشش، تُنُك‌بودن و تنوع باشد. بدين‌منظور در اين پژوهش براي در نظر گرفتن اين ويژگي‌ها يك روش بر مبناي كدگذاري تُنُك ارائه مي‌شود. با به‌كارگيري اين روش جملاتي به‌عنوان خلاصه نهايي انتخاب مي‌شوند كه حداقل خطا را در بازسازي جملات متن ورودي داشته باشند. سپس، با استفاده از روش‌هاي عصبي در بازنمايي معنايي كلمات و همچنين متون به بهبود روش پيشنهادي پرداخته مي‌شود. براي ارزيابي روش پيشنهادي از مجموعه دادگان پاسخ استفاده شده و نشان داده مي‌شود ‌كه روش پيشنهادي عملكرد بهتري نسبت به ساير پژوهش‌هاي انجام‌شده بر روي اين دادگان در زبان فارسي دارد. مدل پيشنهادي توانسته است به ‌ميزان 10.02 درصد و 8.65 درصد و به‌ترتيب در معيار F روژ1 ‌و روژ2 ‌بهبود حاصل نمايد.
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
لينک به اين مدرک :
بازگشت