شماره ركورد كنفرانس :
4847
عنوان مقاله :
خلاصه سازي متن با استفاده از تركيب روشهاي هيستوگرام تكرار كلمات و شبكه هاي عصبي
پديدآورندگان :
شريفيان البرزي هومن human.sharifian@gmail.com دانشگاه آزاد اسلامي، واحد تهران شمال , نصيري جلال الدين j.Nasiri@irandoc.ac.ir دانشگاه آزاد اسلامي واحد تهران شمال , طايفه لادن l.tayefeh@cbi.ir دانشگاه آزاد اسلامي، واحد تهران شمال , حاج اسمعيلي مريم m.hajiesmaili@yahoo.co.uk دانشگاه آزاد اسلامي، واحد تهران مركز
كليدواژه :
متنكاوي , استخراج ويژگي , خلاصهسازي , شبكههاي عصبي
عنوان كنفرانس :
چهارمين كنفرانس ملي موضوعات نوين در علوم كامپيوتر و اطلاعات
چكيده فارسي :
يكي از مسايل پركاربرد در بحث پردازش متن و متنكاوي، خلاصهسازي متون و استخراج ويژگيهاي اصلي ميباشد. وجود انبوهي از كلمات كه به دليل قوانين نگارشي، برخي از يك ريشه هستند اما صّرف دستور زبان آنها را متفاوت نمودهاست، عمليات استخراج ويژگي را دشوار ميكند. در اين راستا روشهاي گوناگوني مطرح گرديده كه خوشهبندي واژگان و همچنين دستهبندي بر مبناي تعدد تكراركلمات از جمله اين موارد ميباشند. در مقاله موجود راهكاري با استفاده از روشي تركيبي متشكل از نمودار هيستوگرام براي شناسايي تعداد تكرار كلمات و نيز شبكههاي عصبي بهمنظور ارائه روشي كارا در خلاصهسازي متن به كار رفتهاست. با تركيب روشهاي فوق نقطه مناسبتري از نمودار هيستوگرام به منظور كاهش خطاي تعيين نقاط آستانه براي خلاصهسازي تعيين ميشود.