عنوان مقاله :
استخراج هوشمند مرز فراداده و متن در پايان نامه هاي فارسي با رويكرد BA_SVM
پديد آورندگان :
رهنما ، محدثه دانشگاه الزهرا (س) , هاشمي نژاد ، محمدحسين دانشگاه الزهرا (س) , نصيري ، جلال الدين پژوهشگاه علوم و فناوري اطلاعات ايران (ايرانداك)
كليدواژه :
استخراج فراداده , استخراج اطلاعات , ماشين بردار پشتيبان , الگوريتم فرامكاشفهاي , الگوريتم خفاش
چكيده فارسي :
استخراج فراداده باعث تسهيل در فرايند نمايهسازي و بهبود در بازيابي اطلاعات است. از سوي ديگر، خودكارسازي اين فرايند سبب افزايش كارايي نسبت به استخراج دستي فرادادههاست. نام دانشجو، نام اساتيد، عنوان، رشته و مقطع تحصيلي، چكيده، و كلمات كليدي نمونهاي از فرادادههاي پاياننامه است. هدف در اين مقاله شناسايي خودكار مرز فراداده و بدنه اصلي در پاياننامههاي فارسي است. بدين منظور، 250 پاياننامه ثبتشده در سامانه «ايرانداك» جمعآوري شده است. ويژگيهاي مد نظر از هر پاراگراف استخراج شده و سپس، پاراگرافهاي پاياننامه با روش ماشين بردار پشتيبان به دو كلاس فراداده و بدنه طبقهبندي شد. در اين پژوهش براي تنظيم پارامترهاي الگوريتم ماشين بردار پشتيبان، الگوريتم فرامكاشفهاي خفاش بهكار گرفته شده است. نتايج نشان ميدهد كه روش پيشنهادي با دقت 96.6 درصد نوع پاراگراف را تشخيص ميدهد.
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات