شماره ركورد كنفرانس :
4002
عنوان مقاله :
استخراج كلمات كليدي و دسته بندي متون با استفاده از ماشين بردار پشتيبان
پديدآورندگان :
هنرور عليرضا Alireza_honarvar@yahoo.co.uk گروه مهندسي كامپيوتر و فناوري اطلاعات، واحد صفاشهر، دانشگاه آزاد اسلامي، صفاشهر، ايران , ساريخاني فاطمه گروه مهندسي كامپيوتر و فناوري اطلاعات، واحد صفاشهر، دانشگاه آزاد اسلامي، صفاشهر، ايران
كليدواژه :
ريشهيابي , ماشين بردار پشتيبان , دستهبندي , كلمات كليدي , متون.
عنوان كنفرانس :
دومين كنفرانس ملي محاسبات توزيعي و پردازش داده هاي بزرگ
چكيده فارسي :
امروزه با افزايش روز افزون حجم اطلاعات متني، وجود روشهاي دستهبندي متون ضروري به نظر ميرسد. با توجه به اهميت موضوع و پژوهشهايي كه در اين زمينه براي زبانهاي ديگر دنيا انجام گرفته است، نياز به دستهبندي متون فارسي به خوبي احساس ميشود. در اين پژوهش با استفاده از يك سري اسناد آموزشي كه موضوع آنها از قبل مشخص شده است، به سيستم آموزش داده ميشود كه اسناد جديد را بتواند به صورت صحيح طبقهبندي نمايد. در اين پژوهش ابتدا با ريشهيابي Light Weight كلمات ريشهيابي شده و سپس با استفاده از اطلاعات متقابل و الگوريتم بردار پشتيبان به دستهبندي متون پرداخته است. آزمايشهاي انجام شده بر روي مجموعه پيكره همشهري در هشت دسته انجام شده است. نتايج بهدست آمده نشان ميدهد، الگوريتم دستهبندي كننده توانسته است به دقت 82% دست پيدا كند.