شماره ركورد كنفرانس :
248
عنوان مقاله :
ايجاد يك طبقه بند خودكار متون زبان فارسي به منظور استفاده در كتابخانه هاي ديجيتال شهر الكترونيك
پديدآورندگان :
باشباغي سامان نويسنده , پرچمي مصطفي نويسنده , ختن لو حسن نويسنده , بشيري حسن نويسنده مربي گروه مهندسي كامپيوتر و فناوري اطلاعات
تعداد صفحه :
5
كليدواژه :
دسته بندي متن , شاخص گذاري متن , شهر الكترونيك
عنوان كنفرانس :
همايش ملي شهر الكترونيك
زبان مدرك :
فارسی
چكيده فارسي :
دسته بندي یا طبقه بندي متون، برچسب زدن متون زبان طبیعی با توجه به طبقهبنديهاي موضوعیِ حاصل از مجموعه هاي از قبل مشخص شده میباشد. دسته بندي خودكار متون و انتساب اسناد به دسته هاي از پیش تعیین شده، در ده سال اخیر توجهات زیادي را به سوي خود جلب كرده است. این مسأله به خاطر رشد سریع متون الكترونیكی و مسأله نیاز به دسترسی اسناد، مد ارك و مقالات علمی، صفحات وب، نامه هاي الكترونیكی و كتابخانه هاي دیجیتال بوده است. در این تحقیق براي پیاده سازي دسته بند خودكار براي متون فارسی،از الگوریتم K-NN كه از روش های یادگیری با ناظر است به منظور دسته بندی متون و اسناد شهر الكترونیك استفاده شده است. به منظور ارزیابی نتایج حاصل از دستهبندي، مجموعه اسناد فارسی پیكره همشهري به عنوان مجموعه هاي آموزشی و آزمایشی بكار رفته است. نتایج آزمایشات كه با استفاده از توابع مشابهت مختلف به دست آمده است، نشان از دقت بسیار بالاي روش دارد.
شماره مدرك كنفرانس :
1821839
سال انتشار :
1390
از صفحه :
1
تا صفحه :
5
سال انتشار :
0
لينک به اين مدرک :
بازگشت