شماره ركورد كنفرانس :
720
عنوان مقاله :
ايجاد يك طبقه بند خودكار متون زبان فارسي به منظور استفاده در كتابخانه هاي ديجيتال شهر الكترونيك
پديدآورندگان :
باشباغي سامان نويسنده , پرچمي مصطفي نويسنده , ختنلو حسن نويسنده , بشيري حسن نويسنده مربي گروه مهندسي كامپيوتر و فناوري اطلاعات
كليدواژه :
دسته بندي متن , شاخص گذاري متن , شهر الكترونيك و الگوريتم K نزديك ترين همسايه
عنوان كنفرانس :
مجموعه مقالات اولين همايش ملي انجير ديم
چكيده فارسي :
دسته بندي یا طبقه بندي متون، برچسب زدن متون زبان طبیعی با توجه به طبقه بنديهاي موضوعیِ حاصل از مجموعه هاي از قبل مشخص شده میباشد. دسته بندي خودكار متون و انتساب اسناد به دسته هاي از پیش تعیین شده، در ده سال اخیر توجهات زیادي را به سوي خود جلب كرده است. این مسأله به خاطر رشد سریع متون الكترونیكی و مسأله نیاز به دسترسی اسناد، مد ارك و مقالات علمی، صفحات وب، نامه هاي الكترونیكی و كتابخانه هاي دیجیتال بوده است. در این تحقیق براي پیاده سازي دسته بند خودكار براي متون فارسی، از الگوریتم K-NN كه از روشهاي یادگیري با ناظر است به منظور دسته بندي متون و اسناد شهر الكترونیك استفاده شده است. به منظور ارزیابی نتایج حاصل از دسته بندي، مجموعه اسناد فارسی پیكره همشهري به عنوان مجموعه هاي آموزشی و آزمایشی بكار رفته است. نتایج آزمایشات كه با استفاده از توابع مشابهت مختلف به دست آمده است، نشان از دقت بسیار بالاي روش دارد.
شماره مدرك كنفرانس :
3608842