شماره ركورد كنفرانس :
2139
عنوان مقاله :
بررسي ريشه ياب هاي واژگان زبان فارسي و تاثير آنها در كارايي سيستم هاي بازيابي اطلاعات متني
پديدآورندگان :
زاهدي محمد صادق نويسنده , بزرگي ارسطو نويسنده , فاتحي كاوان نويسنده
كليدواژه :
بازيابي اطلاعات متني , ريشه يابي , پردازش زبان طبيعي
عنوان كنفرانس :
نخستين كنفرانس بين المللي پردازش خط و زبان فارسي
چكيده فارسي :
ریشه یابی یكی از مهم ترین مباحث مطرح شده در پردازش زبان های طبیعی و بازیابی اطلاعات متنی است. در این مقاله سعی شده است در ابتدا یك دسته بندی كلی از روش هایی كه اخیرا برای ریشه یابی واژگان فارسی انجام شده است، ارائه دهیم و سپس به بررسی این روش ها پرداخته و كارایی این روش ها را در سیستم های بازیابی اطلاعات متنی با پیاده سازی مدل بازیابی اطلاعات “Okapi BM25” مورد ارزیابی قرار داده و بر اساس مقادیر معیارهای كارایی سیستم های بازیابی اطلاعات متنی، مقایسه كرده ایم. روش های بررسی شده در این مقاله عبارتند از: ریشه یاب آماری، ریشه یاب های مبتنی بر ساختار شامل ریشه یاب بن، ریشه یاب كاظم تقوی، ریشه یاب پایین به بالا، ریشه یاب چند فازه.
شماره مدرك كنفرانس :
4474716