شماره ركورد كنفرانس :
4418
عنوان مقاله :
روشي جهت حذف وندهاي كلمات فارسي با استفاده از بر چسب دستوري نوع كلمات
پديدآورندگان :
مصلح فسايي رضا دانشگاه شيراز , صدرالديني محمد هادي دانشگاه شيراز , فخراحمد سيد مصطفي دانشگاه شيراز
تعداد صفحه :
۶
كليدواژه :
برچسب دستوري نوع كلمه , توالي وندها , نوع كلمات
سال انتشار :
۱۳۹۱
عنوان كنفرانس :
يازدهمين كنفرانس سراسري سيستم هاي هوشمند
زبان مدرك :
فارسي
چكيده فارسي :
هدف از اين مقاله، ارائه روشي حهت حذف lt; lt;وندهاي gt; gt; كلمات فارسي مي باشد. در زبان فارسي lt; lt;وندهاي gt; gt; مختلفي وجود دارند كه به قبل يا بعد از كلمات افزوده مي شوند. lt; lt;وندها gt; gt; باعث ايجاد هماهنگي كلمات، در جمله مي شوند اما در تغيير ماهيت كلمات تاثيري ندارند. در برخي از سيستم هاي پردازش متن فارسي از جمله سيستم هاي طبقه بندي كننده متون، به الگوريتم نياز است كه از طريق آنها، وندهاي فارسي را حذف مي كنيم تا متون، ساده تر شوند. در اين مقاله ابتدا به كلمات فاقد وند موجود در زبان فارسي، برچسب دستوري مي زنيم. برچسب دستوري، نوع كلمه را مشخص مي كند. نوع كلمه مي تواند اسم ، بن فعل ، وندها و ... باشد. سپس با شناسايي طولاني ترين توالي از وندهايي كه طبق دستور زبان فارسي به انواع مختلف كلمات متصل مي شوند، اقدام به حذف زير توالي وندهاي متصل به كلمات مي كنيم. جهت توليد زير توالي وندهاي كلمات فارسي، آنها را با استفاده از يك روال بازگشتي پردازش كرده و توالي نوع زير كلماتشان را استخراج مي كنيم. حذف توالي هاي وندي مجاز، با توجه نوع كلمه يا بعد از توالي وندها انجام مي شود. اين روش چون حذف وندها را با آگاهي از نوع كلمات انجام مي دهد، داراي دقت 99% مي باشد
كشور :
ايران
لينک به اين مدرک :
بازگشت