عنوان مقاله :
تحليلگر تصريفي فارسي معاصر
پديد آورندگان :
حيدرپور ، داوود دانشگاه تهران - دانشكده علوم و فنون نوين , سبط ، الهام سادات دانشگاه تهران - دانشكده علوم و فنون نوين , بي جن خان ، محمود دانشگاه تهران - گروه زبانشناسي , صالحي ، مصطفي دانشگاه تهران - دانشكده علوم و فنون نوين , ويسي ، هادي دانشگاه تهران - دانشكده علوم و فنون نوين
كليدواژه :
پردازش زباني , تحليلگر تصريفي , گونه غيررسمي فارسي , فارسي معاصر , مبدل حالت محدود , آموزش فارسي
چكيده فارسي :
در سالهاي اخير، كاربرد گونه نوشتاري غيررسمي زبان فارسي بهدليل گسترش روزافزون فضاي مجازي و شبكههاي اجتماعي و تمايل كاربران به نزديك كردن زبان نوشتار به گفتار رشد چشمگيري داشته است. با وجود اين، ابزارهاي پردازش اين گونه زباني بهميزان لازم توسعه داده نشده است. تحليلگرهاي تصريفي از جمله ابزارهايي است كه در پردازش زباني كاربرد وسيعي دارد و تاكنون براي گونه غيررسمي طراحي و پيادهسازي نشده است. با توجه به اينكه گونه نوشتاري غيررسمي در كنار واژگان و قواعد صرفي و نحوي مختص بهخود، در بخشي از واژهها و ساختارها با گونه رسمي مشترك است، در اين پژوهش با پوشش فارسي رسمي و غيررسمي اولين ابزار تحليل تصريفي فارسي معاصر براي همه اقسام واژه توسعه داده شده و تلاش شده همه ساختارهاي تصريفي واژههاي فارسي غيررسمي پوشش داده شود. اين ابزار بهصورت قاعدهمند و مستقل از بافت و با بهرهگيري از مبدل حالت محدود، پيبستها و وندهاي تصريفي رسمي و غيررسمي را در واژههاي زبان شناسايي و تحليل كرده، ستاكهاي رسمي و غيررسمي را نيز استخراج ميكند. بهمنظور پوشش دادن تمام ساختها و حالتهاي تصريفي، با توجه به رويكرد مستقل از بافت، الگوريتم براي هر واژه، تمام خوانشها و معاني گوناگوني را كه ميتواند بسته به قرارگيري در بافتهاي گوناگون داشته باشد، تحليل و ارائه ميكند. بهمنظور استخراج و بررسي واژگان و قواعد تصريفي و نگارشي گونه غير رسمي، پيكره فارسي معاصر از سياقها و زيرسياقهاي گوناگون اين گونه زباني تهيه شده و در طراحي و آزمون تحليلگر مورد استفاده قرار گرفت. آزمون تحليلگر با استفاده از 1786 واژه يكتاي استخراجشده از پيكره، نتيجه 96.67 درصد را در معيار اف بهدست داده است. از اين ابزار ميتوان در انواع تحليلها و كاربردهاي پردازش رايانهاي زبان فارسي و همچنين در آموزش فارسي، بهويژه محاوره فارسي به غير فارسيزبانان استفاده كرد.
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات