شماره ركورد :
1218437
عنوان مقاله :
تحليل‌گر تصريفي فارسي معاصر
پديد آورندگان :
حيدرپور ، داوود دانشگاه تهران - دانشكده علوم و فنون نوين , سبط ، الهام سادات دانشگاه تهران - دانشكده علوم و فنون نوين , بي جن خان ، محمود دانشگاه تهران - گروه زبانشناسي , صالحي ، مصطفي دانشگاه تهران - دانشكده علوم و فنون نوين , ويسي ، هادي دانشگاه تهران - دانشكده علوم و فنون نوين
از صفحه :
945
تا صفحه :
969
كليدواژه :
پردازش زباني , تحليلگر تصريفي , گونه غيررسمي فارسي , فارسي معاصر , مبدل حالت محدود , آموزش فارسي
چكيده فارسي :
در سال‌هاي اخير، كاربرد گونه نوشتاري غيررسمي زبان فارسي به‌دليل گسترش روزافزون فضاي مجازي و شبكه‌هاي اجتماعي و تمايل كاربران به نزديك كردن زبان نوشتار به گفتار رشد چشمگيري داشته‌ است. با وجود اين، ابزارهاي پردازش اين گونه زباني به‌ميزان لازم توسعه داده نشده است. تحليلگرهاي تصريفي از جمله ابزارهايي است كه در پردازش زباني كاربرد وسيعي دارد و تاكنون براي گونه غيررسمي طراحي و پياده‌سازي نشده است. با توجه به اين‌كه گونه نوشتاري غيررسمي در كنار واژگان و قواعد صرفي و نحوي مختص ‌به‌خود، در بخشي از واژه‌ها و ساختارها با گونه رسمي مشترك است، در اين پژوهش با پوشش فارسي رسمي و غيررسمي اولين ابزار تحليل تصريفي فارسي معاصر براي همه اقسام واژه توسعه داده شده و تلاش شده همه ساختارهاي تصريفي واژه‌هاي فارسي غيررسمي پوشش داده شود. اين ابزار به‌صورت قاعده‌مند و مستقل از بافت و با بهره‌گيري از مبدل حالت محدود، پي‌بست‌ها و وندهاي تصريفي رسمي و غير‌رسمي را در واژه‌هاي زبان شناسايي و تحليل كرده، ستاك‌هاي رسمي و غيررسمي را نيز استخراج مي‌كند. به‌منظور پوشش دادن تمام ساخت‌ها و حالت‌هاي تصريفي، با توجه به رويكرد مستقل از بافت، الگوريتم براي هر واژه، تمام خوانش‌ها و معاني گوناگوني را كه مي‌تواند بسته به قرارگيري در بافت‌هاي گوناگون داشته‌ باشد، تحليل و ارائه مي‌كند. به‌منظور استخراج و بررسي واژگان و قواعد تصريفي و نگارشي گونه غير رسمي، پيكره فارسي معاصر از سياق‌ها و زيرسياق‌هاي گوناگون اين گونه زباني تهيه شده و در طراحي و آزمون تحليلگر مورد استفاده قرار گرفت. آزمون تحليلگر با استفاده از 1786 واژه يكتاي استخراج‌شده از پيكره، نتيجه 96.67 درصد را در معيار اف به‌دست داده است. از اين ابزار مي‌توان در انواع تحليل‌ها و كاربردهاي پردازش رايانه‌اي زبان فارسي و همچنين در آموزش فارسي، به‌ويژه محاوره فارسي به غير فارسي‌زبانان استفاده كرد.
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
لينک به اين مدرک :
بازگشت