• شماره ركورد
    1398001
  • عنوان مقاله

    ارتقاء و اصلاح فرايندهاي رايج در بازشناسي نوري حروف متون فارسي با بكارگيري ويژگي‌هاي خط فارسي و الگوريتم انتقال فضا

  • پديد آورندگان

    زارعيان ، آرش دانشگاه پيام نور مركز تهران - دانشجوي دكتري گروه زبان‌شناسي , موسوي ميانگاه ، طيبه دانشگاه پيام نور مركز تهران - گروه زبان‌شناسي , روشن ، بلقيس دانشگاه پيام نور مركز تهران - گروه زبان‌شناسي , فخر احمد ، مصطفي دانشگاه شيراز - دانشكده مهندسي برق و كامپيوتر - گروه كامپيوتر

  • از صفحه
    363
  • تا صفحه
    400
  • كليدواژه
    بازشناسي نوري حروف , اُ.سي.آر , الگوريتم انتقال فضا نظام , نگارشي زبان فارسي , ويژگي‌هاي خطي فارسي
  • چكيده فارسي
    از آنجا كه فن آوري بازشناسي نوري حروف (ا.سي.آر) اصالتاً بر پايه ويژگي‌هاي خطي لاتين بنا شده است، تقريباً كليه الگوريتم‌ها و مراحل مورد استفاده در نظام‌هاي رايج بازشناسي حروف فارسي نيز بر اساس همان ساختار و ويژگي‌هاي خطوط لاتين گسترش يافته‌اند. بكارگيري ابزار و ويژگي‌هاي خطوط لاتين در طراحي نظام‌هاي فارسي محور، نه تنها در نهايت به انجام بازشناسي صحيح حروف فارسي منجر نگرديده است، بلكه باعث سردرگمي همزمان نرم‌افزار و كاربر فارسي‌زبان نيز شده است. از اينرو، در اينجا، پس از مقدمه‌اي كوتاه پيرامون اهميت خط و زبان در حوزه فن‌آوري اطلاعات به سير تحول خط فارسي در دوره‌هاي مختلف و شرح ويژگي‌هاي اين خط و تفاوت‌هاي آن با خطوط ديگر پرداخته شده است و عناصر شكلي اين خط، با توجه به كاربرد و اهميت آنها در تعامل كاربر با نرم‌افزارهاي بازشناسي نوري متون فارسي، طيقه‌بندي گرديده است. در اين بخش، با توصيف و تحليل مراحل بازشناسي حروف بر اساس ويژگي‌هاي خط فارسي و شرح تفاوتهاي آن با گونه‌هاي لاتين محور موجود، چهره‌اي متفاوت از دستگاه خط فارسي به هنگام كار با رايانه‌ها و به ويژه در سيستم‌هاي بازشناسي نوري حروف عرضه مي‌شود بطوري كه مخاطب عملاً قابليت و ظرفيت‌هاي دستگاه خط فارسي در هماوردي با دستگاه ساده خط لاتين را مشاهده خواهد نمود. با اتكا به همين ويژگي‌ها، در جهت ارتقاء و اصلاح الگوريتم‌هاي رايج در بازشناسي نوري حروف فارسي، تسهيل بكارگيري الگوها، و تعديل حجم پايگاه داده‌ها، از فرايند انتقال هندسي فضاي دو بعدي به تك بعدي نيز بهره جسته‌ايم.
  • عنوان نشريه
    جستارهاي زباني
  • عنوان نشريه
    جستارهاي زباني