عنوان مقاله :
بازشناسي برخط حروف مجزاي دستنويس فارسي براساس تشخيص گروه بدنه اصلي با استفاده از ماشين بُردار پشتيبان
عنوان فرعي :
The Recognition of Online Handwritten Persian Characters Based on their Main Bodies Using SVM
پديد آورندگان :
مهرعليان ، محمدامين نويسنده , , فولادي حسين آباد، كاظم نويسنده ,
اطلاعات موجودي :
دوفصلنامه سال 1391 شماره 17
كليدواژه :
بازشناسي برخط حروف فارسي , بازشناسي دستنوشته/ دستنويس , ريزحركت , ماشين بردار پشتيبان (SVM)
چكيده فارسي :
در اين مقاله روشي جديد براي بازشناسي برخط حروف مجزاي فارسي ارايه شده است كه با استخراج چند ويژگي ساده از دنباله نمونهبرداري شده از حروف و استفاده از دستهبندي كننده ماشين بردار پشتيبان( SVM) نتايج قابل قبولي را اريه ميدهد. الگوريتم پيشپردازش استفاده شده در اين كار امكان يكسان سازي ابعاد ويژگيها به ازاي حروف متعدد را فراهم ميكند تا در مرحله بعدي به منظور بازشناسي به دستهبندي كننده ارسال شود. فرآيند بازشناسي در دو مرحله صورت ميگيرد: در مرحله اوّل بدنه اصلي حرف ورودي (اوّلين حركت قلم) پس از استخراج ويژگي با استفاده از دستهبندي كننده در قالب يكي از هجده گروه بدنه اصلي حروف، طبقهبندي ميشود و سپس در مرحله دوم، موقعيت، تعداد و شكل ساير حركتها مانند نقطه و سركش (ريزحركتها)، نوع حرف نهايي را تعيين ميكند. به عنوان نمونه براي تشخيص حرف «ت» ابتدا گروه بدنه «ب، پ، ت، ث» تشخيص داده ميشود و سپس وجود ريزحركت «دونقطه» در بالاي آن منجر به انتخاب «ت» از اين گروه ميشود. درنهايت در فرآيند پسپردازش با استفاده از تطبيق اطّلاعات مربوط به بدنه اصلي و ريزحركات سامانه به تصحيح خطاهاي احتمالي موجود در مراحل قبلي پرداخته و دقّت بازشناسي را افزايش ميدهد به عنوان مثال اگر در مرحله دستهبندي بدنه حرف «ل» تشخيص داده شود ولي يك نقطه در بالاي آن قرار داشته باشد آنگاه سامانه تشخيص خود را به حرف «ن» تغيير خواهد داد. نتايج تجربي اين كار پژوهشي كه بر اساس مجموعه داده Online-TMU صورت گرفته است، متوسط نرخ بازشناسي بدنه اصلي را 94% نشان ميدهد و با درنظرگرفتن پسپردازشها بر اساس ريزحركتها اين نرخ به حدود 98% ميرسد.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها
اطلاعات موجودي :
دوفصلنامه با شماره پیاپی 17 سال 1391
كلمات كليدي :
#تست#آزمون###امتحان