عنوان مقاله :
بازشناسي كلمات دستنويس فارسي براساس ويژگي كد زنجيرهاي فريمن دنباله مركز جرم و طبقهبند بهبود يافته
پديد آورندگان :
خسروي ، سارا - دانشكده مهندسي كامپيوتر , چاله چاله ، عبداله - دانشكده مهندسي كامپيوتر
كليدواژه :
بازشناسي برونخط كلمات فارسي دستنويس , كد زنجيرهاي فريمن دنباله مركز جرم (CSFCC) , ويژگيهاي ريختشناسي , ماشين بردار پشتيبان (SVM) , الگوريتم بهينهسازي PSOGSA
چكيده فارسي :
در اين مقاله روش جديدي براي بازشناسي برونخط كلمات فارسي دستنويس ارائه شده است. روش پيشنهادي شامل معرفي ويژگي جديد و قدرتمند كد زنجيرهاي فريمن دنباله مركز جرم (CSFCC)، در كنار استفاده از ويژگيهاي ريختشناسي و همچنين استفاده از طبقهبند ماشين بردار پشتيبان (SVM) بهبود يافته ميباشد. در روش پيشنهادي، طبقهبند ماشين بردار پشتيبان(SVM)، با استفاده از تركيب دو الگوريتم بهينهسازي ازدحام ذرات (PSO) و الگوريتم جستجوي گرانشي (GSA)، كه بهاختصار آن را PSOGSA ميناميم؛ بهبود يافته است. رويكرد به كار برده شده در اين تحقيق، تشخيص تمامي اجزاي متصل به هم در كلمه و سپس تركيب آنها با يكديگر ميباشد. به همين منظور، يك فرهنگ لغت تصويري از زيركلمات بدون علامت تهيه شده است. علاوه بر اين، بهمنظور كاهش فضاي جستجو، افزايش سرعت و دقت بازشناسي، يك پايگاه داده از موقعيت زيركلمات بدون علامت اصلي نيز ايجاد و مورد استفاده قرار گرفته است. اين كار باعث شد؛ تا براي بازشناسي يك زيركلمه، براساس موقعيت آن در كلمه اصلي تصميمگيري و احتمال تشخيص درست افزايش يابد. روش پيشنهادي بر روي پايگاه داده شناخته شدهي ايرانشهر كه شامل حدود 17000 تصوير از اسامي دستنويس 503 شهر ايران است؛ اجرا شده است. دقت بازشناسي به دست آمده در روش پيشنهادي، 89% در بخش آزمايش ميباشد؛ كه نشاندهنده توانمندي روش پيشنهادي و بهبود نتايج در مقايسه با ديگر روشهاي موجود است.
عنوان نشريه :
رايانش نرم و فناوري اطلاعات
عنوان نشريه :
رايانش نرم و فناوري اطلاعات