شماره ركورد كنفرانس :
3926
عنوان مقاله :
بازشناسي متن فارسي قديمي با استفاده از توصيف گرهاي ويولت در روش منهتن
پديدآورندگان :
رضائي فر مائده m_rezaeifar@sut.ac.ir دانشجوي دانشگاه صنعتي سهند تبريز،دانشكده برق , ابراهيمي افشين a_ebrahimi@sut.ac.ir دانشيار دانشگاه صنعتي سهند تبريز،دانشكده برق
كليدواژه :
بازشناسي متن قديمي , بسته تبديل موجك , تبديل موجك , روش منهتن , نويسه خوان نوري
عنوان كنفرانس :
بيست و چهارمين كنفرانس مهندسي برق ايران
چكيده فارسي :
در اين مقاله به ارائه روش جديدي براي بازشناسي اسناد چاپي قديمي فارسي مبتني بر شكل كلي كلمات با استفاده از بسته م جات و تبديل بسته موجك پرداخته ايم. بنابه ويژگيهاي خاص زبان فارسي و عربي بازشناسي اين زبانها بر اساس شكل كلي كلمات نسبت به زبانهاي لاتين و چيني متفاوت تر خواهد بود. كارهاي انجام شده، بيشتر بر متون دست نويس متمركز بوده است در حاليكه روش ارائه شده در اين مقاله براي بازشناسي يات كتاب چاپي قديمي فارسي است كه داري فونت خاص و چاپ سنگي است. روش ارائه شده بر پايه شكل كلي كلمات و استفاده از روش منهتن روي توصيفگرهاي موجك ميباشد. با تهيه واژه نامه مناسب از كتاب قديمي فارسي كه از 37861 زير كلمه مشابه و غير مشابه تشكيل شده است و استفاده از كد نقاط و فشارده سازي بردارهاي ويژگي، نرخ بازشناسي مناسبي با مقدار 88 % ارائه شده است.