شماره ركورد كنفرانس :
1732
عنوان مقاله :
جداسازي حروف در متون چاپي فارسي با طراحي يك فيلتر جديد مستقل از نوع و اندازه قلم
پديدآورندگان :
نادي فرزاد نويسنده , صدري جواد نويسنده , حاتم احمد نويسنده
كليدواژه :
بازشناسي كلمات فارسي , متون چاپي فارسي , كانتور , جدا سازي حروف
عنوان كنفرانس :
دومين همايش ملي علوم و مهندسي كامپيوتر
چكيده فارسي :
در این مقاله، یك الگوریتم جهت جداسازی حروف در متون چاپی فارسی ارائه شده است. این الگوریتم مبتنی بر برآمدگی هایی است كه در بالای خط زمینه وجود دارند. برای تشخیص نقاط جداسازی از یك فیلتر 3*3 استفاده شده است كه روی كل تصویر چرخانده می شود با استفاده از پیش پردازش و قوانین ساده تمامی مقادیر حد آستانه كه در روش های قبلی وجود داشته از بین می رود. برای تست توانایی الگوریتم در مرحله اول از كلمات تولید شده توسط كامپیوتر استفاده شده است و در مرحله دوم برای تست مقاومت الگوریتم در برابر كاهش اندازه قلم از یك متن اسكن شده با 11 قلم معروف فارسی با اندازه قلم 8 تا 22 و با سطوح كیفیت 150 ، 200 و 300 نقطه بر اینچ استفاده شده است. بر اساس آزمایشات انجام گرفته بدترین نتیجه مربوط به قلم BLotus با اندازه قلم 9 با میزان خطای 5,16 درصد و بهترین نتیجه مربوط به قلم Tahoma با اندازه قلم های مختلف با میزان خطای 0 درصد می باشد.
شماره مدرك كنفرانس :
4461009