شماره ركورد كنفرانس :
4051
عنوان مقاله :
تشخيص ساختار اسناد در تصاوير پيچيده براي استفاده در سيستمهاي نويسه خوان نوري فارسي
پديدآورندگان :
ميرزايي محسن mo.mirzaie@ut.ac.ir دانشگاه تهران , ويسي هادي دانشگاه تهران
كليدواژه :
تشخيص ساختار اسناد , نويسه خوان نوري , استخراج متن.
عنوان كنفرانس :
دهمين كنفرانس ملي بينايي ماشين و پردازش تصوير ايران
چكيده فارسي :
در اين مقاله، به ارائه يك روش پيشنهادي براي تشخيص ساختار اسناد، در تصاوير پيچيده اسناد اسكن شده فارسي ، براي استفاده در سيستم هاي نويسهخوان نوري پرداخته شده است. هدف از مرحله تشخيص ساختار اسناد در سيستم هاي نويسه خوان نوري، تشخيص قسمت-هاي متني از غيرمتني است. عدم تشخيص قسمت هاي متني در تصاوير اسناد پيچيده باعث كاهش دقت سيستم-هاي نويسه خوان نوري مي شود. در روش پيشنهادي، با تحليل و تخمين برخي از ويژگي هاي تصاوير اسناد، از جمله فاصله بين خطوط پسزمينه، ابتدا نواحي غيرمتني تشخيص داده شده و از تصوير حذف مي شوند، در ادامه با چند مرحله آغشته سازي، محدوده جمله ها و كلمه ها در تصوير اسناد مشخص مي شوند. براي مقايسه و ارزشيابي روش پيشنهادي، بيست تصوير پيچيده از مجله هاي فارسي به عنوان داده آزمون تهيه و از بخش تحليل ساختار اسناد نويسه خوان نوري تسركت به عنوان روش مرجع استفاده شده است. روش پيشنهادي با دقت 87.2 درصد و با 4.16 درصد بهبود دقت نسبت به روش مرجع، توانست قسمت هاي متني و غير متني را تشخيص دهد.