عنوان مقاله :
رفع اعوجاج هندسي متون بهكمك اطلاعات هندسي خطوط متن
عنوان به زبان ديگر :
Document Image Dewarping using geometrical information extracted from document lines
پديد آورندگان :
طلوع بيدختي، محمد امين دانشگاه صنعتي شاهرود - دانشكده مهندسي برق - گروه الكترونيك , احمدي فرد، عليرضا دانشگاه صنعتي شاهرود - دانشكده مهندسي برق - گروه الكترونيك
كليدواژه :
اعوجاج هندسي , پردازش دو بعدي اسناد , تخمين تبديل پرسپكتيو , نويسه خوان نوري
چكيده فارسي :
تصاوير سند تهيهشده توسط پويشگر يا دوربين ديجيتال، همواره با اعوجاجهاي فتومتريك و هندسي همراه هستند. وجود هر دو نوع اعوجاج، باعث كاهش دقت عملكرد نرمافزارهاي شناسايي نويسه ها (OCR) ميشوند. در اين مقاله روشي نوين جهت رفع اعوجاجهاي هندسي از تصاوير متني ارائه شده است. در روش پيشنهادي بهمنظور تصحيح اعوجاج هندسي، در ابتدا خطوط متن از تصوير استخراج و سپس هر خط متن به ستونهايي به عرض مساوي شكسته ميشوند. براي هر قطعه استخراجشده از يك خط، راستاي قطعه به نحوي تصحيح ميشود كه حروف موجود در آن قطعه در راستاي افقي قرار گيرد. براي اين منظور بهازاي چرخشهاي مختلف قطعۀ متن، افكنش افقي تصوير محاسبه ميشود و چرخشي از قطعه كه بلندترين قله افكنش را ايجاد كند، راستاي تصحيح شده آن قطعه در نظر گرفته ميشود. بر اين اساس يك نقطه مرجع كه معرف راستاي مبنا است، براي هر قطعهخط همراستاشده با افق استخراج ميشود. بهكمك نقاط مرجع، هر قطعه از خط، انحناي آن خط متن بهكمك برازش يك تابع درجۀ سه بهدست ميآيد. درنهايت با استفاده از تخمين تبديل پرسپكتيو، اعوجاج هندسي هر خط برطرف ميشود. جهت افزايش پايداري روش پيشنهادي در تخمين انحناي خطوط متن با طول كم، از انحناي خطوط با طول بزرگتر مجاور آن خط استفاده شده است. روش پيشنهادي بر روي پايگاه هاي دادۀ فارسي و انگليسي پيادهسازي و با برخي روشهاي همتراز آن مقايسه شده است. نتايج بيانگر قدرت و دقّت روش پيشنهادي در رفع اعوجاج هندسي است.
چكيده لاتين :
Document images produced by scanners or digital cameras usually have photometric and geometric distortions. If either of these effects distorts document, recognition of words from such a document image using OCR is subject to errors. In this paper we propose a novel approach to significantly remove geometric distortion from document images. In this method first we extract document lines from document using morphological operators. Then, extracted document lines are divided into a number of equal size column strips. This allows to assume that each segment of line document is not curved. Each extracted document line segment is aligned horizontally. For this purpose, a segment line of document is rotated at different angels and for each rotation horizontal projection is obtained. The rotation angle with maximum peak at the corresponding projection signal is selected to align the line segment, horizontally. In order to estimate the geometrical distortion, for each document line a reference point is extracted from each line segment. These points indicate the position of a document line at starting column of line segments. Using reference points of a document line a polynomial function is fitted to each document line. At the end, geometric distortion for each part of the document is eliminated using a perspective transformation. This transformation is estimated based on the extracted polynomial function. To increase the stability of the proposed method for short text lines, the curve of adjacent text lines of longer length is used. A post processing stage is required after applying perspective transformation on document patches. Since this transformation is a continuous mapping but it is applied on digital images. To remove this distortion from the result, the consistency of each pixel value with the value of neighboring pixels are considered to correct the value of inconsistence pixels. The proposed method is implemented on Persian and English databases and has been compared with the existing methods. The results indicate the efficiency and accuracy of the proposed method in elimination of geometric distortions.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها