شماره ركورد :
997210
عنوان مقاله :
رفع اعوجاج هندسي متون به‌كمك اطلاعات هندسي خطوط متن
عنوان به زبان ديگر :
Document Image Dewarping using geometrical information extracted from document lines
پديد آورندگان :
طلوع بيدختي، محمد امين دانشگاه صنعتي شاهرود - دانشكده مهندسي برق - گروه الكترونيك , احمدي فرد، عليرضا دانشگاه صنعتي شاهرود - دانشكده مهندسي برق - گروه الكترونيك
تعداد صفحه :
18
از صفحه :
141
تا صفحه :
158
كليدواژه :
اعوجاج هندسي , پردازش دو بعدي اسناد , تخمين تبديل پرسپكتيو , نويسه‌ خوان نوري
چكيده فارسي :
تصاوير سند تهيه‌شده توسط پويش‌گر يا دوربين ديجيتال، همواره با اعوجاج‌هاي فتومتريك و هندسي همراه هستند. وجود هر دو نوع اعوجاج، باعث كاهش دقت عملكرد نرم‌افزارهاي شناسايي نويسه ­ها (OCR) مي­شوند. در اين مقاله روشي نوين جهت رفع اعوجاج‌هاي هندسي از تصاوير متني ارائه شده ­است. در روش پيشنهادي به‌منظور تصحيح اعوجاج هندسي، در ابتدا خطوط متن از تصوير استخراج و سپس هر خط متن به ستون­هايي به عرض مساوي شكسته مي­شوند. براي هر قطعه استخراج‌شده از يك خط، راستاي قطعه به‌ نحوي تصحيح مي‌شود كه حروف موجود در آن قطعه در راستاي افقي قرار گيرد. براي اين منظور به‌ازاي چرخش­هاي مختلف قطعۀ متن، افكنش افقي تصوير محاسبه مي­شود و چرخشي از قطعه كه بلندترين قله افكنش را ايجاد كند، راستاي تصحيح‌ شده آن قطعه در نظر گرفته مي‌شود. بر اين اساس يك نقطه مرجع كه معرف راستاي مبنا است، براي هر قطعه­خط هم‌راستا­شده با افق استخراج مي‌شود. به‌كمك نقاط مرجع، هر قطعه از خط، انحناي آن خط متن به‌كمك برازش يك تابع درجۀ سه به‌دست مي‌آيد. درنهايت با استفاده از تخمين تبديل پرسپكتيو، اعوجاج هندسي هر خط برطرف مي‌شود. جهت افزايش پايداري روش پيشنهادي در تخمين انحناي خطوط متن با طول كم، از انحناي خطوط با طول بزرگ­تر مجاور آن خط استفاده شده ‌است. روش­ پيشنهادي بر روي پايگاه­ هاي دادۀ فارسي و انگليسي پياده­سازي و با برخي روش‌هاي هم‌تراز آن مقايسه شده است. نتايج بيان‌گر قدرت و دقّت روش پيشنهادي در رفع اعوجاج هندسي است.
چكيده لاتين :
Document images produced by scanners or digital cameras usually have photometric and geometric distortions. If either of these effects distorts document, recognition of words from such a document image using OCR is subject to errors. In this paper we propose a novel approach to significantly remove geometric distortion from document images. In this method first we extract document lines from document using morphological operators. Then, extracted document lines are divided into a number of equal size column strips. This allows to assume that each segment of line document is not curved. Each extracted document line segment is aligned horizontally. For this purpose, a segment line of document is rotated at different angels and for each rotation horizontal projection is obtained. The rotation angle with maximum peak at the corresponding projection signal is selected to align the line segment, horizontally. In order to estimate the geometrical distortion, for each document line a reference point is extracted from each line segment. These points indicate the position of a document line at starting column of line segments. Using reference points of a document line a polynomial function is fitted to each document line. At the end, geometric distortion for each part of the document is eliminated using a perspective transformation. This transformation is estimated based on the extracted polynomial function. To increase the stability of the proposed method for short text lines, the curve of adjacent text lines of longer length is used. A post processing stage is required after applying perspective transformation on document patches. Since this transformation is a continuous mapping but it is applied on digital images. To remove this distortion from the result, the consistency of each pixel value with the value of neighboring pixels are considered to correct the value of inconsistence pixels. The proposed method is implemented on Persian and English databases and has been compared with the existing methods. The results indicate the efficiency and accuracy of the proposed method in elimination of geometric distortions.
سال انتشار :
1396
عنوان نشريه :
پردازش علائم و داده ها
فايل PDF :
7329281
عنوان نشريه :
پردازش علائم و داده ها
لينک به اين مدرک :
بازگشت