عنوان مقاله :
تجزيه و تحليل طرحبندي تصاوير متني مبتني بر طبقهبندي نواحي در يك ساختار سلسلهمراتبي تصميمگيري
عنوان فرعي :
Page Layout Analysis of the Document Image Based on the Region Classification in a Decision Hierarchical Structure
پديد آورندگان :
پورقاسم، حسين نويسنده دانشگاه آزاد اسلامي واحد نجف آباد ,
اطلاعات موجودي :
فصلنامه سال 1389 شماره 3
كليدواژه :
طبقه بندي , تصاوير متني و غير متني , ويژگيهاي بافتي , تجزيه و تحليل طرح بندي صفحات
چكيده فارسي :
تبديل اسناد كاغذي به صورت نسخه الكترونيكي جهت ذخيرهسازي، بازيابي و جستجو بر اساس محتوا مساله مهمي در سيستمهاي خودكارسازي اداراي و سيستمهايي كه وظيفه استخراج اطلاعات از مجاري اينترنت دارند، به شمار ميرود. براي نيل به اين هدف، ارايه سيستمهايي كه بتواند محتواي تصاوير متني1 را تجزيه و تحليل كنند، ضروري به نظر ميرسد. در اين مقاله، جهت تجزيه و تحليل تصاوير متني و دسترسي به محتواي آنها، يك ساختار سلسلهمراتبي طبقهبندي مبتني بر يك الگوريتم ناحيهبندي دو مرحلهاي پيشنهاد شده است. در اين ساختار، تصوير به وسيله الگوريتم پيشنهادي ناحيهبندي دومرحلهاي، ناحيهبندي ميشود. سپس متنيبودن و غيرمتني (عكسي) بودن نواحي حاصل به كمك چندين طبقهبند در يك ساختار سلسلهمراتبي طبقهبندي مشخص ميگردد. الگوريتم ناحيهبندي پيشنهادي از دو مرحله ناحيهبندي مبتني بر تبديل موجك و آستانهگذاري استفاده ميكند. از ويژگيهاي بافت همچون ويژگي همبستگي، انرژي، همگني و آنتروپي مستخرج از ماتريس همرخدادي و همچنين دو ويژگي مستخرج از زيرباندهاي تبديل موجك، جهت طبقهبندي و شناسايي برچسب نواحي شكل گرفته در مرحله ناحيهبندي استفاده ميگردد. طبقهبند سلسهمراتبي از دو طبقهبند پرسپترون چندلايه2 و يك طبقهبند ماشين بردار پشتيبان3 تشكيل شده است. الگوريتم پيشنهادي بر روي يك پايگاه داده تصاوير متني و غيرمتني كه از تصاوير موجود در اينترنت فراهم شده است، مورد ارزيابي قرار گرفته است. نتايج آزمايشها بيانگر كارايي روش پيشنهادي در ناحيهبندي تصاوير و طبقهبندي نواحي تصاوير است. الگوريتم پيشنهادي، صحت 97.5% را براي طبقهبندي نواحي تصاوير فراهم كرده است.
چكيده لاتين :
The conversion of document image to its electronic version is a very important problem in the saving, searching and retrieval application in the official automation system. For this purpose, analysis of the document image is necessary. In this paper, a hierarchical classification structure based on a two-stage segmentation algorithm is proposed. In this structure, image is segmented using the proposed two-stage segmentation algorithm. Then, the type of the image regions such as document and non-document image is determined using multiple classifiers in the hierarchical classification structure. The proposed segmentation algorithm uses two algorithms based on wavelet transform and thresholding. Texture features such as correlation, homogeneity and entropy that extracted from co-occurrenc matrix and also two new features based on wavelet transform are used to classifiy and lable the regions of the image. The hierarchical classifier is consisted of two Multilayer Perceptron (MLP) classifiers and a Support Vector Machine (SVM) classifier. The proposed algorithm is evaluated on a database consisting of document and non-document images that provides from Internet. The experimental results show the efficiency of the proposed approach in the region segmentation and classification. The proposed algorithm provides accuracy rate of 97.5% on classification of the regions.
عنوان نشريه :
روشهاي هوشمند در صنعت برق
عنوان نشريه :
روشهاي هوشمند در صنعت برق
اطلاعات موجودي :
فصلنامه با شماره پیاپی 3 سال 1389
كلمات كليدي :
#تست#آزمون###امتحان