عنوان مقاله :
شرحنگاري خودكار تصوير با روش چرخش بلاك اصلي
عنوان به زبان ديگر :
Automatic Image Annotation by Block Principal Pivoting
پديد آورندگان :
الركابي، حازم دانشگاه فردوسي مشهد - گروه كامپيوتر , صوفي، نسرين دانشگاه فردوسي مشهد - گروه كامپيوتر , صدوقي يزدي، هادي دانشگاه فردوسي مشهد - گروه كامپيوتر , طاهري نيا، اميرحسين دانشگاه فردوسي مشهد - گروه كامپيوتر
كليدواژه :
تجزيه نامنفي ماتريس , چرخش بلاك اصلي , k - نزديك ترين همسايه , شرح نگاري تصاوير
چكيده فارسي :
سيستمهاي شرحنگاري خودكار تصاوير، وظيفه توصيف محتواي تصاوير به وسيله تخصيص برچسب به آنها را بر عهده دارند. هدف از انجام اين تحقيق بهبود نتايج دقت و سرعت يك سيستم شرحنگار تصاوير است. اخيراً با توجه به رشد روزافزون تصاوير، فرايند شرحنگاري بر روي پايههاي تصاوير به جاي خودشان اجرا ميگردد. يكي از اين روشهاي جديد، پيادهسازي الگوريتم تجزيه نامنفي ماتريس (NMF) بر روي ويژگيهاي به دست آمده از تصاوير است. در روش پيشنهادي براي افزايش سرعت و كارايي بهتر سيستم شرحنگاري، براي اولين بار از روشي به نام چرخش بلاك اصلي براي حل NMF در شرحنگاري استفاده شده است. اين روش با توانايي افزودن برخط كلاس جديدي از دادهها به دانش خود و يادگيري دانش به صورت فشرده و علاوه بر آن، توانايي آموزش بر اساس دادههاي دريافتي بدون نياز به پردازش مجدد توانسته از روشهاي پيشين ارائهشده براي حل NMF عملكرد بهتري را نشان دهد. در مرحله آموزش با روش چرخش بلاك اصلي ماتريس ضرايب و پايه تصاوير ورودي به دست ميآيند. سپس در مرحله آزمون براي تصوير ورودي، توسط ويژگيهاي استخراجشده از تصوير و ضرايب به دست آمده از مرحله آموزش، ضريب تعلق تصوير آزمون به هر يك از كلاسهاي تصاوير آموزش محاسبه ميگردد. سپس اين ضريب در هنگام جستجو در ميان تصاوير آموزش براي تخصيص برچسب به تصوير آزمون، دقت كار را افزايش ميدهد. اين جستجو توسط روش KNN بر روي پايههاي تصاوير صورت ميگيرد. براي آزمايش روش پيشنهادي از دو پايگاه داده K5Corel و دادههاي واقعي حيوانات (برگرفته از px 500) استفاده شده و نهايتاً با روشهاي موجود مقايسه شده كه در پايگاه داده K5Corel به ميزان دقت 50/20 و روي دادههاي واقعي به 62/89 رسيديم كه بهطور قابل ملاحظهاي دقت افزايش يافته است.
چكيده لاتين :
Image annotation systems are responsible for describing the content of the images by assigning tags to them. The purpose of this research is to improve the accuracy and speed of image annotation system. Recently, with the growing of images, the image annotation process is based on the basics of images instead of themselves. One of these new methods is the implementation of the non-negative matrix algorithm (NMF) on the features of the images. In the proposed method, for the first time, in order to increase the speed and efficiency of the7 system, we use a method that called the block principal pivoting for the NMF solution. This method has ability to add online new class of data to its knowledge and knowledge learning in a compact form. Moreover, the ability to train based on received data without having to be re-processed. In the training phase, the matrix of the coefficients and the base of the input images are obtained using the Block Principal Pivoting method. Then, at the test phase for the input image, by extracted features of the image and the coefficients obtained from the training phase, the coefficient of belonging to the test image is calculated to each of the classes of training images. Then, this coefficient while searching among the teaching images for assigning the label to test image increases the accuracy of the algorithm. This search is done by the KNN method on the base of the images. To test the proposed method, we used two databases Corel5K and real animal data (derived from 500px) and, finally, compared with existing methods, which we found in the Corel5K database at a precision of 50.20 and real data was 62.89. Precision have been increased considerably.
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران