شماره ركورد :
1070715
عنوان مقاله :
شرح‌نگاري خودكار تصوير با روش چرخش بلاك اصلي
عنوان به زبان ديگر :
Automatic Image Annotation by Block Principal Pivoting
پديد آورندگان :
الركابي، حازم دانشگاه فردوسي مشهد - گروه كامپيوتر , صوفي، نسرين دانشگاه فردوسي مشهد - گروه كامپيوتر , صدوقي يزدي، هادي دانشگاه فردوسي مشهد - گروه كامپيوتر , طاهري نيا، اميرحسين دانشگاه فردوسي مشهد - گروه كامپيوتر
تعداد صفحه :
12
از صفحه :
25
تا صفحه :
36
كليدواژه :
تجزيه نامنفي ماتريس , چرخش بلاك اصلي , k - نزديك ترين همسايه , شرح نگاري تصاوير
چكيده فارسي :
سيستم‌هاي شرح‌نگاري خودكار تصاوير، وظيفه توصيف محتواي تصاوير به وسيله تخصيص برچسب به آنها را بر عهده دارند. هدف از انجام اين تحقيق بهبود نتايج دقت و سرعت يك سيستم شرح‌نگار تصاوير است. اخيراً با توجه به رشد روزافزون تصاوير، فرايند شرح‌نگاري بر روي پايه‌هاي تصاوير به جاي خودشان اجرا مي‌گردد. يكي از اين روش‌هاي جديد، پياده‌سازي الگوريتم تجزيه نامنفي ماتريس (NMF) بر روي ويژگي‌هاي به دست آمده از تصاوير است. در روش پيشنهادي براي افزايش سرعت و كارايي بهتر سيستم شرح‌نگاري، براي اولين بار از روشي به نام چرخش بلاك اصلي براي حل NMF در شرح‌نگاري استفاده شده است. اين روش با توانايي افزودن برخط كلاس جديدي از داده‌ها به دانش خود و يادگيري دانش به صورت فشرده و علاوه بر آن، توانايي آموزش بر اساس داده‌هاي دريافتي بدون نياز به پردازش مجدد توانسته از روش‌هاي پيشين ارائه‌شده براي حل NMF عملكرد بهتري را نشان دهد. در مرحله آموزش با روش چرخش بلاك اصلي ماتريس ضرايب و پايه تصاوير ورودي به دست مي‌آيند. سپس در مرحله آزمون براي تصوير ورودي، توسط ويژگي‌هاي استخراج‌شده از تصوير و ضرايب به دست آمده از مرحله آموزش، ضريب تعلق تصوير آزمون به هر يك از كلاس‌هاي تصاوير آموزش محاسبه مي‌گردد. سپس اين ضريب در هنگام جستجو در ميان تصاوير آموزش براي تخصيص برچسب به تصوير آزمون، دقت كار را افزايش مي‌دهد. اين جستجو توسط روش KNN بر روي پايه‌هاي تصاوير صورت مي‌گيرد. براي آزمايش روش پيشنهادي از دو پايگاه داده K5Corel و داده‌هاي واقعي حيوانات (برگرفته از px 500) استفاده شده و نهايتاً با روش‌هاي موجود مقايسه شده كه در پايگاه داده K5Corel به ميزان دقت 50/20 و روي داده‌هاي واقعي به 62/89 رسيديم كه به‌طور قابل ملاحظه‌اي دقت افزايش يافته است.
چكيده لاتين :
Image annotation systems are responsible for describing the content of the images by assigning tags to them. The purpose of this research is to improve the accuracy and speed of image annotation system. Recently, with the growing of images, the image annotation process is based on the basics of images instead of themselves. One of these new methods is the implementation of the non-negative matrix algorithm (NMF) on the features of the images. In the proposed method, for the first time, in order to increase the speed and efficiency of the7 system, we use a method that called the block principal pivoting for the NMF solution. This method has ability to add online new class of data to its knowledge and knowledge learning in a compact form. Moreover, the ability to train based on received data without having to be re-processed. In the training phase, the matrix of the coefficients and the base of the input images are obtained using the Block Principal Pivoting method. Then, at the test phase for the input image, by extracted features of the image and the coefficients obtained from the training phase, the coefficient of belonging to the test image is calculated to each of the classes of training images. Then, this coefficient while searching among the teaching images for assigning the label to test image increases the accuracy of the algorithm. This search is done by the KNN method on the base of the images. To test the proposed method, we used two databases Corel5K and real animal data (derived from 500px) and, finally, compared with existing methods, which we found in the Corel5K database at a precision of 50.20 and real data was 62.89. Precision have been increased considerably.
سال انتشار :
1398
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
فايل PDF :
7652161
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
لينک به اين مدرک :
بازگشت