شماره ركورد :
1011746
عنوان مقاله :
پالايش شرح گذاري مجموعه تصاوير با مقياس بزرگ با يادگيري انتقالي در شبكه عصبي كانولوشنال عميق
عنوان به زبان ديگر :
Refining large scale image annotation via transfer learning in deep convolutional neural network
پديد آورندگان :
جوانمردي، شيما دانشگاه يزد - دانشكده برق و كامپيوتر , زارع چاهوكي، محمدعلي دانشگاه يزد - دانشكده برق و كامپيوتر
تعداد صفحه :
14
از صفحه :
39
تا صفحه :
52
كليدواژه :
يادگيري انتقالي , بازيابي تصاوير , پالايش تگ , شبكه عصبي كانولوشنال عميق , پالايش شرح گذاري تصاوير
چكيده فارسي :
فرآيند پالايش شرح ­گذاري تصاوير، رويكردي موثر در بهبود بازيابي تصاوير مبتني بر برچسب مي‌باشد. در شبكه ­هاي اجتماعي و موتورهاي جستجو بسياري از تصاوير داراي تگ ­هاي مبهم، ناقص و بي­ ارتباط با محتوا هستند. وجود اين تگ ­هاي غيرقابل اعتماد، موجب كاهش دقت بازيابي تصاوير مي ­شود. از اين­رو در دهه اخير، الگوريتم ­هايي با عنوان پالايش تگ (TR) مطرح شده‌اند كه به رفع نويز و غني‌سازي برچسب‌هاي تصاوير مي‌پردازند. به ­منظور دستيابي به نتايج بهينه در TR، استخراج ويژگي­ هايي از تصوير كه توصيف مناسبي از محتواي ديداري تصوير داشته باشند، تاثير مستقيمي بر دقت فرآيند TR دارد. از جمله چالش ­هاي عمده در فرآيند پالايش شرح ­گذاري تصاوير، رسيدن به توصيفي مناسب و مرتبط با محتواي تصاوير مي ­باشد. بدين منظور با توجه به كارآمدي فرآيند يادگيري عميق در بسياري از حوزه ­هاي پژوهشي، در اين مقاله نيز به منظور استخراج ويژگي­ هاي كارآمد در تشابه ديداري تصاوير و ارتباط معنايي تصاوير با هم، از شبكه ­هاي عصبي كانولوشنال عميق (DCNN) استفاده شده ­است. بهره ­گيري از فرآيند يادگيري انتقالي استفاده شده در DCNN مبتني بر تصاوير ImageNet در توصيف و ايجاد ارتباط معنايي در مجموعه تصاوير با مقياس بزرگ NUS-WIDE، بيانگر موثر بودن اين رويكرد در كاربرد پالايش تگ تصاوير است.
چكيده لاتين :
Refining image annotation is an effective approach to improve tag base image retrieval. Many images in social networks and search engines have vague tags, incomplete and irrelevant content.
However the unreliable tags, reducing the precision of image retrieval, recently some of the tag refinement (TR) algorithms have been suggested as labels noise removal and enrichment of images.
In order to achieve optimal result in TR, extracting features that have a good description of visual content of images will have direct impact on accuracy of TR process. Achieving the appropriate description and relevant to the content of images, is the major challenges in the refining image annotation. Due to effectiveness of deep learning in research fields, in this paper we will use deep convolutional neural network (DCNN) in order to extract efficient features for computing images visual and semantic similarity. Employing transfer learning based ImageNet image database in DCNN, for large scale NUSWIDE dataset, indicating the effectiveness of this approach in refining image annotation.
سال انتشار :
1397
عنوان نشريه :
ماشين بينايي و پردازش تصوير
فايل PDF :
7455868
عنوان نشريه :
ماشين بينايي و پردازش تصوير
لينک به اين مدرک :
بازگشت