شماره ركورد :
1011678
عنوان مقاله :
مدل‌سازي محاسباتي جداسازي شيء هدف از پس‌زمينه در بازشناسي اشياء با الهام سيستم بينايي انسان
عنوان به زبان ديگر :
Computational Modeling of Figure-ground Segregation in Object Recognition Inspired by Human Visual System
پديد آورندگان :
عباسي، فريبا دانشگاه تربيت دبير شهيد رجايي - دانشكده مهندسي برق , ابراهيم پور، رضا دانشگاه تربيت دبير شهيد رجايي - دانشكده مهندسي كامپيوتر , رجايي، كريم پژوهشگاه دانش‌هاي بنيادي - پژوهشكده علوم‌شناختي
تعداد صفحه :
16
از صفحه :
1
تا صفحه :
16
كليدواژه :
ارتباطات جانبي , بازخورد , مدل‌هاي محاسباتي بينايي , شبكه‌هاي عصبي كانولوشني , جداسازي شيء هدف از پس‌زمينه
چكيده فارسي :
قرار گرفتن شيء در پس‌زمينه باعث پيچيده‌شدنِ مسئله‌ي بازشناسي اشياء و درنتيجه افتِ عملكردِ مدل‌هاي محاسباتي بينايي مي‌شود. درحالي‌كه انسان‌ها علي‌‌رغم اين پيچيدگي، شيء هدف را با دقت و سرعت زيادي كه متأثر از ارتباطات جانبي و بازخورد از نواحي بالاتر بينايي است بازشناسي مي‌كنند. يكي از مدل‌هاي بينايي كه اخيراً به عملكرد چشمگيري در بازشناسي اشياء دست يافته است، شبكه عصبي كانولوشني است كه مسير پيش‌خورِ بينايي را شبيه‌سازي مي‌كند. در اين مقاله مدلي بازگشتي بر پايه‌ي اين مدل و با الهام از يافته‌هاي بيولوژيك ارائه‌شده است كه شامل اتصال‌هاي بازخوردي از نواحي بالاتر و همچنين اتصال‌هاي جانبي در همان لايه است. براي ارزيابي مدل از مجموعه داده‌ي پنج دسته‌اي، شامل تصاوير داراي پس‌زمينه و بدون پس‌زمينه، استفاده شد. با بصري‌سازي بازنمايي‌هايي ايجادشده در لايه‌هاي مدل مشاهده شد كه با پيش‌روي در لايه‌هاي مدل، پس‌زمينه‌ي بيشتري از تصوير ورودي حذف مي‌شود. سپس با انجام آزمايش‌هايي نشان داده شد كه مدلِ بازگشتي با سازوكارهايپيشنهادي بازخورد از نواحي بالاتر و سركوب پيرامون باعث بهبود معني‌دارِ عملكرد مدل، در حذف پس‌زمينه‌ي شيء هدف و درنتيجه بازشناسي اشياء مي‌شود. با توجه به نتايج، در حالتي كه هر دو سازوكارِ پيشنهادي همزمان به مدل افزوده شدند، اين افزايشِ عملكرد بيشتر بود كه اين يافته با شواهدِ بيولوژيك نيز تطابق دارد.
چكيده لاتين :
Object recognition in cluttered background is a challenging problem in computational modeling. When objects are present on natural backgrounds, the performance of object recognition models drop significantly. However, humans recognize objects accurately and swiftly despite this challenging condition. It seems that, our visual system achieves this ability based on lateral connections and feedback connections from higher areas.
One of the computational object recognition models that recently has achieved a remarkable performance in object recognition is convolutional neural network (CNN). It resembles feed-forward sweep of visual information processing. In this study, based on CNNs and inspired by biological evidence we proposed a recurrent object recognition model. The model simulates recurrent dynamics of visual object processing by implementing feedback and lateral connections. Evaluating the model to recognize objects on natural background, we showed that the proposed mechanisms significantly improves performance. In addition, visualizing the representations of layers indicatedthat deeper layers of the CNNs remove the background much better than the lower layers. According to the results, using both mechanisms -the feedback from higher layers and the interlayer surround suppression mechanisms- simultaneously in structure of CNN, the performance improvement was more than when either one was usedalone. This observation is in accordance withthe biological evidence from the human visual system
سال انتشار :
1396
عنوان نشريه :
ماشين بينايي و پردازش تصوير
فايل PDF :
7455796
عنوان نشريه :
ماشين بينايي و پردازش تصوير
لينک به اين مدرک :
بازگشت