عنوان مقاله :
مدلسازي محاسباتي جداسازي شيء هدف از پسزمينه در بازشناسي اشياء با الهام سيستم بينايي انسان
عنوان به زبان ديگر :
Computational Modeling of Figure-ground Segregation in Object Recognition Inspired by Human Visual System
پديد آورندگان :
عباسي، فريبا دانشگاه تربيت دبير شهيد رجايي - دانشكده مهندسي برق , ابراهيم پور، رضا دانشگاه تربيت دبير شهيد رجايي - دانشكده مهندسي كامپيوتر , رجايي، كريم پژوهشگاه دانشهاي بنيادي - پژوهشكده علومشناختي
كليدواژه :
ارتباطات جانبي , بازخورد , مدلهاي محاسباتي بينايي , شبكههاي عصبي كانولوشني , جداسازي شيء هدف از پسزمينه
چكيده فارسي :
قرار گرفتن شيء در پسزمينه باعث پيچيدهشدنِ مسئلهي بازشناسي اشياء و درنتيجه افتِ عملكردِ مدلهاي محاسباتي بينايي ميشود. درحاليكه انسانها عليرغم اين پيچيدگي، شيء هدف را با دقت و سرعت زيادي كه متأثر از ارتباطات جانبي و بازخورد از نواحي بالاتر بينايي است بازشناسي ميكنند.
يكي از مدلهاي بينايي كه اخيراً به عملكرد چشمگيري در بازشناسي اشياء دست يافته است، شبكه عصبي كانولوشني است كه مسير پيشخورِ بينايي را شبيهسازي ميكند. در اين مقاله مدلي بازگشتي بر پايهي اين مدل و با الهام از يافتههاي بيولوژيك ارائهشده است كه شامل اتصالهاي بازخوردي از نواحي بالاتر و همچنين اتصالهاي جانبي در همان لايه است. براي ارزيابي مدل از مجموعه دادهي پنج دستهاي، شامل تصاوير داراي پسزمينه و بدون پسزمينه، استفاده شد. با بصريسازي بازنماييهايي ايجادشده در لايههاي مدل مشاهده شد كه با پيشروي در لايههاي مدل، پسزمينهي بيشتري از تصوير ورودي حذف ميشود. سپس با انجام آزمايشهايي نشان داده شد كه مدلِ بازگشتي با سازوكارهايپيشنهادي بازخورد از نواحي بالاتر و سركوب پيرامون باعث بهبود معنيدارِ عملكرد مدل، در حذف پسزمينهي شيء هدف و درنتيجه بازشناسي اشياء ميشود. با توجه به نتايج، در حالتي كه هر دو سازوكارِ پيشنهادي همزمان به مدل افزوده شدند، اين افزايشِ عملكرد بيشتر بود كه اين يافته با شواهدِ بيولوژيك نيز تطابق دارد.
چكيده لاتين :
Object recognition in cluttered background is a challenging problem in computational modeling. When objects are present on natural backgrounds, the performance of object recognition models drop significantly. However, humans recognize objects accurately and swiftly despite this challenging condition. It seems that, our visual system achieves this ability based on lateral connections and feedback connections from higher areas.
One of the computational object recognition models that recently has achieved a remarkable performance in object recognition is convolutional neural network (CNN). It resembles feed-forward sweep of visual information processing. In this study, based on CNNs and inspired by biological evidence we proposed a recurrent object recognition model. The model simulates recurrent dynamics of visual object processing by implementing feedback and lateral connections. Evaluating the model to recognize objects on natural background, we showed that the proposed mechanisms significantly improves performance. In addition, visualizing the representations of layers indicatedthat deeper layers of the CNNs remove the background much better than the lower layers. According to the results, using both mechanisms -the feedback from higher layers and the interlayer surround suppression mechanisms- simultaneously in structure of CNN, the performance improvement was more than when either one was usedalone. This observation is in accordance withthe biological evidence from the human visual system
عنوان نشريه :
ماشين بينايي و پردازش تصوير
عنوان نشريه :
ماشين بينايي و پردازش تصوير