عنوان مقاله :
استخراج نقشههاي برجستگي وزندار در مدلسازي توجه پايين به بالاي شنوايي
عنوان به زبان ديگر :
Extraction of Weighted Saliency Maps in Modelling Bottom- Up Auditory Attention
پديد آورندگان :
گراوانچي زاده، مسعود دانشگاه تبريز - دانشكده مهندسي برق و كامپيوتر، تبريز، ايران , اختري خسروشاهي، سپيده دانشگاه تبريز - دانشكده مهندسي برق و كامپيوتر، تبريز، ايران , ذاكري، سحر دانشگاه تبريز - دانشكده مهندسي برق و كامپيوتر، تبريز، ايران
كليدواژه :
مدلسازي شنوايي توجه , توجه پايين به بالا , نقشه برجستگي , الگوريتم ژنتيك
چكيده فارسي :
شنوايي يكي از قسمتهاي مهم زندگي روزانه انسانها است. با وجود اينكه انسانها در معرض صداهاي مختلف از منابع متفاوت قرار دارند و تعداد گيرنده هاي سيستم عصبي براي تجزيه و تحليل اين صداها محدود هستند، انسانها ميتوانند مخلوطهاي شنيداري پيچيده را به خوبي پردازش كنند. يكي از دلايل اين توانايي انسان، پديده توجه است. توجه شنوايي را ميتوان به دو دسته توجه پايين به بالا و توجه بالا به پايين تقسيمبندي كرد. در اين مقاله، مدلي براي شبيه سازي توجه پايين به بالا با استفاده از نقشه هاي برجستگي وزندار، در سيستم شنوايي ارائه شده است. دادگان به كار رفته در اين پژوهش از تركيب نويزهاي پس زمينه مختلف با صوتهاي موجود در پايگاه دادگان ESC به عنوان قسمتهاي برجسته، در SNR هاي متفاوت بدست آمده است. براي ارزيابي مدل، از معيار ميانگين خطا استفاده شده است كه بصورت اختلاف زماني بين نقطه برجسته واقعي و نقطه برجسته تشخيص داده شده توسط مدل تعريف ميشود. تركيب وزندار نقشه هاي آشكار حاصل از ويژگيها، با استفاده از الگوريتم ژنتيك، سبب شده است كه مدل پيشنهادي با خطاي متوسط 0/92 ثانيه عملكرد بهتري را نسبت به مدل پايه با خطاي متوسط 1/91 ثانيه داشته باشد.
چكيده لاتين :
Hearing is an important part of human daily life. Although humans are exposed to various sounds from different sources
and the numbers of receptors of the neural system are limited, they can process complex auditory scenes well. One of the reasons for
this human ability is the phenomenon of attention. Auditory attention can be divided into two categories: bottom-up attention and topdown
attention. In this paper, a model for simulating the bottom-up attention using weighted saliency maps in the auditory system is
proposed. The dataset in this research work is obtained by combining different background noises with the sounds in the ESC database
as salient regions, at different SNRs. To evaluate the model, the mean-error criterion was used, which is defined as the time difference
between the actual salient point and the salient point detected by the model. The weighted combination of the conspicuity maps of the
features using the Genetic algorithm makes the proposed model with an average error of 0.92 seconds to perform better than the
baseline model having an average error of 1.91 seconds.
عنوان نشريه :
پردازش سيگنال پيشرفته