عنوان مقاله :
مكانيابي منابع چندگانه صوتي در محيط انعكاسي به كمك BSS و استفاده از ويژگيهاي سيگنال گفتار براي رفع ابهام جايگشت عمومي
عنوان به زبان ديگر :
Localization of Multiple Speakers in Echoic Environments Using BSS and Speech Features for Solution of Global
Permutation Ambiguity
پديد آورندگان :
خان آقا، وحيد نويسنده Khan-Agha , vahid , كهايي، محمد حسين نويسنده Kahaei, mohammad hossein
اطلاعات موجودي :
دوفصلنامه سال 1389 شماره 13
كليدواژه :
بهينه سازي PSO , تخمين TDOA , جداسازي كور منابع , رفع ابهام جايگشت عمومي BSS
چكيده فارسي :
در اين مقاله يك چارچوب الگوريتمي جديد براي مكانيابي منابع چندگانه صوتي در محيط انعكاسي معرّفي ميشود. مبناي مكانيابي بر اساس آميزش چندين تخمين TDOA هر يك از منابع است كه اين تخمينها با استفاده از الگوريتم جداسازي كور منابع (BSS) در حوزه زمان بهدست ميآيند. به اين منظور يك الگوريتم BSS حوزه زمان جديد پيشنهاد شده كه نسبت به روش مرجع كيفيت جداسازي و شناسايي كانال را بهبود داده و بار محاسباتي آن نيز در شرايطي كاهش يافته است. سپس براي رفع ابهام جايگشت عمومي كه در ذات الگوريتمهاي BSS وجود دارد، پيشنهاد شده كه از ويژگيهاي وابسته به گوينده سيگنال گفتار استفاده شود. در برابر معيار همبستگي مورد استفاده در مقاله مرجع، نتايج شبيهسازي توانايي خوب اين ويژگيها را در رفع ابهام جايگشت نشان ميدهد.
چكيده لاتين :
Abstract
In this paper, a new algorithm is introduced for localization of multiple speakers in echoic environments. The origin of localization is based on combination of TDOA estimates of each source obtained by the BSS algorithm in the time domain. A new BSS algorithm is proposed which improves the quality and channel identification compared to a reference technique and also reduces the computational cost in some cases. To solve the global permutation ambiguity of BSS algorithms, speech features are used. Simulation results show the effectiveness of these features for solving the later problem.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها
اطلاعات موجودي :
دوفصلنامه با شماره پیاپی 13 سال 1389
كلمات كليدي :
#تست#آزمون###امتحان