شماره ركورد :
1223154
عنوان مقاله :
طبقه‌بندي ويژگي هاي گفتار مقاوم به نوفه در سامانه تعيين هويت گوينده
عنوان به زبان ديگر :
Classification of noise-robust speech features in the speaker authentication system
پديد آورندگان :
ميربيگي، محدثه‌ دانشگاه شاهد - دانشكده فني مهندسي - گروه مهندسي كامپيوتر , مه آبادي، امين اله‌ دانشگاه شاهد - دانشكده فني مهندسي - گروه مهندسي كامپيوتر , رنجبر، اكبر‌ دانشگاه شاهد - مركز تحقيقات آكوستيك
تعداد صفحه :
12
از صفحه :
28
از صفحه (ادامه) :
0
تا صفحه :
39
تا صفحه(ادامه) :
0
كليدواژه :
طبقه‌بندي ويژگي هاي گفتار , تعيين هويت گوينده , مقاوم به نوفه , علامت گفتار , نوفه
چكيده فارسي :
تشخيص­ خودكار هويت ­گوينده كاربردهاي وسيعي در سامانه­ هاي صنعتي و امنيتي دارد و وابسته به ويژگي علامت گفتار است. كاربرد ماتريس ويژگي در شناسايي بي­ درنگ گوينده بسيار مهم و وجود نوفه محيطي و پردازشي منجر به تغيير مشخصات ويژگي­ ها و توليد خطا در تعيين ­هويت است. افزايش ­دقت در تشخيص هويت به فرايند حذف ­نوفه براي تعيين صحيح ويژگي‌هاي انرژي، آنتروپي انرژي، نرخ عبور از صفر، مركز ثقل طيفي، گسترش طيفي، آنتروپي طيفي، شار طيفي، و رل­ آف طيفي از علامت ­گوينده نياز دارد. در طراحي الگوريتم‌هاي بي­درنگ و قابل ­اعتماد، فرايندهاي مهم استخراج صحيح گفتار، شناسايي ميزان­ حساسيت و سنجش ميزان ­مقاومت مؤلفه‌هاي علامت براي حذف نوفه و بهبود كيفيت­ گفتار در بهبود علامت ­به نوفه نقش اساسي دارند. هدف اصلي اين مقاله ارايه روش طبقه‌بندي ويژگي­­ هاي علامت گفتار جهت طراحي الگوريتم ­هاي بي­ درنگ تعيين­ هويت گوينده و مقاوم ­به نوفه با سنجش ميزان مقاومت آن است. روش پيشنهادي حذف ­نوفه از ماسك دودويي با ويژگي­ مقاوم مشخص­ بهره­ مي­ برد و نتايج تجربي آزمايش‌ها روي داده­ ها، بهبود علامت ­به نوفه 2 الي 3 دسي ­بل را نشان مي‌دهد. ارزيابي ماتريس ويژگي در سامانه تشخيص هويت از ضريب كپسترال بسامد­مل و ضريب­ پيشگويي خطي و ضريب­ كپستروم تشكيل­ شده كه با روش فاصله­ يابي اقليدسي در مجموعه ­داده ­هاي استاندارد ارزيابي شده­ است. روش پيشنهادي با وجود داده ­هاي نوفه­اي توانسته قدرت تشخيص تعيين هويت ­گوينده را به دقت بالاي 80 درصد و سرعت بي­ درنگ افزايش دهد.
چكيده لاتين :
Automatic speaker recognition has a wide range of applications in industrial and security systems and requires the extraction of speech signal features. The use of the feature matrix is ​​very important in real-time recognition of the speaker, and the presence of environmental and processing noise leads to a violation in the characteristics of the features and the production of recognition errors. Increasing the accuracy of recognition detection requires the noise removal process to correctly determine the energy characteristics, energy entropy, zero- crossing rate, spectral centroid, spectral spread, spectral entropy, spectral flux, and spectral roll off the signal. In designing real-time and reliable algorithms, there are critical processes of correct speech extraction, sensitivity detection, and measuring the robustness of signal parameters to eliminate noise and improve speech quality, which play a key role in improving the signal-to-noise ratio. In this paper, the classification of speech signal features for designing real-time and noise-robust speaker recognition algorithms in measuring its robustness are investigated. The proposed method of noise removal uses a binary mask with a robust feature and the experimental results of the experiments on the standard data show the rate of signal improvement to the noise of approximately 2 to 3 db. The feature matrix evaluation for the authentication system consists of mel frequency coefficient, linear prediction coefficient and, cepstrum coefficient, which has been evaluated by the Euclidean distance method in another experimental standard data set. Our proposed method achieves on overall 80% real-time recognition accuracy in noisy data set.
سال انتشار :
1400
عنوان نشريه :
مجله انجمن مهندسي صوتيات ايران
فايل PDF :
8425432
لينک به اين مدرک :
بازگشت