شماره ركورد :
1021497
عنوان مقاله :
بهبود نرخ تشخيص احساس از روي گفتار با استفاده از تفكيك جنسيتي
عنوان به زبان ديگر :
improving speech emotion recognition via gender classification
پديد آورندگان :
حريمي، علي دانشگاه آزاد اسلامي واحد شاهرود , يغمائي، خشايار دانشگاه آزاد اسلامي واحد شاهرود
تعداد صفحه :
18
از صفحه :
183
تا صفحه :
200
كليدواژه :
ويژگي‌هاي هارمونيكي , الگوهاي طيفي , احساس در زنان و مردان , تشخيص احساس
چكيده فارسي :
تشخيص احساس از روي سيگنال گفتار يكي از شاخه‌هاي نسبتاً جديد در پردازش گفتار مي‌باشد كه مي‌تواند در تعامل انسان و روبات نقش مهمي ايفا كند. در اين مقاله ضمن استفاده از دو نوع ويژگي طيفي جديد به منظور افزايش نرخ بازشناسي به بررسي تاثير جنسيت گويندگان در تشخيص احساس پرداخته شده است. ويژگي‌هاي ياد شده با استفاده از روش‌هاي پردازش تصوير، از تصوير طيف‌نگاره سيگنال گفتار استخراج مي‌شوند . در اين تحقيق به منظور جداسازي احساس‌هاي مختلف از يكديگر از طبقه‌بند مرتبه اي استفاده شده است. به منظور بهينه سازي ساختار اين طبقه‌بند، ابتدا جداپذير ترين كلاس ها از هم جدا مي‌شوند تا خطاي ايجاد شده در مراحل اوليه طبقه‌بندي حداقل بوده و اين خطا در الگوريتم منتشر نشود. سيستم پيشنهادي بر روي پايگاه داده‌ي آلماني برلين آزمايش شده است. بر اساس نتايج بدست آمده نرخ تشخيص براي گويندگان مختلط 4/43% مي‌باشد كه اين مقدار پس از تفكيك گويندگان بر اساس جنسيت به 86/82% افزايش پيدا مي‌كند. نرخ تشخيص براي گويندگان زن 05/83% و براي مردان 61/82% بدست آمده است.
چكيده لاتين :
Speech emotion recognition is a relatively new field of research that could plays an important role in man-machine interaction. In this paper we use from two new spectral features for the automatic recognition of human affective information from speech. These features are extracted from the spectrogram of speech signal by image processing techniques. Also we study the effects of gender information on speech emotion recognition. Hierarchical SVM base classifiers are designed to classify speech signals according to their emotional states. Classifiers are optimized by the Fisher Discriminant Ratio (FDR) to classify the most separable classes at the upper nodes, which can reduce the classification error. The proposed algorithm tested on the well known Berlin database for the male and female speakers separately and in combination. The overall recognition rate of 43.4% is obtained for the coeducational speakers. The results show the 39.46% improvement when the gender information is used.
سال انتشار :
1396
عنوان نشريه :
مدل سازي در مهندسي
فايل PDF :
7502199
عنوان نشريه :
مدل سازي در مهندسي
لينک به اين مدرک :
بازگشت