شماره ركورد
1021497
عنوان مقاله
بهبود نرخ تشخيص احساس از روي گفتار با استفاده از تفكيك جنسيتي
عنوان به زبان ديگر
improving speech emotion recognition via gender classification
پديد آورندگان
حريمي، علي دانشگاه آزاد اسلامي واحد شاهرود , يغمائي، خشايار دانشگاه آزاد اسلامي واحد شاهرود
تعداد صفحه
18
از صفحه
183
تا صفحه
200
كليدواژه
ويژگيهاي هارمونيكي , الگوهاي طيفي , احساس در زنان و مردان , تشخيص احساس
چكيده فارسي
تشخيص احساس از روي سيگنال گفتار يكي از شاخههاي نسبتاً جديد در پردازش گفتار ميباشد كه ميتواند در تعامل انسان و روبات نقش مهمي ايفا كند. در اين مقاله ضمن استفاده از دو نوع ويژگي طيفي جديد به منظور افزايش نرخ بازشناسي به بررسي تاثير جنسيت گويندگان در تشخيص احساس پرداخته شده است. ويژگيهاي ياد شده با استفاده از روشهاي پردازش تصوير، از تصوير طيفنگاره سيگنال گفتار استخراج ميشوند . در اين تحقيق به منظور جداسازي احساسهاي مختلف از يكديگر از طبقهبند مرتبه اي استفاده شده است. به منظور بهينه سازي ساختار اين طبقهبند، ابتدا جداپذير ترين كلاس ها از هم جدا ميشوند تا خطاي ايجاد شده در مراحل اوليه طبقهبندي حداقل بوده و اين خطا در الگوريتم منتشر نشود. سيستم پيشنهادي بر روي پايگاه دادهي آلماني برلين آزمايش شده است. بر اساس نتايج بدست آمده نرخ تشخيص براي گويندگان مختلط 4/43% ميباشد كه اين مقدار پس از تفكيك گويندگان بر اساس جنسيت به 86/82% افزايش پيدا ميكند. نرخ تشخيص براي گويندگان زن 05/83% و براي مردان 61/82% بدست آمده است.
چكيده لاتين
Speech emotion recognition is a relatively new field of research that could plays an important role in man-machine interaction. In this paper we use from two new spectral features for the automatic recognition of human affective information from speech. These features are extracted from the spectrogram of speech signal by image processing techniques. Also we study the effects of gender information on speech emotion recognition. Hierarchical SVM base classifiers are designed to classify speech signals according to their emotional states. Classifiers are optimized by the Fisher Discriminant Ratio (FDR) to classify the most separable classes at the upper nodes, which can reduce the classification error. The proposed algorithm tested on the well known Berlin database for the male and female speakers separately and in combination. The overall recognition rate of 43.4% is obtained for the coeducational speakers. The results show the 39.46% improvement when the gender information is used.
سال انتشار
1396
عنوان نشريه
مدل سازي در مهندسي
فايل PDF
7502199
عنوان نشريه
مدل سازي در مهندسي
لينک به اين مدرک