عنوان مقاله :
بهبود نرخ تشخيص احساس از روي گفتار با استفاده از تفكيك جنسيتي
عنوان به زبان ديگر :
improving speech emotion recognition via gender classification
پديد آورندگان :
حريمي، علي دانشگاه آزاد اسلامي واحد شاهرود , يغمائي، خشايار دانشگاه آزاد اسلامي واحد شاهرود
كليدواژه :
ويژگيهاي هارمونيكي , الگوهاي طيفي , احساس در زنان و مردان , تشخيص احساس
چكيده فارسي :
تشخيص احساس از روي سيگنال گفتار يكي از شاخههاي نسبتاً جديد در پردازش گفتار ميباشد كه ميتواند در تعامل انسان و روبات نقش مهمي ايفا كند. در اين مقاله ضمن استفاده از دو نوع ويژگي طيفي جديد به منظور افزايش نرخ بازشناسي به بررسي تاثير جنسيت گويندگان در تشخيص احساس پرداخته شده است. ويژگيهاي ياد شده با استفاده از روشهاي پردازش تصوير، از تصوير طيفنگاره سيگنال گفتار استخراج ميشوند . در اين تحقيق به منظور جداسازي احساسهاي مختلف از يكديگر از طبقهبند مرتبه اي استفاده شده است. به منظور بهينه سازي ساختار اين طبقهبند، ابتدا جداپذير ترين كلاس ها از هم جدا ميشوند تا خطاي ايجاد شده در مراحل اوليه طبقهبندي حداقل بوده و اين خطا در الگوريتم منتشر نشود. سيستم پيشنهادي بر روي پايگاه دادهي آلماني برلين آزمايش شده است. بر اساس نتايج بدست آمده نرخ تشخيص براي گويندگان مختلط 4/43% ميباشد كه اين مقدار پس از تفكيك گويندگان بر اساس جنسيت به 86/82% افزايش پيدا ميكند. نرخ تشخيص براي گويندگان زن 05/83% و براي مردان 61/82% بدست آمده است.
چكيده لاتين :
Speech emotion recognition is a relatively new field of research that could plays an important role in man-machine interaction. In this paper we use from two new spectral features for the automatic recognition of human affective information from speech. These features are extracted from the spectrogram of speech signal by image processing techniques. Also we study the effects of gender information on speech emotion recognition. Hierarchical SVM base classifiers are designed to classify speech signals according to their emotional states. Classifiers are optimized by the Fisher Discriminant Ratio (FDR) to classify the most separable classes at the upper nodes, which can reduce the classification error. The proposed algorithm tested on the well known Berlin database for the male and female speakers separately and in combination. The overall recognition rate of 43.4% is obtained for the coeducational speakers. The results show the 39.46% improvement when the gender information is used.
عنوان نشريه :
مدل سازي در مهندسي
عنوان نشريه :
مدل سازي در مهندسي