عنوان مقاله :
تشخيص لهجه هاي گفتار زبان فارسي از روي سيگنال گفتار با استفاده از روش هاي استخراج ويژگي كارآمد و تركيب طبقه بندها
عنوان به زبان ديگر :
Farsi Accent Recognition based on speech signal using efficient features extraction and Combining of Classifiers
پديد آورندگان :
شريف نوقابي، مجتبي نويسنده دانشگاه صنعتي شاهرود,ايران sharif noughabi, mojtaba , مروي، حسين نويسنده دانشگاه صنعتي شاهرود,ايران marvi, hossein , دارابيان، دانيال نويسنده دانشگاه صنعتي شاهرود,ايران darabian, danial
اطلاعات موجودي :
فصلنامه سال 1395 شماره 28
كليدواژه :
دامنه مركزي طيفي , ماشين بردار پشتيبان , ضرايب مل-كپستروم بهبود يافته , Spectral Centroid Magnitude , Classifiers combination , Farsi accents , Support Vector Machine , , Improved Mel Frequency Cepstral Coefficient , لهجه فارسي , تركيب طبقه بندها
چكيده فارسي :
تشخيص لهجه از روي شكل موج گفتار يكي از شاخه هاي نسبتا جديد در علم پردازش گفتار است.تشخيص لهجه مي تواند تا حد زيادي باعث بهبود سيستم هاي بازشناخت گفتار شود.همانند هر سيستم بازشناسي، فرآيند تشخيص لهجه نيز شامل سه مرحله پيش پردازش، استخراج ويژگي و طبقه بندي است.در اين مقاله سه روش كارآمد استخراج ويژگي شامل دامنه مركزي طيفي (SCM) ، مشتق اول آن (∆SCM) و تبديل Zak روي سيگنال گفتار اعمال شده اند و كارآيي اين روش ها با روش هاي متدوال استخراج ويژگي مانند ضرايب ملكپستروم و مشتقات آن مقايسه شده است. علاوه بر اين يك ويژگي جديد كه با ايجاد تغييراتي در الگوريتم محاسبه ضرايب ملكپستروم به دست مي آيد براي تشخيص لهجه ها در محيط هاي نويزي معرفي گرديده است. براي مرحله طبقه بندي از پنج طبقه بند مختلف، شامل MLP ، KNN ، PNN ، RBF و SVM و تركيب اين طبقه بندها با يكديگر استفاده شده است.نتايج آزمايش ها بيانگر بهبود نرخ بازشناسي لهجه ها با روش هاي پيشنهادي هستند.
چكيده لاتين :
Speech recognition has achieved great improvements recently. However, robustness is still one of the big problems, e.g. performance of recognition fluctuates sharply depending on the speaker, especially when the speaker has strong accent and difference Accents dramatically decrease the accuracy of an ASR system. In this paper we apply three new methods of feature extraction including Spectral Centroid Magnitude (SCM), its first order difference (∆SCM ) and Zak transformation to the original speech signal using accents selected from FARSDAT corpus then their performance of these methods have been compared with some common methods such as MFCC. Moreover a new feature based on MFCC algorithm have been proposed in order to use in noisy environments. Five different classifications, including MLP, KNN, PNN, RBF and SVM and their combination have been used to evaluate the performance of each feature extraction methods. Experimental results demonstrate improvement in the recognition rates in our proposed method.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها
اطلاعات موجودي :
فصلنامه با شماره پیاپی 28 سال 1395
كلمات كليدي :
#تست#آزمون###امتحان