شماره ركورد :
1045965
عنوان مقاله :
ارائه يك دسته بند مقاوم به منظور بازشناسي گفتار مبتني بر همافزايي خوشه بندي و فراواني مشاهدات
عنوان به زبان ديگر :
Proposing a Robust Classifier for Speech Recognition Based on Synergy Clustering and Observations Frequency
پديد آورندگان :
مصلح، محمد دانشگاه آزاد اسلامي واحد دزفول - گروه مهندسي كامپيوتر , خيرانديش، محمد دانشگاه آزاد اسلامي واحد دزفول - گروه مهندسي كامپيوتر , مصلح، مهدي دانشگاه آزاد اسلامي واحد انديمشك - گروه مهندسي كامپيوتر , حسين پور، نجمه دانشگاه ازاد اسلامي واحد انديمشك
تعداد صفحه :
10
از صفحه :
111
تا صفحه :
120
كليدواژه :
بازشناسي گفتار , دسته بندي , مدل هاي مخفي ماركوف , خوشه بندي , استخراج ويژگي , مقاوم پذيري
چكيده فارسي :
تكنولوژي بازشناسي گفتار به عنوان يكي از مهمترين شاخه هاي پردازش گفتار از دير باز مورد توجه پژوهشگران و محققين بوده است. بازشناسي گفتار تكنولوژي است كه قادر است كلمه( كلمات) اداء شده را كه با يك سيگنال آكوستيك نمايش داده مي-شود، معين نمايد. پيچيدگي سيستم هاي بازشناسي گفتار به ويژگي هاي استخراج شده، بُعد آنها و نيز دسته بند بكار گرفته شده بستگي دارد. در اين مقاله، يك دسته بند جديد پيشنهاد مي شود كه قادر است در فاز استخراج دانش، از طريق هم افزايي خوشه بندي و فراواني مشاهدات، يك مدل مناسب براي هر كلمه مرجع، در قالب دو ماتريس "برنده" و "حداقل فاصله"، محاسبه نمايد. در مرحله بازشناسي، روش پيشنهادي قادر است با استفاده از يك مكانيزم جريمه-پاداش، ميزان شباهت بين گفتار ورودي ناشناخته و مدل هاي مرجع كلمات را معين نمايد. به منظور ارزيابي روش پيشنهادي از پايگاه داده فارس دات استفاده شده است. نتايج حاصل از آزمايشات متعدد بر روي سيگنال هاي تميز و نويزي نشان مي دهند روش پيشنهادي از مقاوم پذيري بهتري در برابر نويز، دقت بالاتر و نيز پيچيدگي زماني كمتري در مقايسه با سيستم هاي بازشناسي گفتار مبتني بر مدل مخفي ماركوف برخوردار است.
چكيده لاتين :
Speech recognition as one of the important branches of speech processing has been attractive for researchers and scientist, from long time ago. Speech recognition is a kind of technology able to determine the pronounced word(s) shown by acoustic signal. The complexity of speech recognition systems depends on the extracted features, their dimensions and the applied classifier. In this paper, we propose a new classifier which is able to compute two matrices “winner” and “minimum distance” in a knowledge extraction phase, as a suitable model for any reference word using synergy clustering and frequency of observations. In the recognition phase, the proposed method is able to determine the similarity between inputted unknown speech and word reference models based on a penalty-reward mechanism. In order to evaluate the proposed method, the FARSDAT data set is used. The results of several experiments on clean and noisy signals show more resistant against noise, higher accuracy and less time complexity for the proposed method, in comparison to the HMM-based speech recognition system.
سال انتشار :
1396
عنوان نشريه :
صنايع الكترونيك
فايل PDF :
7573162
عنوان نشريه :
صنايع الكترونيك
لينک به اين مدرک :
بازگشت