عنوان مقاله :
بهبود روش MFCC براي تشخيص گوينده در عمليات جاسوسي
عنوان فرعي :
Improving MFCC Method for Speaker Recognition in Spying Operations
پديد آورنده :
چمن مطلق ابوالفضل
پديد آورندگان :
نجفي پور عباس نويسنده دانشآموخته كارشناسي ارشد دانشكده برق دانشگاه علم و صنعت ايران
سازمان :
استاديار و عضو هيئت علمي دانشگاه جامع امام حسين(ع)
اطلاعات موجودي :
فصلنامه سال 1392 شماره 16
كليدواژه :
تشخيص گوينده , جاسوسي , روش MFCC , فيلتر Mel , feature extraction , Mel Filter , passive defense , Speaker Recognition , spying , استخراج ويژگي , پدافند غيرعامل , MFCC Method
چكيده فارسي :
در اين مقاله، روشي جديد براي استخراج ويژگي از سيگنال صوت و تشخيص گوينده صدا ارايه شده است كه كاربرد وسيعي در علوم جاسوسي و پدافند غيرعامل دارد (بدين صورت كه با تشخيص گوينده يك صداي ضبطشده مي توان اولا مانع تقليد صداي افراد خاص مانند فرماندهان شد و ثانياً مي توان در استراق سمع مكاني كه چندين نفر در حال گفتگوي مهمي هستند، گوينده هر صدا را تشخيص داد). در واقع روش ارايهشده، بهبوديافته روش MFCC مي باشد. از آن جايي كه با توجه به آزمايشات، بيشتر اطلاعات صوت در فركانسهاي پايين آن ذخيره مي شود و فركانس هاي بالاي آن اطلاعات تفكيككننده زيادي ندارد، محققان معمولاً ويژگي هاي صوت را از فركانس هاي پايين سيگنال صوت استخراج مي كنند. در روش ارايهشده در اين مقاله، فيلتر فركانسي Mel كه در روش MFCC استفاده مي شود، تغيير و بهبود داده شده و در انتها نتايج روش ارايهشده (MMFCC) با روش MFCC مقايسه شده و بهبود آن اثبات شده است. نتايج حاصله براي 20 گوينده متفاوت مويد اين است كه براي روش بهبوديافته خطي درصد تشخيص گوينده حدود 5/4? و براي روش بهبوديافته نهايي حدود 9? ارتقا يافته است.
چكيده لاتين :
In this article, a new method is introduced for extracting features from vocal signals and discriminating speakers, which has a vast application in spy operations and passive defense sciences (for example; not only by using this method, it is possible to prevent the imitation of particular people’s voice such as commanders but also the detection of every speakers’ voice when eavesdropping the place where a number of people are discussing an important matter can be made possible). The introduced method is the improved version of MFCC method. Experimental studies say that the most useful information of vocal signals is in their low frequencies and their high frequencies are not useful in speaker recognition procedures. The method introduced in this article, the Mel frequency filter which is used in MFCC, is changed and improved. The results of MFCC and the proposed method are compared for 20 speakers and the speaker recognition percentage has improved approximately 4.5% for the linear and 9% for the exponential proposed methods.
عنوان نشريه :
پدافند غيرعامل
عنوان نشريه :
پدافند غيرعامل
اطلاعات موجودي :
فصلنامه با شماره پیاپی 16 سال 1392