عنوان مقاله :
تشخيص خودكار گوينده مبتني بر ويژگي هاي استخراج شده از بانك فيلتر گابور و شبكه هاي عصبي كانولوشنال
پديد آورندگان :
رشنو ، عبدالرضا دانشگاه لرستان - دانشكده مهندسي , فدايي ، صادق دانشگاه ياسوج - دانشكده مهندسي , حميدي ، عبدالصمد دانشگاه لرستان - دانشكده مهندسي
كليدواژه :
بانك فيلتر گابور , اسپكتروگرام , تشخيص گوينده , شبكه ي عصبي كانولوشنال
چكيده فارسي :
صداي يك انسان حاوي خصوصياتي از قبيل: قوميت، جنسيت، احساس، سن و اطلاعات ديگري از فرد است و موضوع تشخيص گوينده به شناسايي هويت افراد بر اساس صداي آنها ميپردازد. اگرچه محققان در طول سالهاي گذشته در اين زمينه فعاليت داشتهاند و روشهايي براي بهبود دقت تشخيص گوينده پيشنهاد دادهاند اما هنوز چالشهايي در اين زمينه وجود دارد. در اين مقاله يك روش جديد تشخيص گوينده مبتني بر فيلترهاي گابور و شبكههاي عصبي كانولوشنال ارايه شده است. در روش پيشنهادي، ابتدا اسپكتروگرام سيگنال صحبت فرد تشكيل ميشود. سپس با طراحي موثر فيلترهاي گابور، بانك فيلتر گابور ايجاد ميگردد. در مرحلهي بعد اسپكتروگرام سيگنال از بانك فيلتر گابور عبور داده شده و ويژگيهاي سيگنال صحبت استخراج ميشود. در مرحلهي آخر با استفاده از يك شبكهي عصبي كانولوشنال، گوينده شناسايي ميشود. براي ارزيابي روش پيشنهادي از دو پايگاه دادهي Aurora2 و TIMIT استفاده شده است. نتايج نشان ميدهد كه روش پيشنهادي دقت بهتري نسبت به روشهاي پيشين دارد.
عنوان نشريه :
مدل سازي در مهندسي
عنوان نشريه :
مدل سازي در مهندسي