شماره ركورد كنفرانس :
1732
عنوان مقاله :
اهميت اطلاعات فاز در كلاس بندي گوينده با استفاده از شبكه ي عصبي مصنوعي
پديدآورندگان :
تسليمي رناني مجيد نويسنده , ربيعي اعظم نويسنده
تعداد صفحه :
8
كليدواژه :
فاز اسپكتروگرام , شبكه هاي عصبي مصنوعي , فاز هارمونيك , تحليل مؤلفه هاي اساسي , كلاس بندي گوينده
سال انتشار :
1393
عنوان كنفرانس :
دومين همايش ملي علوم و مهندسي كامپيوتر
زبان مدرك :
فارسی
چكيده فارسي :
ابتدا محققان بر اين باور بودند كه اطلاعات فاز سيگنال گفتار غيرقابل استفاده است و تنها اطلاعات طيف اندازه در سيستم هاي مبتني بر پردازش گفتار استفاده مي گرديد؛ اما باگذشت زمان، مشخص شد اطلاعات فاز نيز، بخصوص در تركيب با ساير ويژگي هاي سيگنال گفتار، به همان اندازه كه اطلاعات اندازه مهم مي باشند، مهم و قابل استفاده است. در اين مقاله، از اطلاعات فاز در قالب دودسته ويژگي (فاز هارمونيك و فاز اسپكتروگرام كاهش ابعاد يافته با PCA) براي كلاس بندي گوينده استفاده گرديد. اين مقاله به شناسايي و كلاس بندي گوينده با كمك يك مدل مهندسي شامل استخراج ويژگي و يك كلاس بندي كننده عصبي مي پردازد. در اين تحقيق از شبكه ي عصبي مصنوعي چندلايه پرسپترون به عنوان كلاس بندي كننده، پايگاه داده ي تيميت به عنوان جامعه آماري و ويژگي هاي طيف اندازه و فاز سيگنال استفاده شده است. تأثير تعداد و انواع ويژگي ها در عملكرد كلاس بندي كننده نيز در اين مقاله مورد بحث و بررسي قرارگرفته است. تمامي آزمايشات اين مقاله با رعايت اصل اعتبارسنجي انجام گرفته است. نتايج آزمايشات با 10 گوينده نشان داد، زماني كه فاز هارمونيك به بردار ويژگي هاي ورودي اضافه مي گردد، كارايي كلاس بندي گوينده در حدود %5 افزايش يافته و كلاس بندي گوينده با 76,8% با موفقيت انجام پذيرفت.
شماره مدرك كنفرانس :
4461009
سال انتشار :
1393
از صفحه :
1
تا صفحه :
8
سال انتشار :
1393
لينک به اين مدرک :
بازگشت