شماره ركورد كنفرانس :
4747
عنوان مقاله :
تخمين ميزان همبستگي بيست معيار ارزيابي كيفيت صدا با WER سيستم ASR با روش GMDH و تركيب ژنتيك با GPR
پديدآورندگان :
مهديان راهيل دانشگاه صداوسيماي جمهوري اسلامي ايران , صحت محمد مهدي دانشگاه صداوسيماي جمهوري اسلامي ايران
تعداد صفحه :
7
كليدواژه :
قابليت فهم گفتار , شبكه‌ي GMDH و GPR , سيستم ASR , معيارهاي ارزيابي كيفيت صدا.
سال انتشار :
1398
عنوان كنفرانس :
اجلاس فناوري رسانه
زبان مدرك :
فارسي
چكيده فارسي :
گفتار ساده‌ترين و معمول‌ترين ارتباط بين انسان‌ها است. براي درك گفتار، آن گفتار بايد قابل‌فهم باشد. اندازه‌گيري قابليت فهم گفتار جز از طريق ارزياب‌هاي ذهني يا setup كردن سيستم ASR ممكن نيست كه هر دو روش بسيار هزينه‌بر و زمان‌بر است به همين دليل اگر بتوان با روشي رياضي معياري پيدا كرد كه همبستگي بالايي با مقدار خروجي ارزياب‌هاي ذهني يا مقدار WER سيستم ASR داشته باشد. مي‌توان از آن روش براي تخمين قابليت فهم گفتار استفاده كرد. در اين تحقيق هدف اين است كه با استفاده از روش‌هاي يادگيري ماشين ميزان همبستگي 20 معيار ارزيابي كيفيت صدا با مقدار WER سيستم ASR مشخص گردد؛ به همين دليل با استفاده از پايگاه‌ داده‌ي timit كه سيستم ASR براي آن setup شده است. پايگاه داده‌اي كه نمونه‌هاي آن شامل 20 معيار ارزيابي كيفيت و يك مقدار WER است، تهيه گرديد. اين پايگاه داده شامل 10831 نمونه مي‌باشد كه نمونه‌ها از تركيب 4 نسبت سيگنال به نوفه‌ي مختلف، 120 نوفه و 17 الگوريتم حذف نوفه و همچنين شامل 519 سيگنال واخنش دار بوده كه اين سيگنال‌ها بازه‌ي WER بين 22% تا 95% را شامل مي‌شوند؛ براي افزايش داده و دقيق‌تر شدن نتايج 2 الگوريتم حذف واخنش روي اين سيگنال‌هاي واخنش‌دار اعمال شده است. هدف استفاده از اين الگوريتم‌هاي حذف نوفه و واخنش بررسي تأثير اعوجاج ايجاد شده بوسيله‌ي آن‌ها در نتايج خروجي روش پيشنهادي است. سپس با استفاده از شبكه‌ي GMDH و روش پيشنهادي درصد همبستگي 20 معيار ارزيابي كيفيت با مقدار WER به دست آورده شد.
كشور :
ايران
لينک به اين مدرک :
بازگشت