شماره ركورد كنفرانس :
4747
عنوان مقاله :
تخمين ميزان همبستگي بيست معيار ارزيابي كيفيت صدا با WER سيستم ASR با روش GMDH و تركيب ژنتيك با GPR
پديدآورندگان :
مهديان راهيل دانشگاه صداوسيماي جمهوري اسلامي ايران , صحت محمد مهدي دانشگاه صداوسيماي جمهوري اسلامي ايران
كليدواژه :
قابليت فهم گفتار , شبكهي GMDH و GPR , سيستم ASR , معيارهاي ارزيابي كيفيت صدا.
عنوان كنفرانس :
اجلاس فناوري رسانه
چكيده فارسي :
گفتار سادهترين و معمولترين ارتباط بين انسانها است. براي درك گفتار، آن گفتار بايد قابلفهم باشد. اندازهگيري قابليت فهم گفتار جز از طريق ارزيابهاي ذهني يا setup كردن سيستم ASR ممكن نيست كه هر دو روش بسيار هزينهبر و زمانبر است به همين دليل اگر بتوان با روشي رياضي معياري پيدا كرد كه همبستگي بالايي با مقدار خروجي ارزيابهاي ذهني يا مقدار WER سيستم ASR داشته باشد. ميتوان از آن روش براي تخمين قابليت فهم گفتار استفاده كرد. در اين تحقيق هدف اين است كه با استفاده از روشهاي يادگيري ماشين ميزان همبستگي 20 معيار ارزيابي كيفيت صدا با مقدار WER سيستم ASR مشخص گردد؛ به همين دليل با استفاده از پايگاه دادهي timit كه سيستم ASR براي آن setup شده است. پايگاه دادهاي كه نمونههاي آن شامل 20 معيار ارزيابي كيفيت و يك مقدار WER است، تهيه گرديد. اين پايگاه داده شامل 10831 نمونه ميباشد كه نمونهها از تركيب 4 نسبت سيگنال به نوفهي مختلف، 120 نوفه و 17 الگوريتم حذف نوفه و همچنين شامل 519 سيگنال واخنش دار بوده كه اين سيگنالها بازهي WER بين 22% تا 95% را شامل ميشوند؛ براي افزايش داده و دقيقتر شدن نتايج 2 الگوريتم حذف واخنش روي اين سيگنالهاي واخنشدار اعمال شده است. هدف استفاده از اين الگوريتمهاي حذف نوفه و واخنش بررسي تأثير اعوجاج ايجاد شده بوسيلهي آنها در نتايج خروجي روش پيشنهادي است. سپس با استفاده از شبكهي GMDH و روش پيشنهادي درصد همبستگي 20 معيار ارزيابي كيفيت با مقدار WER به دست آورده شد.