شماره ركورد كنفرانس :
173
عنوان مقاله :
بكارگيري روشهاي تطبيق به گوينده سريع بر مبناي فارسيMLLRدر سيستم بازشناسي گفتارفارسي
عنوان به زبان ديگر :
بكارگيري روشهاي تطبيق به گوينده سريع بر مبناي فارسيMLLRدر سيستم بازشناسي گفتارفارسي
پديدآورندگان :
انصاري زهره نويسنده , شيري قيداري سعيد نويسنده , الماس گنج فرشاد نويسنده
كليدواژه :
آناليز مؤلفه هاي اساسي احتمالاتي , تطبيق به گوينده , رگرسيون خطي بيشينه درست نمايي , فضاي ويژه
عنوان كنفرانس :
بيست و يكمين كنفرانس مهندسي برق ايران
چكيده فارسي :
روش رگرسیون خطی بیشینه درستنمایی ) MLLR ( یكی از متداولترین روشهای تطبیق به گوینده است كه در داده تطبیقی كافی میتواند عملكرد خوبی را از خود به نمایش بگذارد. اما وقتی میزان داده تطبیقی كاهش مییابد، این روش نمیتواند به خوبی عمل كند. در این مقاله، دو روش تطبیق به گوینده MLLR بر مبنای آنالیز مؤلفههای اساسی ) PCA ( یا EMLLR و PCA احتمالاتی به منظور برطرف كردن اینمشكل بكار گرفته شدهاند. در روش دوم، مزایای سه روش تطبیق به گوینده متداول بیشینه پسینه ) MAP (، رگرسیون خطی بیشنیه درست نمایی ) MLLR ( و صدای ویژه ) EV ( با یگدیگر تركیب شده است. در این روش، اطلاعات مربوط به تغییرات آوای یك گوینده كه توسط ماتریس تبدیل MLLR مربوط به آن گوینده مشخص میشوند یك ابربردار را میسازند. با اعمال PCA احتمالاتی به فضای ابربردارهای تشكیل شده ازتغییرات آوای مربوط به تمامی گویندگان تعلیمی، یك مدل احتمالاتی برای تولید ماتریس تبدیل گوینده جدید بوجود میآید كه با استفاده از تخمین MAP میتوان این ماتریس را محاسبه كرد. نتایج آزمایشات نشان میدهند كه روش دوم در مقادیر مختلف از داده تطبیقی سرپرستیشده و بدون سرپرستی بخصوص در داده تطبیقی كوتاه عملكرد خوبی را نسبت به روش EMLLR و MLLR از خود نشان میدهد
شماره مدرك كنفرانس :
4474702