شماره ركورد :
766713
عنوان مقاله :
توليد تمام واكه‌هاي زبان فارسي با در اختيار داشتن تنها يك كلمه از گوينده هدف
عنوان فرعي :
Construction of all persian language vowels only with one word of target speaker
پديد آورندگان :
جنتي، محمدجواد نويسنده دانشكده مهندسي برق، دانشگاه صنعتي اميركبير Jannati, M.J. , صياديان، ابوالقاسم نويسنده دانشكده مهندسي برق، دانشگاه صنعتي اميركبير Sayadyan, A.
اطلاعات موجودي :
دوفصلنامه سال 1393 شماره 0
رتبه نشريه :
علمي پژوهشي
تعداد صفحه :
12
از صفحه :
41
تا صفحه :
52
كليدواژه :
تبديل واكه , Nonparallel Training , آموزش غيرموازي , Voice Conversion , تبديل گفتار , Vowel Conversion
چكيده فارسي :
از جدي‌ترين تنگناها در تبديل گفتار، نياز به تعداد بالايي از جملات گوينده هدف براي آموزش سامانه تبديل گفتار است. شيوه‌هاي تبديل موازي گفتار نيازمند حداقل 50 الي 200 و شيوه‌هاي تبديل غيرموازي نيازمند چندين برابر اين تعداد جمله از گوينده هدف هستند. اين تحقيق شيوه‌اي را معرفي مي‌كند كه با كمك آن با داشتن تنها يك كلمه از گوينده هدف، تمام واكه‌هاي زبان فارسي از آن گوينده توليد مي‌شوند. چون در هر كلمه حداقل يك هجا و در هر هجا يك واكه وجود دارد. هر كلمه از گوينده هدف حداقل حاوي يك هجا است. انديشه اصلي تحقيق طراحي تراديس‌هايي (تبديلاتي) مستقيم بين يك واكه و ساير واكه‌ها و توليد مستقيم تمام واكه‌ها از روي آن است. بر اين اساس با توليد يك مجموعه تراديس‌ها (تبديلات) كه به صورت برون‌خط آموزش مي‌بينند، مي‌توان از روي يك واكه مابقي واكه‌ها را توليد كرد. با توجه به اينكه در زبان فارسي 6 واكه وجود دارد، در عمل به طراحي 30 تراديس (تبديل) نياز است. اين تراديس‌ها (تبديلات) با استفاده از توابع گوسي شرطي طراحي و پياده‌سازي و با استفاده از 10 گوينده آموزشي به‌صورت باسرپرستي آموزش داده شدند. براساس معيار فاصله دُش‌پيچي (اعوجاج)، ميانگين فاصله واكه‌هاي ابداعي از اين شيوه و واكه‌هاي واقعي برابر با 0/4459است.
چكيده لاتين :
One of the most serious bottlenecks of voice conversion is the need of high number of training sentences from target speaker. Parallel voice conversion methods need 50 to 200 training sentences and nonparallel conversion methods need several times of it. In this research, a new method for construction of all Persian language vowels only with one training word of target speaker is introduced. In each word there is at least one syllable and in each syllable there is one vowel. Basic idea of research is designing direct transformations between each vowel and other vowels. Based on this idea, by offline training of sets of transformations, it is possible to construct all vowels from one arbitrary vowel. In Persian language there are 6 vowels. Because of it, 30 of such mentioned transformations must be designed. These transformations were designed with Gaussian conditional functions and trained by 10 speakers in supervised manner. With distortion distance criterion, average distance between real and artificial vowels was 0.4459.
سال انتشار :
1393
عنوان نشريه :
مجله انجمن مهندسي صوتيات ايران
عنوان نشريه :
مجله انجمن مهندسي صوتيات ايران
اطلاعات موجودي :
دوفصلنامه با شماره پیاپی 0 سال 1393
كلمات كليدي :
#تست#آزمون###امتحان
لينک به اين مدرک :
بازگشت