عنوان مقاله :
توليد تمام واكههاي زبان فارسي با در اختيار داشتن تنها يك كلمه از گوينده هدف
عنوان فرعي :
Construction of all persian language vowels only with one word of target speaker
پديد آورندگان :
جنتي، محمدجواد نويسنده دانشكده مهندسي برق، دانشگاه صنعتي اميركبير Jannati, M.J. , صياديان، ابوالقاسم نويسنده دانشكده مهندسي برق، دانشگاه صنعتي اميركبير Sayadyan, A.
اطلاعات موجودي :
دوفصلنامه سال 1393 شماره 0
كليدواژه :
تبديل واكه , Nonparallel Training , آموزش غيرموازي , Voice Conversion , تبديل گفتار , Vowel Conversion
چكيده فارسي :
از جديترين تنگناها در تبديل گفتار، نياز به تعداد بالايي از جملات گوينده هدف براي آموزش سامانه تبديل گفتار است. شيوههاي تبديل موازي گفتار نيازمند حداقل 50 الي 200 و شيوههاي تبديل غيرموازي نيازمند چندين برابر اين تعداد جمله از گوينده هدف هستند. اين تحقيق شيوهاي را معرفي ميكند كه با كمك آن با داشتن تنها يك كلمه از گوينده هدف، تمام واكههاي زبان فارسي از آن گوينده توليد ميشوند. چون در هر كلمه حداقل يك هجا و در هر هجا يك واكه وجود دارد. هر كلمه از گوينده هدف حداقل حاوي يك هجا است. انديشه اصلي تحقيق طراحي تراديسهايي (تبديلاتي) مستقيم بين يك واكه و ساير واكهها و توليد مستقيم تمام واكهها از روي آن است. بر اين اساس با توليد يك مجموعه تراديسها (تبديلات) كه به صورت برونخط آموزش ميبينند، ميتوان از روي يك واكه مابقي واكهها را توليد كرد. با توجه به اينكه در زبان فارسي 6 واكه وجود دارد، در عمل به طراحي 30 تراديس (تبديل) نياز است. اين تراديسها (تبديلات) با استفاده از توابع گوسي شرطي طراحي و پيادهسازي و با استفاده از 10 گوينده آموزشي بهصورت باسرپرستي آموزش داده شدند. براساس معيار فاصله دُشپيچي (اعوجاج)، ميانگين فاصله واكههاي ابداعي از اين شيوه و واكههاي واقعي برابر با 0/4459است.
چكيده لاتين :
One of the most serious bottlenecks of voice conversion is the need of high number of training sentences from target speaker. Parallel voice conversion methods need 50 to 200 training sentences and nonparallel conversion methods need several times of it. In this research, a new method for construction of all Persian language vowels only with one training word of target speaker is introduced. In each word there is at least one syllable and in each syllable there is one vowel. Basic idea of research is designing direct transformations between each vowel and other vowels. Based on this idea, by offline training of sets of transformations, it is possible to construct all vowels from one arbitrary vowel. In Persian language there are 6 vowels. Because of it, 30 of such mentioned transformations must be designed. These transformations were designed with Gaussian conditional functions and trained by 10 speakers in supervised manner. With distortion distance criterion, average distance between real and artificial vowels was 0.4459.
عنوان نشريه :
مجله انجمن مهندسي صوتيات ايران
عنوان نشريه :
مجله انجمن مهندسي صوتيات ايران
اطلاعات موجودي :
دوفصلنامه با شماره پیاپی 0 سال 1393
كلمات كليدي :
#تست#آزمون###امتحان