شماره ركورد
766713
عنوان مقاله
توليد تمام واكههاي زبان فارسي با در اختيار داشتن تنها يك كلمه از گوينده هدف
عنوان فرعي
Construction of all persian language vowels only with one word of target speaker
پديد آورندگان
جنتي، محمدجواد نويسنده دانشكده مهندسي برق، دانشگاه صنعتي اميركبير Jannati, M.J. , صياديان، ابوالقاسم نويسنده دانشكده مهندسي برق، دانشگاه صنعتي اميركبير Sayadyan, A.
اطلاعات موجودي
دوفصلنامه سال 1393 شماره 0
رتبه نشريه
علمي پژوهشي
تعداد صفحه
12
از صفحه
41
تا صفحه
52
كليدواژه
تبديل واكه , Nonparallel Training , آموزش غيرموازي , Voice Conversion , تبديل گفتار , Vowel Conversion
چكيده فارسي
از جديترين تنگناها در تبديل گفتار، نياز به تعداد بالايي از جملات گوينده هدف براي آموزش سامانه تبديل گفتار است. شيوههاي تبديل موازي گفتار نيازمند حداقل 50 الي 200 و شيوههاي تبديل غيرموازي نيازمند چندين برابر اين تعداد جمله از گوينده هدف هستند. اين تحقيق شيوهاي را معرفي ميكند كه با كمك آن با داشتن تنها يك كلمه از گوينده هدف، تمام واكههاي زبان فارسي از آن گوينده توليد ميشوند. چون در هر كلمه حداقل يك هجا و در هر هجا يك واكه وجود دارد. هر كلمه از گوينده هدف حداقل حاوي يك هجا است. انديشه اصلي تحقيق طراحي تراديسهايي (تبديلاتي) مستقيم بين يك واكه و ساير واكهها و توليد مستقيم تمام واكهها از روي آن است. بر اين اساس با توليد يك مجموعه تراديسها (تبديلات) كه به صورت برونخط آموزش ميبينند، ميتوان از روي يك واكه مابقي واكهها را توليد كرد. با توجه به اينكه در زبان فارسي 6 واكه وجود دارد، در عمل به طراحي 30 تراديس (تبديل) نياز است. اين تراديسها (تبديلات) با استفاده از توابع گوسي شرطي طراحي و پيادهسازي و با استفاده از 10 گوينده آموزشي بهصورت باسرپرستي آموزش داده شدند. براساس معيار فاصله دُشپيچي (اعوجاج)، ميانگين فاصله واكههاي ابداعي از اين شيوه و واكههاي واقعي برابر با 0/4459است.
چكيده لاتين
One of the most serious bottlenecks of voice conversion is the need of high number of training sentences from target speaker. Parallel voice conversion methods need 50 to 200 training sentences and nonparallel conversion methods need several times of it. In this research, a new method for construction of all Persian language vowels only with one training word of target speaker is introduced. In each word there is at least one syllable and in each syllable there is one vowel. Basic idea of research is designing direct transformations between each vowel and other vowels. Based on this idea, by offline training of sets of transformations, it is possible to construct all vowels from one arbitrary vowel. In Persian language there are 6 vowels. Because of it, 30 of such mentioned transformations must be designed. These transformations were designed with Gaussian conditional functions and trained by 10 speakers in supervised manner. With distortion distance criterion, average distance between real and artificial vowels was 0.4459.
سال انتشار
1393
عنوان نشريه
مجله انجمن مهندسي صوتيات ايران
عنوان نشريه
مجله انجمن مهندسي صوتيات ايران
اطلاعات موجودي
دوفصلنامه با شماره پیاپی 0 سال 1393
كلمات كليدي
#تست#آزمون###امتحان
لينک به اين مدرک