شماره ركورد :
1122524
عنوان مقاله :
سنتز گفتار فارسي با استفاده از فركانس گام در نرم‌افزار Flite
عنوان به زبان ديگر :
Farsi Speech Synthesis Using Pitch Frequency in Flite software
پديد آورندگان :
نعيمي، فاطمه دانشگاه آزاد اسلامي، سمنان - گروه مهندسي برق , قدس، وحيد دانشگاه آزاد اسلامي، سمنان - باشگاه پژوهشگران جوان و نخبگان
تعداد صفحه :
11
از صفحه :
97
تا صفحه :
107
كليدواژه :
تبديل متن به گفتار , سنتز گفتار , فارسي , فركانس گام , نرم‌افزار Flite
چكيده فارسي :
در اين پژوهش، طراحي و پياده‌سازي سنتز كننده گفتار به زبان فارسي با استفاده از نرم‌افزار Flite ارائه شده است. بدين طريق كه ابتدا توسط پايگاه داده جملات فارسي فارس‌دات، ميانگين و انحراف معيار فركانس گام و بزرگترين فركانس گام هر واج واك‌دار را به‌دست مي‌آوريم. سپس تغييرات هر واج عبارت موردنظر را از طريق محاسبه مقدار ارزش آن با توجه به فرمول ارائه شده پيشنهادي، در نرم‌افزار وارد مي‌كنيم. ويژگي اين سنتز كننده، تبديل متن به گفتار با لهجه و تلفظ فارسي مي‌باشد. در انتهاي اين مقاله، نتايج حاصل از اجراي الگوريتم پيشنهادي با منحني فركانس‌هاي گام به‌دست آمده توسط پايگاه داده جملات فارسي فارس‌دات، مقايسه شده است. همچنين، در اين پژوهش چند نمونه از جملات زبان فارسي مربوط به پايگاه داده جملات فارسي فارس‌دات، با استفاده از روش پيشنهادي بر روي نرم‌افزار Flite، مورد سنتز قرارگرفته است. آزمون‌هاي شنيداري، براي ميزان قابل‌فهم بودن، طبيعي بودن و خوشايند بودن جملات مذكور انجام شده است كه نتايج آن‌ها براي جملات آموزش به‌ترتيب 4.4، 4.2 و 4.6 مي‌باشد. همچنين براي جملات مجموعه آزمون، به‌ترتيب برابر 4.2، 4.1 و 4.3 مي‌باشد.
چكيده لاتين :
This survey introduces a model and the implementation of a speech synthesizer in Farsi language using Flite software. In this approach, the mean and the standard deviation of pitch frequency of each voiced phoneme are first calculated by a database of Farsi sentences (Fars Dat). Then, the changes of each phoneme of the desired phrase are inserted into the software through the calculation of a value. The main feature of this synthesizer is its ability to change text to speech within Farsi pronunciation and in Farsi dialect. At the end of this paper, the results of this algorithm are compared to the changes of pitch frequencies extracted from the database of Farsi sentences. Some examples of the sentences from the database are also synthesized using our proposed method on Flite Software. The value of MOS test for understandability, naturalness and good sounding of those sentences are 4.4, 4.2, and 4.6 for the training set, respectively, and 4.2, 4.1, and 4.3 for the test set, respectively.
سال انتشار :
1398
عنوان نشريه :
پردازش سيگنال پيشرفته
فايل PDF :
7754589
لينک به اين مدرک :
بازگشت