عنوان مقاله :
سنتز گفتار فارسي با استفاده از فركانس گام در نرمافزار Flite
عنوان به زبان ديگر :
Farsi Speech Synthesis Using Pitch Frequency in Flite software
پديد آورندگان :
نعيمي، فاطمه دانشگاه آزاد اسلامي، سمنان - گروه مهندسي برق , قدس، وحيد دانشگاه آزاد اسلامي، سمنان - باشگاه پژوهشگران جوان و نخبگان
كليدواژه :
تبديل متن به گفتار , سنتز گفتار , فارسي , فركانس گام , نرمافزار Flite
چكيده فارسي :
در اين پژوهش، طراحي و پيادهسازي سنتز كننده گفتار به زبان فارسي با استفاده از نرمافزار Flite ارائه شده است. بدين طريق كه ابتدا توسط پايگاه داده جملات فارسي فارسدات، ميانگين و انحراف معيار فركانس گام و بزرگترين فركانس گام هر واج واكدار را بهدست ميآوريم. سپس تغييرات هر واج عبارت موردنظر را از طريق محاسبه مقدار ارزش آن با توجه به فرمول ارائه شده پيشنهادي، در نرمافزار وارد ميكنيم. ويژگي اين سنتز كننده، تبديل متن به گفتار با لهجه و تلفظ فارسي ميباشد. در انتهاي اين مقاله، نتايج حاصل از اجراي الگوريتم پيشنهادي با منحني فركانسهاي گام بهدست آمده توسط پايگاه داده جملات فارسي فارسدات، مقايسه شده است. همچنين، در اين پژوهش چند نمونه از جملات زبان فارسي مربوط به پايگاه داده جملات فارسي فارسدات، با استفاده از روش پيشنهادي بر روي نرمافزار Flite، مورد سنتز قرارگرفته است. آزمونهاي شنيداري، براي ميزان قابلفهم بودن، طبيعي بودن و خوشايند بودن جملات مذكور انجام شده است كه نتايج آنها براي جملات آموزش بهترتيب 4.4، 4.2 و 4.6 ميباشد. همچنين براي جملات مجموعه آزمون، بهترتيب برابر 4.2، 4.1 و 4.3 ميباشد.
چكيده لاتين :
This survey introduces a model and the implementation of a speech synthesizer in Farsi language using Flite software. In this approach, the mean and the standard deviation of pitch frequency of each voiced phoneme are first calculated by a database of Farsi sentences (Fars Dat). Then, the changes of each phoneme of the desired phrase are inserted into the software through the calculation of a value. The main feature of this synthesizer is its ability to change text to speech within Farsi pronunciation and in Farsi dialect. At the end of this paper, the results of this algorithm are compared to the changes of pitch frequencies extracted from the database of Farsi sentences. Some examples of the sentences from the database are also synthesized using our proposed method on Flite Software. The value of MOS test for understandability, naturalness and good sounding of those sentences are 4.4, 4.2, and 4.6 for the training set, respectively, and 4.2, 4.1, and 4.3 for the test set, respectively.
عنوان نشريه :
پردازش سيگنال پيشرفته