به‌كارگيريِ اطلاعاتِ زباني در يك سيستمِ بازشناسيِ گفتار پيوسته فارسي

عنوان فرعي

Using Linguistic Data in a Continuous Speech Recognition System for Persian

پديد آورندگان

بحراني ، محمد نويسنده , , صامتي، حسين نويسنده ,

اطلاعات موجودي

فصلنامه سال 1389 شماره 11

رتبه نشريه

علمي پژوهشي

تعداد صفحه

از صفحه

تا صفحه

111

كليدواژه

بازشناسيِ گفتارِ پيوسته , مدلِ زبانيِ آماري , مدلِ زبانيِ دستوري , مدل‌سازيِ آوايي , مدل‌سازيِ زباني

چكيده فارسي

در اين مقاله يك سامانه بازشناسي گفتار پيوسته براي زبان فارسي معرفي مي‌شود و نقش مدل آوايي و مدل زباني در آن مورد بررسي قرار مي‌گيرد. مدل‌هاي آوايي با روش‌هاي مستقل‌از‌بافت و وابسته‌به‌بافت در اين سامانه به‌كار رفته و نتايجِ به‌كارگيريِ آن‌ها ارايه شده است. مدل زبانيِ سه‌كلمه‌اي نيز با روش‌هاي مبتني‌بر كلمه، مبتني‌بر مقوله نحوي و مبتني‌بر طبقه، با استفاده از پيكره متنيِ زبانِ فارسي استخراج و در سامانه بازشناسي به‌كار گرفته شده است. همچنين مدل زبانيِ دستوري مبتني‌بر دستور ساخت- گروهيِ تعميم‌يافته در اين سامانه پياده‌سازي شده و نيز در تركيب با مدل زبانيِ آماري به‌كار رفته است. نتايج حاصل نشان مي‌دهد كه مدل آواييِ وابسته به بافت، مطابق انتظار، بهترين عملكرد را دارد. همچنين مدلِ زبانيِ سه‌كلمه‌ايِ مبتني بر كلمه، نسبت به ساير روش‌هاي استخراجِ مدلِ زبانيِ آماري برتري دارد. درضمن تركيبِ مدلِ زبانيِ دستوري با مدلِ زبانيِ آماري منجر به بهبودِ نتايجِ بازشناسي مي‌شود. سامانه بازشناسيِ گفتارِ معرفي‌شده در اين مقاله، اولين سامانه بازشناسي براي گفتارِ پيوسته فارسي بوده و با پشتوانه فعاليت‌هاي تحقيقاتيِ متعددي كه براي پياده‌سازيِ آن انجام شده است، قابليت استفاده به‌صورت كاربردي را يافته است.

چكيده لاتين

In this paper, a continuous speech recognition system for the Persian language is introduced and the roles of acoustic and language models are examined. Context-independent and context-dependent acoustic models are used in the system and the results of their employment are presented. Moreover, word-based, POS-based and class-based triphone language models are extracted using Persian text corpus and incorporated in the speech recognition system. In addition, a grammatical language model based on GPSG is implemented in the system and is used in combination with the statistical language model. Experimental results demonstrated hat as expected, context-dependent phonetic models show the best performances. Also, the word-based triphone language model showed superiority over other statistical language models. Moreover, the combination of grammatical language models with statistical ones proved to lead to better recognition results. The system introduced in this paper is the first Persian speech recognition system capable of practical usage and is based on numerous research works performed for its design and implementation.

سال انتشار

1389

عنوان نشريه

زبان و زبان شناسي

عنوان نشريه

زبان و زبان شناسي

اطلاعات موجودي

فصلنامه با شماره پیاپی 11 سال 1389

كلمات كليدي

#تست#آزمون###امتحان

لينک به اين مدرک

https://search.isc.ac/dl/search/defaultta.aspx?DTC=8&DC=678979