عنوان مقاله :
بهكارگيريِ اطلاعاتِ زباني در يك سيستمِ بازشناسيِ گفتار پيوسته فارسي
عنوان فرعي :
Using Linguistic Data in a Continuous Speech Recognition System for Persian
پديد آورندگان :
بحراني ، محمد نويسنده , , صامتي، حسين نويسنده ,
اطلاعات موجودي :
فصلنامه سال 1389 شماره 11
كليدواژه :
بازشناسيِ گفتارِ پيوسته , مدلِ زبانيِ آماري , مدلِ زبانيِ دستوري , مدلسازيِ آوايي , مدلسازيِ زباني
چكيده فارسي :
در اين مقاله يك سامانه بازشناسي گفتار پيوسته براي زبان فارسي معرفي ميشود و نقش مدل آوايي و مدل زباني در آن مورد بررسي قرار ميگيرد. مدلهاي آوايي با روشهاي مستقلازبافت و وابستهبهبافت در اين سامانه بهكار رفته و نتايجِ بهكارگيريِ آنها ارايه شده است. مدل زبانيِ سهكلمهاي نيز با روشهاي مبتنيبر كلمه، مبتنيبر مقوله نحوي و مبتنيبر طبقه، با استفاده از پيكره متنيِ زبانِ فارسي استخراج و در سامانه بازشناسي بهكار گرفته شده است. همچنين مدل زبانيِ دستوري مبتنيبر دستور ساخت- گروهيِ تعميميافته در اين سامانه پيادهسازي شده و نيز در تركيب با مدل زبانيِ آماري بهكار رفته است. نتايج حاصل نشان ميدهد كه مدل آواييِ وابسته به بافت، مطابق انتظار، بهترين عملكرد را دارد. همچنين مدلِ زبانيِ سهكلمهايِ مبتني بر كلمه، نسبت به ساير روشهاي استخراجِ مدلِ زبانيِ آماري برتري دارد. درضمن تركيبِ مدلِ زبانيِ دستوري با مدلِ زبانيِ آماري منجر به بهبودِ نتايجِ بازشناسي ميشود. سامانه بازشناسيِ گفتارِ معرفيشده در اين مقاله، اولين سامانه بازشناسي براي گفتارِ پيوسته فارسي بوده و با پشتوانه فعاليتهاي تحقيقاتيِ متعددي كه براي پيادهسازيِ آن انجام شده است، قابليت استفاده بهصورت كاربردي را يافته است.
چكيده لاتين :
In this paper, a continuous speech recognition system for the Persian language is introduced and the roles of acoustic and language models are examined. Context-independent and context-dependent acoustic models are used in the system and the results of their employment are presented. Moreover, word-based, POS-based and class-based triphone language models are extracted using Persian text corpus and incorporated in the speech recognition system. In addition, a grammatical language model based on GPSG is implemented in the system and is used in combination with the statistical language model. Experimental results demonstrated hat as expected, context-dependent phonetic models show the best performances. Also, the word-based triphone language model showed superiority over other statistical language models. Moreover, the combination of grammatical language models with statistical ones proved to lead to better recognition results. The system introduced in this paper is the first Persian speech recognition system capable of practical usage and is based on numerous research works performed for its design and implementation.
عنوان نشريه :
زبان و زبان شناسي
عنوان نشريه :
زبان و زبان شناسي
اطلاعات موجودي :
فصلنامه با شماره پیاپی 11 سال 1389
كلمات كليدي :
#تست#آزمون###امتحان