شماره ركورد كنفرانس :
3299
عنوان مقاله :
بازشناسي تأكيد در گفتار پيوسته فارسي بهمنظور بهبود بازشناسي گفتار
پديدآورندگان :
صمصامي خداداد فريد دانشگاه تخصصي فناوريهاي نوين آمل - دانشكده مهندسي فناوري هاي نوين - گروه برق و مكانيك , نظري فخرالدين دانشگاه تخصصي فناوريهاي نوين آمل - دانشكده مهندسي فناوري هاي نوين - گروه برق و مكانيك , سيد قاسمي شعيب دانشگاه آزاد تهران جنوب , نظري محمد دانشگاه صنعتي اميركبير
كليدواژه :
بازشناسي گفتار , بازشناسي تأكيد , استخراج ويژگي , مدل مخفي ماركوف
عنوان كنفرانس :
اولين كنفرانس بين المللي فناوري هاي نوين در علوم
چكيده فارسي :
محيطهاي پراضطراب و تأثير آن بر حالات روحي انسان و همچنين شرايط محيطي مختلف در زمان توليد گفتار ازجمله
عواملي است كه از آن ميتوان بهعنوان دلايل پايين آمدن دقت سامانههاي بازشناسي گفتار نام برد. انواع تأكيد به وجود آمده
در گفتار نيز معلول اين حالات ميباشند. شناسايي تأكيد و اعمال آن به سامانههاي بازشناسي گفتار ميتواند تا حدودي به
افزايش صحت بازشناسي و كاهش خطاي موجود كمك نمايد. براي اين منظور تلاشهايي از اواخر دهه 80 ميلادي آغاز
گرديده و محققين به بررسي انواع روشهاي ممكن براي استخراج ويژگيها و نتايج آن بر بازشناسي تأكيد بر گفتار پرداختهاند.
توسعه ابزارهاي استخراج ويژگيها خطي و غيرخطي، گامي روبهجلو براي نائل شدن به اين هدف بوده است. علاوه بر ارزيابي
ويژگيها، الگوريتمهاي يادگيري ماشين، تكنيكها و سامانههاي مدل كننده و تركيب آنها با يكديگر نيز نقش مهمي در اين مطالعات ايفا كرده است. در اين مقاله سعي بر آن است تا با چند سناريو مختلف از انتخاب بردارهاي ويژگي گفتار پيوسته و
اعمال آن به مدل كننده مخفي ماركوف ) HMM ( يك سامانه بازشناسي تأكيد در گفتار پيوسته فارسي ارائه گردد. هدف از
اين سامانه يافتن تأكيد در گفتار بهمنظور بهبود دقت در سامانههاي بازشناسي گفتار ميباشد. درنهايت پس از به دست آوردن
نتايج براي تركيبي از ويژگيهاي مختلف، به مقايسه آنها پرداختهشده تا بتواند مؤثرترين آنها در بازشناسي تأكيد را مشخص
نمايد.
چكيده لاتين :
Disturbing environments and their effects on human mental situation and various environmental conditions at the time of speech production are among the factors that can be cited as the reasons for lower accuracy of speech recognition systems. Types of stress in speech are affected by these situations. Stress Recognition and its application to speech recognition systems can somewhat help to increase the recognition accuracy and reduce the existing errors. For this purpose, efforts have been initiated since the late 80's and researchers have explored a variety of possible methods for feature extraction and its outcomes on the recognition of speech stress. In addition to evaluating the feature extraction, the learning algorithms and modeling systems and their combination with each other also played an important role in these studies. In this paper, we try to recognize the stress in continuous speech. We proposed the several different scenarios for using the feature vectors and apply them to HMM to obtain the best possible accuracy. we show it will help us to reduce the error of speech recognition systems. Finally, after obtaining results for a combination of different features, they are compared to determine the most effective features for our stress recognition system.