شماره ركورد كنفرانس :
4658
عنوان مقاله :
ارائه روشي جهت بازشناسي گفتار با استفاده از شبكه هاي عصبي مصنوعي پس انتشار
عنوان به زبان ديگر :
Presenting a method for recognition of speech using backpropagation Artifical Neural Networks
پديدآورندگان :
بهرامي راد رضا bahramirad_reza@yahoo.com دانشگاه خوارزمي تهران;
تعداد صفحه :
8
كليدواژه :
تشخيص گفتار , شبكه هاي عصبي مصنوعي پس انتشار , MFCC , طبقه بندي
سال انتشار :
1396
عنوان كنفرانس :
دومين كنفرانس بين المللي پژوهش هاي دانش بنيان در كامپيوتر و فن آوري اطلاعات
زبان مدرك :
فارسي
چكيده فارسي :
رابط گفتار براي كامپيوتر، يك تكنولوژي عمومي براي كاربران است. برنامه¬هاي كاربردي متعددي جهت تشخيص خودكار گفتار در سيستم هواپيمايي، ورود داده¬ها، پردازش متن، رابط¬هاي شماره¬گيري صوتي و حوزه¬هاي مختلف صنعتي استفاده مي¬شود. پردازش گفتار مي¬تواند يك رابط مفيد براي تعامل با ماشين باشد. در واقع تشخيص گفتار يك پديده ذهني است و در اين حوزه تحقيقات زيادي صورت گرفته است. سيستم¬هاي تشخيص گفتار به دو بخش مختلف يعني استخراج ويژگي¬ها و تشخيص ويژگي¬ها تقسيم مي¬شود. در اين تحقيق صداي افراد با سنين مختلف در يك محيط آرام و بدون نويز از طريق ميكروفون ضبط شده است. افراد به طور يكسان 10 الي 12 ثانيه صحبت كرده¬اند. سپس جملات گفتاري با فرمت wave ذخيره شده است. براي استخراج ويژگي¬ها از ضرايب كپسترال فركانس مل (MFCC) و از شبكه عصبي پس انتشار براي آموزش، تشخيص و طبقه¬بندي استفاده شده است.
چكيده لاتين :
The speech interface for a computer is a general technology for users. Several applications are used to automatically detect speech in the airline system, data entry, text processing, voice dialing, and various industrial domains. Speech processing can be a useful interface for interacting with the car. In fact, speech recognition is a mental phenomenon, and much research has been done in this area. Speech recognition systems are divided into two distinct parts, namely, the extraction of features and the recognition of features. In this research, the sounds of people of different ages are recorded in a quiet and noisy environment through a microphone. Individuals have spoken 10 to 12 seconds alike. Then sentence sentences are stored in wave format. For the extraction of features, the MFC coefficients and the post-propagation neural network have been used for training, diagnosis and classification.
كشور :
ايران
لينک به اين مدرک :
بازگشت