شماره ركورد
1376560
عنوان مقاله
تشخيص ارقام گفتاري فارسي با استفاده از شبكه هاي يادگيري عميق
پديد آورندگان
زربافي ، سحر دانشگاه سمنان - دانشكده مهندسي برق و كامپبوتر , كياني ، كوروش دانشگاه سمنان - دانشكده مهندسي برق و كامپيوتر , راستگو ، راضيه دانشگاه سمنان - دانشكده مهندسي برق و كامپيوتر
از صفحه
163
تا صفحه
172
كليدواژه
ارقام گفتاري , طبقه بندي , ارقام گفتاري فارسي , طيفنگار مل , پايگاه داده , ترنسفورمر
چكيده فارسي
طبقه بندي ارقام جدا شده چالش اساسي براي بسياري از سيستمهاي طبقهبندي گفتار است. در حالي كه كارهاي زيادي بر روي زبانهاي گفتاري انجام شده است، تحقيقات محدودي در مورد دادههاي رقمي گفتاري فارسي در ادبيات گزارش شده است و تمامي تحقيقات مربوط به اعداد صفر تا 9 بوده است. براي اين منظور، پايگاه داده ي جامعي شامل بازه ي وسيعتري از اعداد با مشاركت 145 نفر كه شامل هفتاد نفر مرد و 75 نفر زن هستند، جمعآوري گرديده است. پايگاه داده مذكور، بازه عددي صفر تا 599 را پوشش ميدهد. پس از پيشپردازش داده ها، دادههاي صوتي تبديل به طيفنگار مل شده و براي استخراج ويژگي و طبقهبندي دادهها از شبكه عصبي كانولوشني و نيز يك مدل تركيبي شامل مدل ترنسفورمر و حافظه كوتاه و بلند مدت استفاده گرديده است. نتايج تجربي بر روي پايگاه داده جمع آوري شده حاكي از دقت اعتبارسنجي 98.03 درصد مي باشد.
عنوان نشريه
مدل سازي در مهندسي
عنوان نشريه
مدل سازي در مهندسي
لينک به اين مدرک