• شماره ركورد
    1376560
  • عنوان مقاله

    تشخيص ارقام گفتاري فارسي با استفاده از شبكه هاي يادگيري عميق

  • پديد آورندگان

    زربافي ، سحر دانشگاه سمنان - دانشكده مهندسي برق و كامپبوتر , كياني ، كوروش دانشگاه سمنان - دانشكده مهندسي برق و كامپيوتر , راستگو ، راضيه دانشگاه سمنان - دانشكده مهندسي برق و كامپيوتر

  • از صفحه
    163
  • تا صفحه
    172
  • كليدواژه
    ارقام گفتاري , طبقه بندي , ارقام گفتاري فارسي , طيف‌نگار مل , پايگاه داده , ترنسفورمر
  • چكيده فارسي
    طبقه‌ بندي ارقام جدا شده چالش اساسي براي بسياري از سيستم‌هاي طبقه‌بندي گفتار است. در حالي ‌كه كارهاي زيادي بر روي زبان‌هاي گفتاري انجام شده است، تحقيقات محدودي در مورد داده‌هاي رقمي گفتاري فارسي در ادبيات گزارش شده است و تمامي تحقيقات مربوط به اعداد صفر تا 9 بوده است. براي اين منظور، پايگاه داده ي جامعي شامل بازه ي وسيعتري از اعداد با مشاركت 145 نفر كه شامل هفتاد نفر مرد و 75 نفر زن هستند، جمع‌آوري گرديده است. پايگاه داده مذكور، بازه عددي صفر تا 599 را پوشش مي‌دهد. پس از پيش‌پردازش داده ها، داده‌هاي صوتي تبديل به طيف‌نگار مل شده و براي استخراج ويژگي و طبقه‌بندي داده‌ها از شبكه عصبي كانولوشني و نيز يك مدل تركيبي شامل مدل ترنسفورمر و حافظه كوتاه و بلند مدت استفاده گرديده است. نتايج تجربي بر روي پايگاه داده جمع آوري شده حاكي از دقت اعتبارسنجي 98.03 درصد مي باشد.
  • عنوان نشريه
    مدل سازي در مهندسي
  • عنوان نشريه
    مدل سازي در مهندسي