شماره ركورد :
649520
عنوان مقاله :
استخراج ويژگي‌هاي مبتني بر مدل‌سازي خطي تراژكتوري گفتار جاسازي شده در فضاي بازسازي شده فاز براي سيستم بازشناسي گفتار
عنوان فرعي :
Feature Extraction based on Linear Modeling of Embedded Speech Trajectory in the Reconstructed Phase Space for Speech Recognition System
پديد آورندگان :
شكفته، ياسر نويسنده , , الماس گنج ، فرشاد نويسنده AlmasGanj, F
اطلاعات موجودي :
فصلنامه سال 1391 شماره 0
رتبه نشريه :
علمي پژوهشي
تعداد صفحه :
17
از صفحه :
17
تا صفحه :
33
كليدواژه :
AR برداري , پيش‌بيني خطي , فضاي بازسازي شده فاز , استخراج ويژگي , جاسازي سيگنال , بازشناسي گفتار
چكيده فارسي :
تحقيقات اخير نشان مي‌دهد كه تظاهرات غيرخطي و آشوبي سيگنال گفتار مي‌تواند در حوزه فضاي بازسازي شده فاز (RPS) مطالعه شود. تيوري جاسازي برمبناي محورهاي تاخيري، ابزار مناسبي براي بررسي تراژكتورهاي گفتاري در RPS است. تاكنون از مشخصه‌هاي تراژكتورهاي گفتاري به ندرت در سيستم‌هاي كاربردي بازشناسي گفتار استفاده شده است. از اينرو در اين مقاله روش استخراج ويژگي جديدي براساس پارامترهاي مدلسازي خطي مبتني بر روش AR برداري (VAR) پيشنهاد شده است. در اين روش بوسيله ماتريس ضرايب فيلتر و يا ضرايب انعكاسي به دست آمده از اعمال روش VAR بر مشخصه‌هاي استاتيك و ديناميك تراژكتوري هاي گفتاري شكل يافته در RPS، يك بردار ويژگي با بُعد زياد حاصل مي‌شود كه مي‌توان از روش‌هاي نگاشت خطي براي كاهش بُعد مناسب آن استفاده كرد. نتايج آزمايش‌هاي بازشناسي واج مجزا و پيوسته بر مجموعه دادگان گفتاري فارس‌دات نشان مي‌دهد كه كارايي اين روش در مقايسه با ديگر روش‌هاي متداول استخراج ويژگي مبتني بر حوزه زمان مانند روش LPC و LPREF بيشتر است.
چكيده لاتين :
Recent researches show that nonlinear and chaotic behavior of the speech signal can be studied in the reconstructed phase space (RPS). Delay embedding theorem is a useful tool to study embedded speech trajectories in the RPS. Characteristics of the speech trajectories have rarely used in the practical speech recognition systems. Therefore, in this paper, a new feature extraction (FE) method is proposed based on parameters of vector AR (VAR) analysis over the speech trajectories. In this method, using filter and reflection matrices obtained from applying VAR analysis on static and dynamic information of the speech trajectory in the RPS, a high-dimensional feature vector can be achieved. Then, different transformation methods are utilized to attain final feature vectors with appropriate dimension. Results of discrete and continuous phoneme recognition over FARSDAT speech corpus show that the efficiency of the proposed FE method is better than other time-domain-based FE methods such as LPC and LPREF.
سال انتشار :
1391
عنوان نشريه :
مهندسي پزشكي زيستي
عنوان نشريه :
مهندسي پزشكي زيستي
اطلاعات موجودي :
فصلنامه با شماره پیاپی 0 سال 1391
كلمات كليدي :
#تست#آزمون###امتحان
لينک به اين مدرک :
بازگشت