شماره ركورد
649520
عنوان مقاله
استخراج ويژگيهاي مبتني بر مدلسازي خطي تراژكتوري گفتار جاسازي شده در فضاي بازسازي شده فاز براي سيستم بازشناسي گفتار
عنوان فرعي
Feature Extraction based on Linear Modeling of Embedded Speech Trajectory in the Reconstructed Phase Space for Speech Recognition System
پديد آورندگان
شكفته، ياسر نويسنده , , الماس گنج ، فرشاد نويسنده AlmasGanj, F
اطلاعات موجودي
فصلنامه سال 1391 شماره 0
رتبه نشريه
علمي پژوهشي
تعداد صفحه
17
از صفحه
17
تا صفحه
33
كليدواژه
AR برداري , پيشبيني خطي , فضاي بازسازي شده فاز , استخراج ويژگي , جاسازي سيگنال , بازشناسي گفتار
چكيده فارسي
تحقيقات اخير نشان ميدهد كه تظاهرات غيرخطي و آشوبي سيگنال گفتار ميتواند در حوزه فضاي بازسازي شده فاز (RPS) مطالعه شود. تيوري جاسازي برمبناي محورهاي تاخيري، ابزار مناسبي براي بررسي تراژكتورهاي گفتاري در RPS است. تاكنون از مشخصههاي تراژكتورهاي گفتاري به ندرت در سيستمهاي كاربردي بازشناسي گفتار استفاده شده است. از اينرو در اين مقاله روش استخراج ويژگي جديدي براساس پارامترهاي مدلسازي خطي مبتني بر روش AR برداري (VAR) پيشنهاد شده است. در اين روش بوسيله ماتريس ضرايب فيلتر و يا ضرايب انعكاسي به دست آمده از اعمال روش VAR بر مشخصههاي استاتيك و ديناميك تراژكتوري هاي گفتاري شكل يافته در RPS، يك بردار ويژگي با بُعد زياد حاصل ميشود كه ميتوان از روشهاي نگاشت خطي براي كاهش بُعد مناسب آن استفاده كرد. نتايج آزمايشهاي بازشناسي واج مجزا و پيوسته بر مجموعه دادگان گفتاري فارسدات نشان ميدهد كه كارايي اين روش در مقايسه با ديگر روشهاي متداول استخراج ويژگي مبتني بر حوزه زمان مانند روش LPC و LPREF بيشتر است.
چكيده لاتين
Recent researches show that nonlinear and chaotic behavior of the speech signal can be studied in the reconstructed phase space (RPS). Delay embedding theorem is a useful tool to study embedded speech trajectories in the RPS. Characteristics of the speech trajectories have rarely used in the practical speech recognition systems. Therefore, in this paper, a new feature extraction (FE) method is proposed based on parameters of vector AR (VAR) analysis over the speech trajectories. In this method, using filter and reflection matrices obtained from applying VAR analysis on static and dynamic information of the speech trajectory in the RPS, a high-dimensional feature vector can be achieved. Then, different transformation methods are utilized to attain final feature vectors with appropriate dimension. Results of discrete and continuous phoneme recognition over FARSDAT speech corpus show that the efficiency of the proposed FE method is better than other time-domain-based FE methods such as LPC and LPREF.
سال انتشار
1391
عنوان نشريه
مهندسي پزشكي زيستي
عنوان نشريه
مهندسي پزشكي زيستي
اطلاعات موجودي
فصلنامه با شماره پیاپی 0 سال 1391
كلمات كليدي
#تست#آزمون###امتحان
لينک به اين مدرک