عنوان مقاله :
استخراج ويژگيهاي مبتني بر مدلسازي خطي تراژكتوري گفتار جاسازي شده در فضاي بازسازي شده فاز براي سيستم بازشناسي گفتار
عنوان فرعي :
Feature Extraction based on Linear Modeling of Embedded Speech Trajectory in the Reconstructed Phase Space for Speech Recognition System
پديد آورندگان :
شكفته، ياسر نويسنده , , الماس گنج ، فرشاد نويسنده AlmasGanj, F
اطلاعات موجودي :
فصلنامه سال 1391 شماره 0
كليدواژه :
AR برداري , پيشبيني خطي , فضاي بازسازي شده فاز , استخراج ويژگي , جاسازي سيگنال , بازشناسي گفتار
چكيده فارسي :
تحقيقات اخير نشان ميدهد كه تظاهرات غيرخطي و آشوبي سيگنال گفتار ميتواند در حوزه فضاي بازسازي شده فاز (RPS) مطالعه شود. تيوري جاسازي برمبناي محورهاي تاخيري، ابزار مناسبي براي بررسي تراژكتورهاي گفتاري در RPS است. تاكنون از مشخصههاي تراژكتورهاي گفتاري به ندرت در سيستمهاي كاربردي بازشناسي گفتار استفاده شده است. از اينرو در اين مقاله روش استخراج ويژگي جديدي براساس پارامترهاي مدلسازي خطي مبتني بر روش AR برداري (VAR) پيشنهاد شده است. در اين روش بوسيله ماتريس ضرايب فيلتر و يا ضرايب انعكاسي به دست آمده از اعمال روش VAR بر مشخصههاي استاتيك و ديناميك تراژكتوري هاي گفتاري شكل يافته در RPS، يك بردار ويژگي با بُعد زياد حاصل ميشود كه ميتوان از روشهاي نگاشت خطي براي كاهش بُعد مناسب آن استفاده كرد. نتايج آزمايشهاي بازشناسي واج مجزا و پيوسته بر مجموعه دادگان گفتاري فارسدات نشان ميدهد كه كارايي اين روش در مقايسه با ديگر روشهاي متداول استخراج ويژگي مبتني بر حوزه زمان مانند روش LPC و LPREF بيشتر است.
چكيده لاتين :
Recent researches show that nonlinear and chaotic behavior of the speech signal can be studied in the reconstructed phase space (RPS). Delay embedding theorem is a useful tool to study embedded speech trajectories in the RPS. Characteristics of the speech trajectories have rarely used in the practical speech recognition systems. Therefore, in this paper, a new feature extraction (FE) method is proposed based on parameters of vector AR (VAR) analysis over the speech trajectories. In this method, using filter and reflection matrices obtained from applying VAR analysis on static and dynamic information of the speech trajectory in the RPS, a high-dimensional feature vector can be achieved. Then, different transformation methods are utilized to attain final feature vectors with appropriate dimension. Results of discrete and continuous phoneme recognition over FARSDAT speech corpus show that the efficiency of the proposed FE method is better than other time-domain-based FE methods such as LPC and LPREF.
عنوان نشريه :
مهندسي پزشكي زيستي
عنوان نشريه :
مهندسي پزشكي زيستي
اطلاعات موجودي :
فصلنامه با شماره پیاپی 0 سال 1391
كلمات كليدي :
#تست#آزمون###امتحان