مرکز منطقه ای اطلاع رساني علوم و فناوري - Data-Driven and Feedback Based Spectro-Temporal Features for Speech Recognition

DocumentCode :

1335081

Title :

Data-Driven and Feedback Based Spectro-Temporal Features for Speech Recognition

Author :

Sivaram, G.S.V.S. ; Nemala, Sridhar Krishna ; Mesgarani, Nima ; Hermansky, Hynek

Author_Institution :

ECE Dept., Johns Hopkins Univ., Baltimore, MD, USA

Volume :

Issue :

fYear :

2010

Firstpage :

957

Lastpage :

960

Abstract :

This paper proposes novel data-driven and feedback based discriminative spectro-temporal filters for feature extraction in automatic speech recognition (ASR). Initially a first set of spectro-temporal filters are designed to separate each phoneme from the rest of the phonemes. A hybrid Hidden Markov Model/Multilayer Perceptron (HMM/MLP) phoneme recognition system is trained on the features derived using these filters. As a feedback to the feature extraction stage, top confusions of this system are identified, and a second set of filters are designed specifically to address these confusions. Phoneme recognition experiments on TIMIT show that the features derived from the combined set of discriminative filters outperform conventional speech recognition features, and also contain significant complementary information.

Keywords :

feature extraction; filtering theory; hidden Markov models; multilayer perceptrons; speech recognition; automatic speech recognition; discriminative filters; feature extraction; feedback based spectro-temporal features; hidden Markov model; multilayer perceptron; spectro-temporal filters; Acoustics; Context; Feature extraction; Hidden Markov models; Speech; Speech processing; Speech recognition; Confusion analysis; discriminative filters; spectro-temporal features; speech recognition;

fLanguage :

English

Journal_Title :

Signal Processing Letters, IEEE

Publisher :

ieee

ISSN :

1070-9908

Type :

jour

DOI :

10.1109/LSP.2010.2079930

Filename :

5585716

Link To Document :

https://search.ricest.ac.ir/dl/search/defaultta.aspx?DTC=49&DC=1335081