مرکز منطقه ای اطلاع رساني علوم و فناوري - Discriminatively Trained Context-Dependent Duration-Bigram Models for Korean Digit Recognition

DocumentCode :

454519

Title :

Discriminatively Trained Context-Dependent Duration-Bigram Models for Korean Digit Recognition

Author :

Willett, Daniel ; Gerl, Franz ; Brueckner, Raymond

Author_Institution :

Speech Dialog Syst., Harman/Becker Automotive Syst., Ulm

Volume :

fYear :

2006

fDate :

14-19 May 2006

Abstract :

The recognition of continuously spoken Korean digits is well known to be a particularly challenging task among small vocabulary recognition problems. In this paper, we review and evaluate our acoustic modeling efforts for the purpose of efficient high-accuracy recognition of Korean digit strings for in-car applications. The measures comprise context-dependent word models, duration-dependent distribution functions, error-weighted discriminative training as well as a compressed bigram model that strongly constrains the HMM state durations. Finally, an average word error rate across multiple channel and noise conditions of below 3% is achieved, which is a relative reduction of 62% over the error observed with traditional context-independent digit modeling techniques and about 36% relative error reduction compared to ML-trained context-dependent digit models of ordinary linear topology. Fast unsupervised model adaptation during decoding yields additional 10% of relative improvement

Keywords :

acoustics; decoding; hidden Markov models; speech coding; speech recognition; HMM state durations; acoustic modeling; average word error rate; context-dependent word models; context-independent digit modeling techniques; continuously spoken Korean digit recognition; decoding; discriminatively trained context-dependent duration-bigram models; duration-dependent distribution functions; error-weighted discriminative training; fast unsupervised model adaptation; hidden Markov models; in-car applications; relative error reduction; small vocabulary recognition problems; Acoustic applications; Acoustic measurements; Adaptation model; Context modeling; Distribution functions; Error analysis; Hidden Markov models; Noise reduction; Topology; Vocabulary;

fLanguage :

English

Publisher :

ieee

Conference_Titel :

Acoustics, Speech and Signal Processing, 2006. ICASSP 2006 Proceedings. 2006 IEEE International Conference on

Conference_Location :

Toulouse

ISSN :

1520-6149

Print_ISBN :

1-4244-0469-X

Type :

conf

DOI :

10.1109/ICASSP.2006.1659948

Filename :

1659948

Link To Document :

https://search.ricest.ac.ir/dl/search/defaultta.aspx?DTC=49&DC=454519