مرکز منطقه ای اطلاع رساني علوم و فناوري - Class-based speech recognition using a maximum dissimilarity criterion and a tolerance classification margin

DocumentCode :

591894

Title :

Class-based speech recognition using a maximum dissimilarity criterion and a tolerance classification margin

Author :

Gorin, Arseniy ; Jouvet, Denis

Author_Institution :

Inria, Villers-lès-Nancy, France

fYear :

2012

fDate :

2-5 Dec. 2012

Firstpage :

Lastpage :

Abstract :

One of the difficult problems of Automatic Speech Recognition (ASR) is dealing with the acoustic signal variability. Much state-of-the-art research has demonstrated that splitting data into classes and using a model specific to each class provides better results. However, when the dataset is not large enough and the number of classes increases, there is less data for adapting the class models and the performance degrades. This work extends and combines previous research on un-supervised splits of datasets to build maximally separated classes and the introduction of a tolerance classification margin for a better training of the class model parameters. Experiments, carried out on the French radio broadcast ESTER2 data, show an improvement in recognition results compared to the ones obtained previously. Finally, we demonstrate that combining the decoding results from different class models leads to even more significant improvements.

Keywords :

acoustic signal processing; speech recognition; ASR; French radio broadcast ESTER2 data; acoustic signal variability; automatic speech recognition; class-based speech recognition; maximum dissimilarity criterion; tolerance classification margin; Acoustics; Adaptation models; Data models; Hidden Markov models; Speech; Speech recognition; Training; acoustic modeling; classification tolerance margin; clustering; maximally separated classes; speech recognition;

fLanguage :

English

Publisher :

ieee

Conference_Titel :

Spoken Language Technology Workshop (SLT), 2012 IEEE

Conference_Location :

Miami, FL

Print_ISBN :

978-1-4673-5125-6

Electronic_ISBN :

978-1-4673-5124-9

Type :

conf

DOI :

10.1109/SLT.2012.6424203

Filename :

6424203

Link To Document :

https://search.ricest.ac.ir/dl/search/defaultta.aspx?DTC=49&DC=591894