مرکز منطقه ای اطلاع رساني علوم و فناوري - Unsupervised Audio Segmentation using Extended Baum-Welch Transformations

DocumentCode :

463435

Title :

Unsupervised Audio Segmentation using Extended Baum-Welch Transformations

Author :

Sainath, Tara N. ; Kanevsky, Dimitri ; Iyengar, Garud

Author_Institution :

Comput. Sci. & Artificial Intelligence Lab., MIT, Cambridge, MA, USA

Volume :

fYear :

2007

fDate :

15-20 April 2007

Abstract :

Audio segmentation has applications in a variety of contexts, such as audio information retrieval, automatic sound analysis, and as a pre-processing step in speech recognition. Extended Baum-Welch (EBW) transformations are most commonly used as a discriminative technique for estimating parameters of Gaussian mixtures. In this paper, we derive an unsupervised audio segmentation approach using these transformations. We find that our algorithm outperforms both the Bayesian information criterion (BIC) and cumulative sum (CUSUM) segmentation methods. In particular, our EBW segmentation algorithm provides improvements over the baseline approaches in detecting landmarks of short duration and minimizing landmark oversegmentation. In addition, we show that the EBW approach provides faster computation compared to the baseline methods.

Keywords :

Bayes methods; Gaussian processes; audio signal processing; information retrieval; speech recognition; Bayesian information criterion; Gaussian mixtures; audio information retrieval; automatic sound analysis; cumulative sum segmentation methods; extended Baum-Welch transformations; landmark detection; landmark oversegmentation minimization; speech recognition; unsupervised audio segmentation; Acoustic measurements; Acoustic signal detection; Artificial intelligence; Computer science; Decoding; Laboratories; Music; Parameter estimation; Speech recognition; Streaming media; Acoustic signal detection; gradient methods; unsupervised learning;

fLanguage :

English

Publisher :

ieee

Conference_Titel :

Acoustics, Speech and Signal Processing, 2007. ICASSP 2007. IEEE International Conference on

Conference_Location :

Honolulu, HI

ISSN :

1520-6149

Print_ISBN :

1-4244-0727-3

Type :

conf

DOI :

10.1109/ICASSP.2007.366653

Filename :

4217053

Link To Document :

https://search.ricest.ac.ir/dl/search/defaultta.aspx?DTC=49&DC=463435