Simultaneously Trained NN-based Acoustic Model and NN-based Feature Extractor

Jan Zelinka; Jan Vaněk; Luděk Müller

Publikace

Všechny publikace

Detail publikace

Citace

Jan Zelinka and Jan Vaněk and Luděk Müller : Simultaneously Trained NN-based Acoustic Model and NN-based Feature Extractor . Text, Speech, and Dialogue, 18th International Conference, TSD 2015, p. 234-242, 2015.

Abstrakt

This paper demonstrates how standard feature extraction methods such as PLP can be successfully replaced by a neural network and methods such as mean normalization, variance normalization and delta coefficients can be simultaneously utilized in a neural-network-based acoustic model. Our experiments show that this replacement is significantly beneficial. Moreover, in our experiments, also a neural-networkbased voice activity detector was employed and trained simultaneously with a neural-network-based feature extraction and a neural-networkbased acoustic model. The system performance was evaluated on the British English speech corpus WSJCAM0.

Abstrakt v češtině

Tento článek popisuje, jak mohou být standardní metody extrakce příznakových vektorů, jako je např. PLP, mohou být nahrazeny neuronovou sítí, a jak mohou být standardní metody jako normalizace střední hodnoty, normalizace variance a výpočet delta koeficientů využity při současným trénování této neuronové sítě a neuronové sítě pro akustický model. Experimenty popsané v tomto článku ukazují, že toto nahrazení je přínosné pro přesnost rozpoznávání mluvené řeči. V těchto experimentech je nadto zkoumán přínos použití neuronové sítě pro VAD, přičemž je tato síť opět trénována zároveň s ostatními sítěmi. Experimenty byly provedeny na britské databázi WSJCAM0.

Detail publikace

Název:	Simultaneously Trained NN-based Acoustic Model and NN-based Feature Extractor
Autor:	Jan Zelinka ; Jan Vaněk ; Luděk Müller
Jazyk publikace:	česky
Rok vydání:	2015
Typ publikace:	Kapitola v knize
Název časopisu / knihy:	Text, Speech, and Dialogue, 18th International Conference, TSD 2015
Strana:	234 - 242
ISBN:	978-3-319-24032-9
ISSN:	0302-9743

/ 2019-11-18 12:55:41 /

BibTeX

@MISC{JanZelinka_2015_Simultaneously,
 author = {Jan Zelinka and Jan Van\v{e}k and Lud\v{e}k M\"{u}ller},
 title = {Simultaneously Trained NN-based Acoustic Model and NN-based Feature Extractor},
 year = {2015},
 journal = {Text, Speech, and Dialogue, 18th International Conference, TSD 2015},
 pages = {234-242},
 ISBN = { 978-3-319-24032-9},
 ISSN = {0302-9743},
 url = {http://www.kky.zcu.cz/en/publications/JanZelinka_2015_Simultaneously},
}

Pozice katedry v rámci univerzity

Oddělení katedry

Publikace

Detail publikace

Citace

Abstrakt

Abstrakt v češtině

Detail publikace

BibTeX