Přejít na obsah

Detail publikace

Citace

Zbyněk Zajíc and Jan Zelinka and Jan Vaněk and Luděk Müller : Convolutional Neural Network for Refinement of Speaker Adaptation Transformation . 16th International Conference on Speech and Computer, SPECOM 2014, Lecture Notes in Artificial Intelligence, vol. 8773, p. 161-168, 2014.

Abstrakt

The aim of this work is to propose a refinement of the shift-MLLR (shift Maximum Likelihood Linear Regression) adaptation of an acoustics model in the case of limited amount of adaptation data, which can lead to ill-conditioned transformations matrices. We try to suppress the influence of badly estimated transformation parameters utilizing the Artificial Neural Network (ANN), especially Convolutional Neural Network (CNN) with bottleneck layer on the end. The badly estimated shift-MLLR transformation is propagated through an ANN (suitably trained beforehand), and the output of the net is used as the new refined transformation. To train the ANN the well and the badly conditioned shift-MLLR transformations are used as outputs and inputs of ANN, respectively. Anglická klíčová slova: ASR, Adaptation, shift-MLLR, ANN, CNN, bottleneck

Abstrakt v češtině

Cílem tohoto článku je navrhnout zlepšenou shift-MLLR (shift Maximum Likelihood Linear Regression) adaptační matici akustického modelu v případě malého počtu adaptačních dat. Snažíme se potlačit vliv spatně odhadnutých parametrů transformace pomocí konvoluční neuronové sítě (CNN). Špatně odhadnutá transformace je propagací sítí zpřesněna aby nezhoršovala adaptační proces.

Detail publikace

Název: Convolutional Neural Network for Refinement of Speaker Adaptation Transformation
Autor: Zbyněk Zajíc ; Jan Zelinka ; Jan Vaněk ; Luděk Müller
Název - česky: Konvoluční neuronová síť pro zpřesnění adaptace na řečníka
Jazyk publikace: anglicky
Datum vydání: 1.10.2014
Rok vydání: 2014
Typ publikace: Stať ve sborníku
Název časopisu / knihy: 16th International Conference on Speech and Computer, SPECOM 2014
Svazek: Lecture Notes in Artificial Intelligence
Číslo vydání: 8773
Strana: 161 - 168
DOI: 10.1007/978-3-319-11581-8_20
ISBN: 0302-9743
ISSN: 978-3-319-11580-1
Datum: 5.10.2014 - 9.10.2014
/ 2014-11-12 16:24:46 /

Klíčová slova

ASR, Adaptation, shift-MLLR, ANN, CNN, bottleneck

Klíčová slova v češtině

ASR, adaptace, shift-MLLR, ANN, CNN, bottleneck

BibTeX

@INPROCEEDINGS{ZbynekZajic_2014_ConvolutionalNeural,
 author = {Zbyn\v{e}k Zaj\'{i}c and Jan Zelinka and Jan Van\v{e}k and Lud\v{e}k M\"{u}ller},
 title = {Convolutional Neural Network for Refinement of Speaker Adaptation Transformation},
 year = {2014},
 journal = {16th International Conference on Speech and Computer, SPECOM 2014},
 volume = {8773},
 pages = {161-168},
 series = {Lecture Notes in Artificial Intelligence},
 ISBN = {0302-9743},
 ISSN = {978-3-319-11580-1},
 doi = {10.1007/978-3-319-11581-8_20},
 url = {http://www.kky.zcu.cz/en/publications/ZbynekZajic_2014_ConvolutionalNeural},
}