Publikace
Detail publikace
Citace
p. 288-299, Springer, 2015. : Neural-Network-based Spectrum Processing for Speech Recognition and Speaker Verification . Statistical Language and Speech Processing, Third International Conference, SLSP 2015,
Abstrakt
In this paper, neural networks are applied as a feature extractors for a speech recognition system and a speaker verification system. A long-temporal features with delta coefficients, mean and variance normalization are applied when a neural-network-based feature extraction is trained together with a neural-network-based voice activity detector and with a neural-network-based acoustic model for speech recognition. In speaker verification, the acoustic model is replaced with a score computation. The performance of our speech recognition system was evaluated on the British English speech corpus WSJCAM0 and the performance of our speech verification system was evaluated on our Czech speech corpus.
Abstrakt v češtině
V tomto článku je popsána aplikace neuronové sítě jako extraktoru vektoru příznaků pro rozpoznávání mluvené řeči a pro verifikaci řečníka. Dlouhodobé příznaky s delta koeficienty, normalizací střední hodnoty a variance jsou použity při současném trénování vah neuronové sítě pro extrakci příznaků a neuronové sítě pro akustický model pro rozpoznávání mluvené řeči. V případě verifikace řečníka je akustický model nahrazen výpočtem skóre shody. Prezentované metody pro rozpoznávání mluvené řeči byly ověřeny na anglickém korpusu WSJCAM0 a metody pro verifikaci řečníka na korpusu českém.
Detail publikace
Název: | Neural-Network-based Spectrum Processing for Speech Recognition and Speaker Verification |
---|---|
Autor: | Jan Zelinka ; Jan Vaněk ; Luděk Müller |
Jazyk publikace: | anglicky |
Rok vydání: | 2015 |
Typ publikace: | Stať ve sborníku |
Název časopisu / knihy: | Statistical Language and Speech Processing, Third International Conference, SLSP 2015 |
Strana: | 288 - 299 |
ISBN: | 978-3-319-25788-4 |
ISSN: | 0302-9743 |
Nakladatel: | Springer |
BibTeX
@MISC{JanZelinka_2015_Neural-Network-based, author = {Jan Zelinka and Jan Van\v{e}k and Lud\v{e}k M\"{u}ller}, title = {Neural-Network-based Spectrum Processing for Speech Recognition and Speaker Verification}, year = {2015}, publisher = {Springer}, journal = {Statistical Language and Speech Processing, Third International Conference, SLSP 2015}, pages = {288-299}, ISBN = {978-3-319-25788-4}, ISSN = {0302-9743}, url = {http://www.kky.zcu.cz/en/publications/JanZelinka_2015_Neural-Network-based}, }