Publikace
Detail publikace
Citace
p. 555-563, Springer, 2017. : Neural Network Speaker Descriptor in Speaker Diarization of Telephone Speech . Speech and Computer 19th International Conference (SPECOM 2017),
PDF ke stažení
Abstrakt
In this paper, we have been investigating an approach to a speaker representation for a diarization system that clusters short telephone conversation segments (produced by the same speaker). The proposed approach applies a neural-network-based descriptor that replaces a usual i-vector descriptor in the state-of-the-art diarization systems. The comparison of these two techniques was done on the English part of the CallHome corpus. The final results indicate the superiority of the i-vector’s approach although our proposed descriptor brings an additive information. Thus, the combined descriptor represents a speaker in a segment for diarization purpose with lower diarization error (almost 20% relative improvement compared with only i-vector application).
Abstrakt v češtině
V tomto článku jsme vyšetřovali přítup k reprezentaci řečníka v úloze diarizace, pro shlukování podobných segmentů nahrávky. Navrhovaný přístup založený na neuronové síti (NN) nahrazuje přístuup i-vektorů z state-of-the-art diarizacního systému. Porovnání tšchto dvou technik bylo provedena na anglické části korpusu CallHome. Výsledky indikují nadřazenost metody založené na i-vektorech, ale kombinace obou přístupů vykazuje zlepšení v úspěšnosti diarizace, tedy systém založený na NN obsahuje dopˇmkovou informaci k i-vektorům.
Detail publikace
Název: | Neural Network Speaker Descriptor in Speaker Diarization of Telephone Speech |
---|---|
Autor: | Zbynek Zajic ; Jan Zelinka ; Ludek Muller |
Název - česky: | Neuronová síť pro popis řečníka v úloze diarizace telefonních hovorů |
Jazyk publikace: | anglicky |
Rok vydání: | 2017 |
Typ publikace: | Prezentace na kongresech a seminářích v zahraničí |
Název časopisu / knihy: | Speech and Computer 19th International Conference (SPECOM 2017) |
Strana: | 555 - 563 |
DOI: | 10.1007/978-3-319-66429-3_55 |
Nakladatel: | Springer |
Klíčová slova
Neural network, Speaker diarization, i-Vector
Klíčová slova v češtině
Neuronová síť, diarizace, i-vektor
BibTeX
@INPROCEEDINGS{ZbynekZajic_2017_NeuralNetwork, author = {Zbynek Zajic and Jan Zelinka and Ludek Muller}, title = {Neural Network Speaker Descriptor in Speaker Diarization of Telephone Speech}, year = {2017}, publisher = {Springer}, journal = {Speech and Computer 19th International Conference (SPECOM 2017)}, pages = {555-563}, doi = {10.1007/978-3-319-66429-3_55}, url = {http://www.kky.zcu.cz/en/publications/ZbynekZajic_2017_NeuralNetwork}, }