Publikace
Detail publikace
Citace
p. 225-233, Springer, 2015. : Ideas for Clustering of Similar Models of a Speaker in an Online Speaker Diarization System . Text, Speech and Dialogue, Proceedings of the 18th International Conference TSD 2015, Lecture Notes in Computer Science, vol. 9302,
Abstrakt
During online speaker diarization, a situation may occur where a single speaker is being represented by several different models. Such situation leads to worsened diarization results, because the diarization system considers every change of a model to be a change of speakers. In the article we describe a method for detecting this situation and propose several ways of solving it. Experiments show that the most suitable option is treating multiple GMMs as belonging to a single speaker, i.e. updating all of them with the same data every time one of them is assigned a new segment. In that case, there was a relative improvement in Diarization Error Rate of 30.69% in comparison with the baseline system.
Abstrakt v češtině
Během online diarizace mluvčích může nastat situace, kdy jediný řečník je reprezentován několika odlišnými modely. Takováto situace vede ke zhoršeným výsledkům, jelikož systém pro diarizaci považuje každou změnu modelů za změnu řečníka. Ve článku popisujeme metodu pro detekci takové situace a navrhujeme několik způsobů, jak ji řešit. Experimenty ukazují, že nejvhodnější možností je přistupovat k několika GMM jako k jedinému řečníkovi, tzn. aktualizovat je pomocí stejných dat pokaždé, když jednomu z nich je přiřazen nový segment. V takovém případě došlo k relativnímu zlepšení chyby diarizace (Diarization Error Rate) o 30.69% oproti základnímu systému.
Detail publikace
Název: | Ideas for Clustering of Similar Models of a Speaker in an Online Speaker Diarization System |
---|---|
Autor: | Marie Kunešová ; Vlasta Radová |
Název - česky: | Nápady pro shlukování podobných modelů v online systému pro diarizaci mluvčích |
Jazyk publikace: | anglicky |
Datum vydání: | 1.9.2015 |
Rok vydání: | 2015 |
Typ publikace: | Stať ve sborníku |
Název časopisu / knihy: | Text, Speech and Dialogue, Proceedings of the 18th International Conference TSD 2015 |
Svazek: | Lecture Notes in Computer Science |
Číslo vydání: | 9302 |
Strana: | 225 - 233 |
DOI: | 10.1007/978-3-319-24033-6_26 |
ISBN: | 978-3-319-24032-9 |
Nakladatel: | Springer |
Klíčová slova
speaker clustering, speaker diarization, speaker segmentation
Klíčová slova v češtině
shlukování řečníků, diarizace řečníků, segmentace řečníků
BibTeX
@INPROCEEDINGS{MarieKunesova_2015_IdeasforClustering, author = {Marie Kune\v{s}ov\'{a} and Vlasta Radov\'{a}}, title = {Ideas for Clustering of Similar Models of a Speaker in an Online Speaker Diarization System }, year = {2015}, publisher = {Springer}, journal = {Text, Speech and Dialogue, Proceedings of the 18th International Conference TSD 2015}, volume = {9302}, pages = {225-233}, series = {Lecture Notes in Computer Science}, ISBN = {978-3-319-24032-9}, doi = {10.1007/978-3-319-24033-6_26}, url = {http://www.kky.zcu.cz/en/publications/MarieKunesova_2015_IdeasforClustering}, }