Publikace
Detail publikace
Citace
p. 191-198, Springer, 2016. : Convolutional Neural Network in the Task of Speaker Change Detection . Speech and Computer, 18th International Conference, SPECOM 2016, Lecture Notes in Computer Science, vol. 9811,
Abstrakt
This paper presents an approach to detect speaker changes in telephone conversations. The speaker change problem is presented as a classification problem. We use a Convolutional Neural Network to analyze short audio segments. The Network plays a role of a regressor. It outputs higher values for segments that are more likely to contain a speaker change. Upon thresholding the regressed value the decision about the segment is made. The experiment shows that the Convolutional Neural Network outperforms a baseline system based on the Bayesian Information Criterion. It behaves very well on previously unseen data produced by previously unheard speakers.
Abstrakt v češtině
Článek představuje přístup k detekci změny řečníka v telefónních koverzacích. Problém detekce řečníka je představen jako klasifikační problém. Používáme konvoluční neuronovou síť k analýze krátkých řečových segmentů. Síť je použita jako regresor. Její výstup popisuje věrohodnost změny řečníka pro daný segment. Použitím prahování je provedeno rozhodnutí o daném segmentu. Experimenty ukazují, že konvoluční neronová síť dosahuje lepších výsledků než referenční systém založen na Bayesově informačním kritériu. Síť velice dobře reaguje na něviděná data produkována dosud neslyšenými řečníky.
Detail publikace
Název: | Convolutional Neural Network in the Task of Speaker Change Detection |
---|---|
Autor: | Marek Hrúz ; Marie Kunešová |
Název - česky: | Konvoluční neuroová síť v úloze detekce změny řečníka |
Jazyk publikace: | anglicky |
Datum vydání: | 1.8.2016 |
Rok vydání: | 2016 |
Typ publikace: | Stať ve sborníku |
Název časopisu / knihy: | Speech and Computer, 18th International Conference, SPECOM 2016 |
Svazek: | Lecture Notes in Computer Science |
Číslo vydání: | 9811 |
Strana: | 191 - 198 |
DOI: | 10.1007/978-3-319-43958-7_22 |
ISBN: | 978-3-319-43957-0 |
Nakladatel: | Springer |
Klíčová slova
Convolutional neural network, Speaker change detection, Spectrogram
Klíčová slova v češtině
konvoluční neuronová siť, detekce změny řečníka, spektrogram
BibTeX
@INPROCEEDINGS{MarekHruz_2016_ConvolutionalNeural, author = {Marek Hr\'{u}z and Marie Kune\v{s}ov\'{a}}, title = {Convolutional Neural Network in the Task of Speaker Change Detection}, year = {2016}, publisher = {Springer}, journal = {Speech and Computer, 18th International Conference, SPECOM 2016}, volume = {9811}, pages = {191-198}, series = {Lecture Notes in Computer Science}, ISBN = {978-3-319-43957-0}, doi = {10.1007/978-3-319-43958-7_22}, url = {http://www.kky.zcu.cz/en/publications/MarekHruz_2016_ConvolutionalNeural}, }