Přejít na obsah

Detail publikace

Citace

Marek Hrúz and Marie Kunešová : Convolutional Neural Network in the Task of Speaker Change Detection . Speech and Computer, 18th International Conference, SPECOM 2016, Lecture Notes in Computer Science, vol. 9811, p. 191-198, Springer, 2016.

Abstrakt

This paper presents an approach to detect speaker changes in telephone conversations. The speaker change problem is presented as a classification problem. We use a Convolutional Neural Network to analyze short audio segments. The Network plays a role of a regressor. It outputs higher values for segments that are more likely to contain a speaker change. Upon thresholding the regressed value the decision about the segment is made. The experiment shows that the Convolutional Neural Network outperforms a baseline system based on the Bayesian Information Criterion. It behaves very well on previously unseen data produced by previously unheard speakers.

Abstrakt v češtině

Článek představuje přístup k detekci změny řečníka v telefónních koverzacích. Problém detekce řečníka je představen jako klasifikační problém. Používáme konvoluční neuronovou síť k analýze krátkých řečových segmentů. Síť je použita jako regresor. Její výstup popisuje věrohodnost změny řečníka pro daný segment. Použitím prahování je provedeno rozhodnutí o daném segmentu. Experimenty ukazují, že konvoluční neronová síť dosahuje lepších výsledků než referenční systém založen na Bayesově informačním kritériu. Síť velice dobře reaguje na něviděná data produkována dosud neslyšenými řečníky.

Detail publikace

Název: Convolutional Neural Network in the Task of Speaker Change Detection
Autor: Marek Hrúz ; Marie Kunešová
Název - česky: Konvoluční neuroová síť v úloze detekce změny řečníka
Jazyk publikace: anglicky
Datum vydání: 1.8.2016
Rok vydání: 2016
Typ publikace: Stať ve sborníku
Název časopisu / knihy: Speech and Computer, 18th International Conference, SPECOM 2016
Svazek: Lecture Notes in Computer Science
Číslo vydání: 9811
Strana: 191 - 198
DOI: 10.1007/978-3-319-43958-7_22
ISBN: 978-3-319-43957-0
Nakladatel: Springer
/ 2017-09-21 14:03:26 /

Klíčová slova

Convolutional neural network, Speaker change detection, Spectrogram

Klíčová slova v češtině

konvoluční neuronová siť, detekce změny řečníka, spektrogram

BibTeX

@INPROCEEDINGS{MarekHruz_2016_ConvolutionalNeural,
 author = {Marek Hr\'{u}z and Marie Kune\v{s}ov\'{a}},
 title = {Convolutional Neural Network in the Task of Speaker Change Detection},
 year = {2016},
 publisher = {Springer},
 journal = {Speech and Computer, 18th International Conference, SPECOM 2016},
 volume = {9811},
 pages = {191-198},
 series = {Lecture Notes in Computer Science},
 ISBN = {978-3-319-43957-0},
 doi = {10.1007/978-3-319-43958-7_22},
 url = {http://www.kky.zcu.cz/en/publications/MarekHruz_2016_ConvolutionalNeural},
}