Publikace
Detail publikace
Citace
p. 267-272, IEEE, 345 E 47TH ST, NEW YORK, NY 10017, USA, 2011. : Acoustic Analysis of Czech Expressive Recordings from a Single Speaker in Terms of Various Communicative Functions . Proceedings of the 11thIEEE International Symposium on Signal Processing and Information Technology,
PDF ke stažení
Abstrakt
This paper presents an extensive acoustic analysis of utterances which were recorded by a single Czech female speaker using various expressive speaking styles. The recording of the expressive utterances was performed as a dialogue between a human and a computer on a given topic. Speech of the human speaker was captured and later carefully transcribed by human annotators. It was also annotated using a listening test. The aim of the annotations was to label each utterance with a corresponding speaking style (referred to as a communicative function). Based on such a labeling, the expressive recordings were classified into various groups and acoustically analyzed. In particular, we placed emphasis on some features which are supposed to influence the perception of speech, such as F0, phoneme duration, formant frequencies or energy. We made an effort to reveal some acoustic differences between the various speaking styles that could help us to improve expressive speech synthesis in a given limited domain.
Abstrakt v češtině
Tato práce popisuje rozsáhlou akustickou analýzu řečových nahrávek, které byly namluveny jednou českou ženskou mluvčí s využitím různých expresivních řečnických stylů. Nahrávání expresivně zabarvených textů bylo provedeno formou dialogu mezi člověkem a počítačem na dané téma. Řeč člověka (mluvčího) byla nahrána a později pečlivě ručně přepsána. Řečové nahrávky také byly anotovány pomocí poslechového testu. Cílem těchto anotací bylo přiřadit každé promluvě odpovídající řečnický styl (tzv. komunikační funkci). Na základě takového označení byly expresivní nahrávky rozděleny do různých skupin a akusticky analyzovány. Zejména jsme kladli důraz na některé rysy, které mají vliv na vnímání řeči, jako F0, doba trvání fonémů, formantové frekvence a RMS energie. Snažili jsme se odhalit některé akustické rozdíly mezi jednotlivými řečnickými styly, které by nám mohly pomoci vylepšit expresivní syntézu řeči v dané omezené oblasti.
Detail publikace
Název: | Acoustic Analysis of Czech Expressive Recordings from a Single Speaker in Terms of Various Communicative Functions |
---|---|
Autor: | Grůber, M. |
Název - česky: | Akustická analýza českých expresivních nahrávek jednoho řečníka z pohledu různých komunikačních funkcí |
Jazyk publikace: | anglicky |
Datum vydání: | 14.12.2011 |
Rok vydání: | 2011 |
Typ publikace: | Stať ve sborníku |
Název časopisu / knihy: | Proceedings of the 11thIEEE International Symposium on Signal Processing and Information Technology |
Strana: | 267 - 272 |
DOI: | 10.1109/ISSPIT.2011.6151576 |
ISBN: | 978-1-4673-0753-6 |
Nakladatel: | IEEE |
Místo vydání: | 345 E 47TH ST, NEW YORK, NY 10017, USA |
Datum: | 14.12.2011 - 17.12.2011 |
Klíčová slova
acoustic analysis, expressive speech, speech synthesis, communication function
Klíčová slova v češtině
akustická analýza, expresivní řeč, syntéza řeči, komunikační funkce
BibTeX
@INPROCEEDINGS{GruberM_2011_AcousticAnalysisof, author = {Gr\r{u}ber, M.}, title = {Acoustic Analysis of Czech Expressive Recordings from a Single Speaker in Terms of Various Communicative Functions}, year = {2011}, publisher = {IEEE}, journal = {Proceedings of the 11thIEEE International Symposium on Signal Processing and Information Technology}, address = {345 E 47TH ST, NEW YORK, NY 10017, USA}, pages = {267-272}, ISBN = {978-1-4673-0753-6}, doi = {10.1109/ISSPIT.2011.6151576}, url = {http://www.kky.zcu.cz/en/publications/GruberM_2011_AcousticAnalysisof}, }