Publikace
Detail publikace
Citace
p. 135-139, Institute of Radio Engineering and Electronics AS CR, Prague, 2004. : Speech synthesis in ARTIC TTS system . Speech Processing, proceedings of the 14th Czech-German Workshop,
Abstrakt
ARTIC is a corpus-based system that employs a carefully designed large speech corpus collected from a single speaker. Statistical approach is applied to create an acoustic unit inventory in a fully automatic way. Several improvements have been accomplished to increase the intelligibility of the resulting speech. Two approaches to the generation of prosodic features were proposed. The rule-based approach applies a set of linguistically motivated rules derived from phonetic research and description of the suprasegmental speech phenomena. The data-driven approach employs a prosodic model, which parameters are set up automatically using real speech data from a corpus. To produce as smooth synthetic speech as possible, a on-line unit candidate selection was experimented with as well. Speech is produced using an OLA method. Some experiments were also made with an harmonic/noise-based speech production method. Nowadays, Slovak and German language modules are implemented besides two Czech voices.
Abstrakt v češtině
ARTIC je korpusově orientovaný systém využívající pečlivě připravený rozsáhlý řečový korpus nahraný jedním řečníkem. Inventář akustických jednotek se vytváří zcela automaticky pomocí statistického přístupu. Bylo dosaženo několika vylepšení, vedoucích ke zvýšení srozumitelnosti výsledné řeči. Dále byly navrženy 2 přístupy ke generování prozodických charakteristik řeči. Pravidlově založený přístup využívá lingvisticky motivovaná pravidla odvozená na základě fonetického výzkumu a popisu suprasegmentálních vlastností řeči. Datově řízený přístup využívá prozodický model, jehož parametry se nastavují automaticky z reálných řečových dat uložených v korpusu. Byly též provedeny experimenty s on-line výběrem jednotek (za účelem vytvoření co nejplynuleší syntetické řeči). Řeč se vytváří pomocí metody OLA. Experimentovali jsme též s harmonickým/šumovým modelem vytváření řeči. V současné době ARTIC obsahuje 2 české hlasy a také moduly německého a slovenského jazyka.
Detail publikace
Název: | Speech synthesis in ARTIC TTS system |
---|---|
Autor: | Matoušek, J. ; Romportl, J. ; Tihelka, D. |
Název - česky: | Syntéza řeči v TTS systému ARTIC |
Jazyk publikace: | anglicky |
Datum vydání: | 13.9.2004 |
Rok vydání: | 2004 |
Typ publikace: | Stať ve sborníku |
Název knihy: | Speech Processing, proceedings of the 14th Czech-German Workshop |
Strana: | 135 - 139 |
ISBN: | 80-86269-11-6 |
Nakladatel: | Institute of Radio Engineering and Electronics AS CR |
Místo vydání: | Prague |
Datum: | 13.9.2004 - 15.9.2004 |
Klíčová slova
TTS ARTIC, glottal stop modelling, model-level clustering, automatic segmentation refinements, rule-based prosody generator, data-driven prosody generator, unit selection, harmonic/noise-based method, new languages
Klíčová slova v češtině
TTS ARTIC, modelování rázu, shlukování na úrovni modelů, zdokonalení automatické segmentace, pravidlový generátor prozodie, datový generátor prozodie, výběr jednotek, harmonická metoda, nové jazyky
BibTeX
@INPROCEEDINGS{MatousekJ_2004_Speechsynthesisin, author = {Matou\v{s}ek, J. and Romportl, J. and Tihelka, D.}, title = {Speech synthesis in ARTIC TTS system}, year = {2004}, publisher = {Institute of Radio Engineering and Electronics AS CR}, address = {Prague}, pages = {135-139}, booktitle = {Speech Processing, proceedings of the 14th Czech-German Workshop}, ISBN = {80-86269-11-6}, url = {http://www.kky.zcu.cz/en/publications/MatousekJ_2004_Speechsynthesisin}, }