Publikace
Detail publikace
Citace
p. 2525-2528, ISCA, Bonn, 2005. : Symbolic prosody driven unit selection for highly natural synthetic speech . Interspeech 2005 — Eurospeech, proceedings of 9th European Conference on Speech Communication and Technology,
Abstrakt
In the effort to obtain synthetic speech with the quality near to natural, the unit selection approach has become very important. To increase the naturalness of our native TTS system ARTIC we employed the specific version of the approach. It is driven by the high-level symbolic prosody description, defined according to the phenomena of prosodic synonymy and homonymy. The concrete prosody of a synthesized phrase is not explicitly set here, but emerges on the basis of the target and concatenation costs. Although this is our first treatment requiring some simplification, and for the synonymy/homonymy phenomena only the basics are defined, the first results have already shown that there is a significant shift towards high quality. Listening tests comparing speech from single-instance version to selection-based version of ARTIC showed clear preference of the selection-based version. In addition, the level of naturalness was on average assessed as "close to natural".
Abstrakt v češtině
Přístup výběru jednotek se stal velice důležitým v úsilí dosáhnout syntetickou řeč kvalitou se blížící přirozené, a potenciálně být schopni vytvořit emotivní syntézu. Pro zvýšení přirozenosti našeho vlastního TTS systému ARTIC jsme přišli se speciální modifikací tohoto přístupu. V ní je výběr řízen symbolicky popsanou prozodií, definovanou na základě fenoménů prozodické synonymie a homonymie. Konkrétní prozodie syntetizované fráze není explicitně určena, ale "zjevuje"na podle požadavků cen cíle a řetězení. Ačkoli se jedná o první pokus o tuto metodiku a definovali jsme pouze základy fenoménů synonymie/homonymie, první výsledky již ukázaly významný posun směrem k vyšší kvalitě. Poslechové testy porovnávající kvalitu řeči generované TTS systémem ARTIC s výběrem jednotek a bez něj ukázaly jasnou preferenci verze s výběrem, úroveň přirozenosti byla navíc hodnocena v průměru jako "téměř přirozená".
Detail publikace
Název: | Symbolic prosody driven unit selection for highly natural synthetic speech |
---|---|
Autor: | Tihelka, D. |
Název - česky: | Metoda výběru jednotek řízená symbolicky popsanou prozodií k získání vysoce přirozené syntetické řeči |
Jazyk publikace: | anglicky |
Datum vydání: | 4.9.2005 |
Rok vydání: | 2005 |
Typ publikace: | Stať ve sborníku |
Název knihy: | Interspeech 2005 — Eurospeech, proceedings of 9th European Conference on Speech Communication and Technology |
Strana: | 2525 - 2528 |
Nakladatel: | ISCA |
Místo vydání: | Bonn |
Datum: | 4.9.2005 - 8.9.2005 |
Klíčová slova
unit selection, symbolic prosody, synthetic speech naturalness, prosodic synonymy, prosodic homonymy
Klíčová slova v češtině
dynamický výběr jednotek, symbolicky popsaná prozodie, přirozenost syntetické řeči, prozodická synonymie, prozodická homonymie
BibTeX
@INPROCEEDINGS{TihelkaD_2005_Symbolicprosody, author = {Tihelka, D.}, title = {Symbolic prosody driven unit selection for highly natural synthetic speech}, year = {2005}, publisher = {ISCA}, address = {Bonn}, pages = {2525-2528}, booktitle = {Interspeech 2005 -- Eurospeech, proceedings of 9th European Conference on Speech Communication and Technology}, url = {http://www.kky.zcu.cz/en/publications/TihelkaD_2005_Symbolicprosody}, }