Přejít na obsah

Detail publikace

Citace

Matoušek, J. and Hanzlíček, Z. and Tihelka, D. : Hybrid syllable/triphone speech synthesis . Interspeech 2005 — Eurospeech, proceedings of 9th European Conference on Speech Communication and Technology, p. 2529-2532, Lisbon, Portugal, 2005.

PDF ke stažení

PDF

Abstrakt

In this paper, the syllable, an alternative phonetic unit to the phone, is researched in the context of speech synthesis. Several approaches to syllable modelling within the statistical approach (using hidden Markov models) to the acoustic unit inventory creation are proposed and evaluated. To be able to synthesize an arbitrary text, the syllable inventories were supplemented with triphones resulting in hybrid syllable/triphone inventories. Listening tests were accomplished both to assess the quality of the resulting synthetic speech produced using the hybrid syllable/triphone inventories and to choose the best approach to syllable modelling. The resulting synthetic speech is highly intelligible and fluent. Although the synthetic speech generated using the baseline triphone inventory was assessed slightly better, the results of the very first experiments with syllable modelling are very promising.

Abstrakt v češtině

V článku jsou zkoumány možnosti využití slabiky, alternativní fonetické jednotky k hlásce, v úloze syntézy řeči. Je zde navrženo a vyhodnoceno několik přístupů k modelování slabik v rámci statistického přístupu (s využitím skrytých Markovových modelů) k vytvoření inventáře akustických jednotek. Aby bylo možné syntetizovat libovolný text, byly slabičné inventáře doplněny o trifóny, což vedlo ke vzniku hybridních slabičných a trifónových inventářů. K hodnocení kvality výsledné syntetické řeči a ke zvolení nejlepšího přístupu k modelování slabik byly provedeny poslechové testy. Výsledná syntetická řeč je vysoce srozumitelná a plynulá. Ačkoliv syntetická řeč vytvářená na základě původního trifónového inventáře byla hodnocena o něco lépe, výsledky prvních experimentů s použitím slabik jsou velmi nadějné.

Detail publikace

Název: Hybrid syllable/triphone speech synthesis
Autor: Matoušek, J. ; Hanzlíček, Z. ; Tihelka, D.
Název - česky: Hybridní syntéza řeči s využitím slabik a trifónů
Jazyk publikace: anglicky
Datum vydání: 4.9.2005
Rok vydání: 2005
Typ publikace: Stať ve sborníku
Název knihy: Interspeech 2005 — Eurospeech, proceedings of 9th European Conference on Speech Communication and Technology
Strana: 2529 - 2532
ISSN: 1018-4074
Místo vydání: Lisbon, Portugal
Datum: 4.9.2005 - 8.9.2005
/ 2008-07-22 13:34:33 /

Klíčová slova

text-to-speech, automatic acoustic unit inventory creation, syllable, triphone, syllable modelling, speech synthesis

Klíčová slova v češtině

syntéza řeči z textu, automatické vytváření inventáře akustických jednotek, slabika, trifón, modelování slabik

BibTeX

@INPROCEEDINGS{MatousekJ_2005_Hybrid,
 author = {Matou\v{s}ek, J. and Hanzl\'{i}\v{c}ek, Z. and Tihelka, D.},
 title = {Hybrid syllable/triphone speech synthesis},
 year = {2005},
 address = {Lisbon, Portugal},
 pages = {2529-2532},
 booktitle = {Interspeech 2005 -- Eurospeech, proceedings of 9th European Conference on Speech Communication and Technology},
 ISSN = {1018-4074},
 url = {http://www.kky.zcu.cz/en/publications/MatousekJ_2005_Hybrid},
}