Přejít na obsah

Detail publikace

Citace

Hanzlíček, Z. and Matoušek, J. and Tihelka, D. : On modelling syllables in text-to-speech synthesis . Studientexte zur Sprachkommunikation, Studientexte zur Sprachkommunikation, 36, p. 438-445, Technisches Universität, Dresden, 2005.

Abstrakt

In this paper, an attempt to use syllables as alternative acoustic units to phones in text-to-speech tasks is presented. We proposed, examined and evaluated several options of syllable modelling within the scope of the statistical approach (using HMMs) to the acoustic unit inventory creation. To be able to synthesize an arbitrary text, the inventory has to be extended with triphones, resulting in a hybrid syllable/triphone inventory. First, we did not reflect the phonetic contexts of the syllables, because we supposed that the most of co-articulation is included inside syllables. Next, we also tried to model the context-dependent syllables. However, it is not viable to take each individual phone as a context. Therefore, each context was formed by a group of acoustically similar phones. Several listening tests were performed to rate the quality of the resulting synthetic speech.

Abstrakt v češtině

V tomto článku ukazujeme možnosti využití slabik jako alternativních akustických jednotek k fonémům v úloze syntézy řeči z textu. Navrhujeme, realizujeme a vyhodnocujeme několik možností modelování slabik v rámci statistického přístupu k vytváření inventáře řečových jednotek (s využitím HMM). Abychom bylo možné syntetizovat libovolný text, inventář musel být rozšířen o trifóny; výsledkem je hybridní slabiko-trifónový inventář. Nejprve jsme uvažovali slabiky jako kontextově nezávislé, vycházeje z předpokladu, že nejsilnější koartikulace je uzavřena právě uvnitř slabiky. Dále jsme zkusili modelovat slabiky včetně kontextu, jelikož ale není možné brát jednotlivé fonémy jako zvláštní kontext, definovali jsme slabikový kontext skupinami akusticky podobných fonémů. K posouzení kvality výsledné syntetické řeči jsme provedli několik poslechových testů.

Detail publikace

Název: On modelling syllables in text-to-speech synthesis
Autor: Hanzlíček, Z. ; Matoušek, J. ; Tihelka, D.
Název - česky: Modelování slabik v syntéze řeči z textu
Jazyk publikace: anglicky
Datum vydání: 26.9.2005
Rok vydání: 2005
Typ publikace: Článek z časopisu
Název časopisu / knihy: Studientexte zur Sprachkommunikation
Edice: Studientexte zur Sprachkommunikation
Svazek: 36
Strana: 438 - 445
ISBN: 0940-6832
ISSN: 0940-6832
Nakladatel: Technisches Universität
Místo vydání: Dresden
Datum: 26.9.2005 - 28.9.2005
/ 2013-01-25 11:10:38 /

Klíčová slova

syllables, syllabification, text-to-speech, speech synthesis, HMM, hybrid AUI, artificial intelligence

Klíčová slova v češtině

slabika, slabikování, text-to-speech, syntéza řeči, HMM, hybridní AUI, umělá inteligence

BibTeX

@ARTICLE{HanzlicekZ_2005_Onmodelling,
 author = {Hanzl\'{i}\v{c}ek, Z. and Matou\v{s}ek, J. and Tihelka, D.},
 title = {On modelling syllables in text-to-speech synthesis},
 year = {2005},
 publisher = {Technisches Universit?t},
 journal = {Studientexte zur Sprachkommunikation},
 address = {Dresden},
 pages = {438-445},
 series = {36},
 ISBN = {0940-6832},
 ISSN = {0940-6832},
 url = {http://www.kky.zcu.cz/en/publications/HanzlicekZ_2005_Onmodelling},
}