Publikace
Detail publikace
Citace
p. 4631741-4631746, WSEAS, Rethymno, 2003. : Czech audio-visual speech synthesis with an HMM-trained speech database and enhanced coarticulation . Digest of the Proceedings of the WSEAS Conferences,
Abstrakt
The task of visual speech synthesis is usually solved by concatenation of basic speech units selected from a visual speech database. There are two main problems in this process. The first problem is a design of a database, that means estimation of the database parameters for all basic speech units. Second problem is a way how to concatenate selected basic phonetic units so as to eliminate the coarticulation effect. Both problems are aimed in our work, resulting in the Czech audio-visual speech synthesizer. We use HMM training process instead of some form of averaging for obtaining statistically best parameters for all basic phonetic units. For solution of a coarticulation effect we use the method of dominance functions.
Abstrakt v češtině
Syntéza vizuální řeči je většinou řešena konkatenací základních řečových jednotek vybíraných z databáze. Existují obecně dva hlavní problémy. Prvním je návrh vizuální databáze spolu s estimací hodnot řídicích parametrů. Druhý problém je je vlastní spojování jednotek. Oba problémy jsou řešeny v tomto článku a je navržena nová vizuální syntéza češtiny pomocí statistického přístupu. Je využito skrytých Markovových modelů (HMM) a dominančních funkcí pro řešení koartikulace.
Detail publikace
Název: | Czech audio-visual speech synthesis with an HMM-trained speech database and enhanced coarticulation |
---|---|
Autor: | Železný, M. ; Krňoul, Z. |
Název - česky: | Česká audiovizuální syntéza řeči |
Jazyk publikace: | anglicky |
Datum vydání: | 13.10.2003 |
Rok vydání: | 2003 |
Typ publikace: | Stať ve sborníku |
Název časopisu / knihy: | Digest of the Proceedings of the WSEAS Conferences |
Strana: | 4631741 - 4631746 |
ISBN: | 960-8052-90-4 |
Nakladatel: | WSEAS |
Místo vydání: | Rethymno |
Datum: | 13.10.2003 - 15.10.2003 |
Klíčová slova
audio-visual speech database, audio-visual speech synthesis, talking head, coarticulation, hidden Markov models
Klíčová slova v češtině
audiovizuální řečové databáze, audiovizuální syntéza řeči, mluvící hlava, koartikulace, skryté Markovovy modely
BibTeX
@INPROCEEDINGS{ZeleznyM_2003_Czechaudio-visual_2, author = {\v{Z}elezn\'{y}, M. and Kr\v{n}oul, Z.}, title = {Czech audio-visual speech synthesis with an HMM-trained speech database and enhanced coarticulation}, year = {2003}, publisher = {WSEAS}, journal = {Digest of the Proceedings of the WSEAS Conferences}, address = {Rethymno}, pages = {4631741-4631746}, ISBN = {960-8052-90-4}, url = {http://www.kky.zcu.cz/en/publications/ZeleznyM_2003_Czechaudio-visual_2}, }