Publikace
Detail publikace
Citace
: Czech audio-visual speech synthesis with an HMM-trained speech database and enhanced coarticulation . Digest of the Proceedings of the WSEAS Conferences, p. 4631741-4631746, WSEAS, Rethymno, 2003.
Abstrakt
The task of visual speech synthesis is usually solved by concatenation of basic speech units selected from a visual speech database. There are two main problems in this process. The first problem is a design of a database, that means estimation of the database parameters for all basic speech units. Second problem is a way how to concatenate selected basic phonetic units so as to eliminate the coarticulation effect. Both problems are aimed in our work, resulting in the Czech audio-visual speech synthesizer. We use HMM training process instead of some form of averaging for obtaining statistically best parameters for all basic phonetic units. For solution of a coarticulation effect we use the method of dominance functions.
Abstrakt v češtině
Syntéza vizuální řeči je většinou řešena konkatenací základních řečových jednotek vybíraných z databáze. Existují obecně dva hlavní problémy. Prvním je návrh vizuální databáze spolu s estimací hodnot řídicích parametrů. Druhý problém je je vlastní spojování jednotek. Oba problémy jsou řešeny v tomto článku a je navržena nová vizuální syntéza češtiny pomocí statistického přístupu. Je využito skrytých Markovových modelů (HMM) a dominančních funkcí pro řešení koartikulace.
Detail publikace
| Název: | Czech audio-visual speech synthesis with an HMM-trained speech database and enhanced coarticulation |
|---|---|
| Autor: | Železný, M. ; Krňoul, Z. |
| Název - česky: | Česká audiovizuální syntéza řeči |
| Jazyk publikace: | anglicky |
| Datum vydání: | 13.10.2003 |
| Rok vydání: | 2003 |
| Typ publikace: | Stať ve sborníku |
| Název časopisu / knihy: | Digest of the Proceedings of the WSEAS Conferences |
| Strana: | 4631741 - 4631746 |
| ISBN: | 960-8052-90-4 |
| Nakladatel: | WSEAS |
| Místo vydání: | Rethymno |
| Datum: | 13.10.2003 - 15.10.2003 |
Klíčová slova
audio-visual speech database, audio-visual speech synthesis, talking head, coarticulation, hidden Markov models
Klíčová slova v češtině
audiovizuální řečové databáze, audiovizuální syntéza řeči, mluvící hlava, koartikulace, skryté Markovovy modely
BibTeX
@INPROCEEDINGS{ZeleznyM_2003_Czechaudio-visual_2,
author = {\v{Z}elezn\'{y}, M. and Kr\v{n}oul, Z.},
title = {Czech audio-visual speech synthesis with an HMM-trained speech database and enhanced coarticulation},
year = {2003},
publisher = {WSEAS},
journal = {Digest of the Proceedings of the WSEAS Conferences},
address = {Rethymno},
pages = {4631741-4631746},
ISBN = {960-8052-90-4},
url = {http://www.kky.zcu.cz/en/publications/ZeleznyM_2003_Czechaudio-visual_2},
}


ZČU
