Publikace
Detail publikace
Citace
: Audio-visual speech recognition for Slavonic languages (Czech and Russian) . Proceedings of the 11th international conference "Speech and computer" SPECOM'2006 , p. 493-498, Anatolya Publishers, St.Petersburg, 2006.
Abstrakt
The paper presents the results of recent experiments with audio-visual speech recognition for two popular Slavonic languages: Russian and Czech. The description of test applied tasks, the process of multimodal databases collection and data pre-processing, methods for visual features extraction (geometric shape-based features; DCT and PCA pixel-based visual parameterization) as well as models of audio-visual recognition (concatenation of feature vectors and multi-stream models) are described. The prototypes of applied systems which will use the audio-visual speech recognition engine are mainly directed to the market of intellectual applications such as inquiry machines, video conference communications, moving objects control in noisy environments, etc.
Abstrakt v češtině
Článek prezentuje výsledky posledních experimentů s audiovizuálním rozpoznáváním řeči pro dva slovanské jazyky: ruštinu a češtinu. V článku je uveden popis testovacích aplikačních úloh, proces sbírání multimodální databáze a předzpracování dat, metody pro extrakci vizuálních příznaků (geometrické příznaky založené na tvaru a DCT a PCA parametrizace založené na hodnotě pixelů) a modely audiovizuálního rozpoznávání (spojování příznakových vektorů a multistreamové modely). Prototypy aplikovaných systémů, které používají modul audiovizuálního rozpoznávání řeči jsou směrovány především na trh intelektuiálních aplikací jako jsou dotazovací systémy, videokonferenční komunikace, ovládání pohyblivých objektů v hlučném prostředí atd.
Detail publikace
| Název: | Audio-visual speech recognition for Slavonic languages (Czech and Russian) |
|---|---|
| Autor: | Císař, P. ; Zelinka, J. ; Železný, M. ; Karpov, A. ; Ronzhin, A. |
| Název - česky: | Audiovizuální rozpoznávání řeči pro slovanské jazyky (češtinu a ruštinu) |
| Jazyk publikace: | anglicky |
| Datum vydání: | 25.6.2006 |
| Rok vydání: | 2006 |
| Typ publikace: | Stať ve sborníku |
| Název časopisu / knihy: | Proceedings of the 11th international conference "Speech and computer" SPECOM'2006 |
| Strana: | 493 - 498 |
| ISBN: | 5-7452-0074-X |
| Nakladatel: | Anatolya Publishers |
| Místo vydání: | St.Petersburg |
| Datum: | 25.6.2006 - 29.6.2006 |
Klíčová slova
audio-visual speech recognition, slavonic languages
Klíčová slova v češtině
audiovizuální rozpoznávání řeči, slovanské jazyky
BibTeX
@INPROCEEDINGS{CisarP_2006_Audio-visualspeech,
author = {C\'{i}sa\v{r}, P. and Zelinka, J. and \v{Z}elezn\'{y}, M. and Karpov, A. and Ronzhin, A.},
title = {Audio-visual speech recognition for Slavonic languages (Czech and Russian)},
year = {2006},
publisher = {Anatolya Publishers},
journal = {Proceedings of the 11th international conference "Speech and computer" SPECOM'2006 },
address = {St.Petersburg},
pages = {493-498},
ISBN = {5-7452-0074-X},
url = {http://www.kky.zcu.cz/en/publications/CisarP_2006_Audio-visualspeech},
}


ZČU
