Publikace
Detail publikace
Citace
p. 493-498, Anatolya Publishers, St.Petersburg, 2006. : Audio-visual speech recognition for Slavonic languages (Czech and Russian) . Proceedings of the 11th international conference "Speech and computer" SPECOM'2006 ,
Abstrakt
The paper presents the results of recent experiments with audio-visual speech recognition for two popular Slavonic languages: Russian and Czech. The description of test applied tasks, the process of multimodal databases collection and data pre-processing, methods for visual features extraction (geometric shape-based features; DCT and PCA pixel-based visual parameterization) as well as models of audio-visual recognition (concatenation of feature vectors and multi-stream models) are described. The prototypes of applied systems which will use the audio-visual speech recognition engine are mainly directed to the market of intellectual applications such as inquiry machines, video conference communications, moving objects control in noisy environments, etc.
Abstrakt v češtině
Článek prezentuje výsledky posledních experimentů s audiovizuálním rozpoznáváním řeči pro dva slovanské jazyky: ruštinu a češtinu. V článku je uveden popis testovacích aplikačních úloh, proces sbírání multimodální databáze a předzpracování dat, metody pro extrakci vizuálních příznaků (geometrické příznaky založené na tvaru a DCT a PCA parametrizace založené na hodnotě pixelů) a modely audiovizuálního rozpoznávání (spojování příznakových vektorů a multistreamové modely). Prototypy aplikovaných systémů, které používají modul audiovizuálního rozpoznávání řeči jsou směrovány především na trh intelektuiálních aplikací jako jsou dotazovací systémy, videokonferenční komunikace, ovládání pohyblivých objektů v hlučném prostředí atd.
Detail publikace
Název: | Audio-visual speech recognition for Slavonic languages (Czech and Russian) |
---|---|
Autor: | Císař, P. ; Zelinka, J. ; Železný, M. ; Karpov, A. ; Ronzhin, A. |
Název - česky: | Audiovizuální rozpoznávání řeči pro slovanské jazyky (češtinu a ruštinu) |
Jazyk publikace: | anglicky |
Datum vydání: | 25.6.2006 |
Rok vydání: | 2006 |
Typ publikace: | Stať ve sborníku |
Název časopisu / knihy: | Proceedings of the 11th international conference "Speech and computer" SPECOM'2006 |
Strana: | 493 - 498 |
ISBN: | 5-7452-0074-X |
Nakladatel: | Anatolya Publishers |
Místo vydání: | St.Petersburg |
Datum: | 25.6.2006 - 29.6.2006 |
Klíčová slova
audio-visual speech recognition, slavonic languages
Klíčová slova v češtině
audiovizuální rozpoznávání řeči, slovanské jazyky
BibTeX
@INPROCEEDINGS{CisarP_2006_Audio-visualspeech, author = {C\'{i}sa\v{r}, P. and Zelinka, J. and \v{Z}elezn\'{y}, M. and Karpov, A. and Ronzhin, A.}, title = {Audio-visual speech recognition for Slavonic languages (Czech and Russian)}, year = {2006}, publisher = {Anatolya Publishers}, journal = {Proceedings of the 11th international conference "Speech and computer" SPECOM'2006 }, address = {St.Petersburg}, pages = {493-498}, ISBN = {5-7452-0074-X}, url = {http://www.kky.zcu.cz/en/publications/CisarP_2006_Audio-visualspeech}, }