Publikace
Detail publikace
Citace
p. 397-400, Moscow State Linguistic University, Moscow , 2005. : Design of Russian audio-visual speech corpus for bimodal speech recognition . SPECOM 2005 proceedings,
Abstrakt
In this paper we present design of an audio-visual speech corpus in the Russian language for bimodal speech recognition task. At the University of West Bohemia in Plzen the audio-visual speech recognition system is developed for the Czech language. At the Saint-Petersburg Institute of Informatics and Automation of Russian Academy of Sciences the acoustic-only speech recognition system SIRIUS is developed. The paper presents the idea of joining these two projects and designing audiovisual speech recognition in the Russian language. In the paper the recording setup, preprocessing of a text part and a visual part of the corpus is presented. Paper concludes with possible application of such system.
Abstrakt v češtině
V článku prezentujeme návrh audiovizuálního řečového korpusu v ruském jazyce pro úlohu bimodálního rozpoznávání řeči. Na Západočeské univerzitě v Plzni je vyvíjen systém audiovizuálního rozpoznávání řeči pro češtinu. V Sankt-Petěrburgském institutu informatiky a automatizace Ruské akademie věd je vyvíjen systém akustického rozpoznávání řeči SIRIUS. Článek prezentuje myšlenku spojení těchto dvou projektů a návrh audiovizuálního systému rozpoznávání řeči pro ruštinu. V článku je prezentováno nastavení při nahrávání, předzpracování jak textové, tak i vizuální části korpusu. Článek je uzavřen možnou aplikací takového systému.
Detail publikace
Název: | Design of Russian audio-visual speech corpus for bimodal speech recognition |
---|---|
Autor: | Železný, M. ; Císař, P. ; Krňoul, Z. ; Ronzhin, A. ; Li, I. ; Karpov, A. |
Název - česky: | Návrh ruského audiovizuálního řečového korpusu pro bimodální rozpoznávání řeči |
Jazyk publikace: | anglicky |
Datum vydání: | 17.10.2005 |
Rok vydání: | 2005 |
Typ publikace: | Stať ve sborníku |
Název časopisu / knihy: | SPECOM 2005 proceedings |
Strana: | 397 - 400 |
ISBN: | 5-7452-0110-X |
Nakladatel: | Moscow State Linguistic University |
Místo vydání: | Moscow |
Datum: | 17.10.2005 - 19.10.2005 |
Klíčová slova
speech recognition, speech corpora, audio-visual speech processing
Klíčová slova v češtině
rozpoznávání řeči, řečové korpusy, audiovizuální zpracování řeči
BibTeX
@INPROCEEDINGS{ZeleznyM_2005_DesignofRussian, author = {\v{Z}elezn\'{y}, M. and C\'{i}sa\v{r}, P. and Kr\v{n}oul, Z. and Ronzhin, A. and Li, I. and Karpov, A.}, title = {Design of Russian audio-visual speech corpus for bimodal speech recognition}, year = {2005}, publisher = {Moscow State Linguistic University}, journal = {SPECOM 2005 proceedings}, address = {Moscow }, pages = {397-400}, ISBN = {5-7452-0110-X}, url = {http://www.kky.zcu.cz/en/publications/ZeleznyM_2005_DesignofRussian}, }