Publikace
Detail publikace
Citace
p. 1-4, AVSP2005, Vancouver Island, 2005. : Design and recording of Czech speech corpus for audio-visual continuous speech recognition . Proceedings of the Auditory-Visual Speech Processing International Conference 2005,
Abstrakt
In this paper we describe the design, recording, and content of a large audio-visual speech database intended for training and testing of audio-visual continuous speech recognition systems. The UWB- 05-HSCAVC database contains high resolution video and quality audio data suitable for experiments on audio-visual speech recognition. The corpus consists of nearly 40 hours of audiovisual records of 100 speakers in laboratory conditions. The whole database was collected using static illumination. Recorded subjects were asked to remain static with almost no head movements. The whole corpus is annotated and pre-processed to be ready to use in audio-visual speech recognition experiments. The purpose of the corpus is to provide data for evaluation of visual speech parameterizations. The corpus pre-processing was designed for use with both image-based and contour-based visual speech parameterizations.
Abstrakt v češtině
Práce se změřuje na návrh a záznam rozsáhlé audio-vizuální řečové databáze pro trénování a testování audio-vizuálního rozpoznávání spojité řeči. Korpus odbsahuje nahrávky 100 řečníků v rozsahu 40 hodin. Promluvy šech řečníků byli ručně anotovány a video záznam byl předzpracován. Předzpracování vyhledáná hlavu, oči a try řečníka a určuje natočení hlavy a velikost oblasti zájmu kolem úst.
Detail publikace
Název: | Design and recording of Czech speech corpus for audio-visual continuous speech recognition |
---|---|
Autor: | Císař, P. ; Železný, M. ; Krňoul, Z. ; Kanis, J. ; Zelinka, J. ; Müller, L. |
Název - česky: | Návrh a záznam českého řečového korpusu |
Jazyk publikace: | anglicky |
Datum vydání: | 24.7.2005 |
Rok vydání: | 2005 |
Typ publikace: | Stať ve sborníku |
Název časopisu / knihy: | Proceedings of the Auditory-Visual Speech Processing International Conference 2005 |
Strana: | 1 - 4 |
ISBN: | 1 876346 53 1 |
Nakladatel: | AVSP2005 |
Místo vydání: | Vancouver Island |
Datum: | 24.7.2005 - 27.7.2005 |
Klíčová slova
czech corpus, audio-visual, speech recognition, lipreading, speech reading
Klíčová slova v češtině
český korpus, audio-vizuální, rozponávání řeči, odezírání ze rtů
BibTeX
@INPROCEEDINGS{CisarP_2005_Designandrecording, author = {C\'{i}sa\v{r}, P. and \v{Z}elezn\'{y}, M. and Kr\v{n}oul, Z. and Kanis, J. and Zelinka, J. and M\"{u}ller, L.}, title = {Design and recording of Czech speech corpus for audio-visual continuous speech recognition}, year = {2005}, publisher = {AVSP2005}, journal = {Proceedings of the Auditory-Visual Speech Processing International Conference 2005}, address = {Vancouver Island}, pages = {1-4}, ISBN = {1 876346 53 1}, url = {http://www.kky.zcu.cz/en/publications/CisarP_2005_Designandrecording}, }