Přejít na obsah

Detail publikace

Citace

Císař, P. and Železný, M. and Krňoul, Z. and Kanis, J. and Zelinka, J. and Müller, L. : Design and recording of Czech speech corpus for audio-visual continuous speech recognition . Proceedings of the Auditory-Visual Speech Processing International Conference 2005, p. 1-4, AVSP2005, Vancouver Island, 2005.

Abstrakt

In this paper we describe the design, recording, and content of a large audio-visual speech database intended for training and testing of audio-visual continuous speech recognition systems. The UWB- 05-HSCAVC database contains high resolution video and quality audio data suitable for experiments on audio-visual speech recognition. The corpus consists of nearly 40 hours of audiovisual records of 100 speakers in laboratory conditions. The whole database was collected using static illumination. Recorded subjects were asked to remain static with almost no head movements. The whole corpus is annotated and pre-processed to be ready to use in audio-visual speech recognition experiments. The purpose of the corpus is to provide data for evaluation of visual speech parameterizations. The corpus pre-processing was designed for use with both image-based and contour-based visual speech parameterizations.

Abstrakt v češtině

Práce se změřuje na návrh a záznam rozsáhlé audio-vizuální řečové databáze pro trénování a testování audio-vizuálního rozpoznávání spojité řeči. Korpus odbsahuje nahrávky 100 řečníků v rozsahu 40 hodin. Promluvy šech řečníků byli ručně anotovány a video záznam byl předzpracován. Předzpracování vyhledáná hlavu, oči a try řečníka a určuje natočení hlavy a velikost oblasti zájmu kolem úst.

Detail publikace

Název: Design and recording of Czech speech corpus for audio-visual continuous speech recognition
Autor: Císař, P. ; Železný, M. ; Krňoul, Z. ; Kanis, J. ; Zelinka, J. ; Müller, L.
Název - česky: Návrh a záznam českého řečového korpusu
Jazyk publikace: anglicky
Datum vydání: 24.7.2005
Rok vydání: 2005
Typ publikace: Stať ve sborníku
Název časopisu / knihy: Proceedings of the Auditory-Visual Speech Processing International Conference 2005
Strana: 1 - 4
ISBN: 1 876346 53 1
Nakladatel: AVSP2005
Místo vydání: Vancouver Island
Datum: 24.7.2005 - 27.7.2005
/ /

Klíčová slova

czech corpus, audio-visual, speech recognition, lipreading, speech reading

Klíčová slova v češtině

český korpus, audio-vizuální, rozponávání řeči, odezírání ze rtů

BibTeX

@INPROCEEDINGS{CisarP_2005_Designandrecording,
 author = {C\'{i}sa\v{r}, P. and \v{Z}elezn\'{y}, M. and Kr\v{n}oul, Z. and Kanis, J. and Zelinka, J. and M\"{u}ller, L.},
 title = {Design and recording of Czech speech corpus for audio-visual continuous speech recognition},
 year = {2005},
 publisher = {AVSP2005},
 journal = {Proceedings of the Auditory-Visual Speech Processing International Conference 2005},
 address = {Vancouver Island},
 pages = {1-4},
 ISBN = {1 876346 53 1},
 url = {http://www.kky.zcu.cz/en/publications/CisarP_2005_Designandrecording},
}