Publikace
Detail publikace
Citace
Katedra kybernetiky, Fakulta aplikovaných věd, Západočeská univerzita v Plzni, Johns Hopkins Univ. v Baltimore, Shoah Visual History Foundation, 2006. : Slovak Malach Speech Corpus .
Abstrakt
Visual History Foundation collected recently at least 52 thousand testimonies of holocaust survivors pronounced at 32 different languages. The Slovak collection is created by about 580 testimonies with the total length of about 1,300 hours. The corresponding Slovak Malach Speech Corpus was annotated with the goal to build the large vocabulary continuous speech recognition system. For this purpose it was selected and manually transcribed 400 15-minute speech segments of individual speakers (for training purposes) and whole testimonies of 10 different survivors (about 22 hours of speech) for tests. All manual annotations were performed in the orthographic form of the words.
Abstrakt v češtině
Visual History Foundation shromáždila v minulých létech cca 52 tisíc výpovědí svědků holocaustu namluvených ve 32 jazycích. Slovenských výpovědí je k dispozici cca 580 s celkovou délkou asi 1 300 hodin. Korpus slovenských výpovědí projektu Malach byl připraven pro konstrukci systému automatického rozpoznávání spontánní řeči, který bude využit pro automatické hledání klíčových slov a topiků ve výpovědích. Pro trénování systému bylo zpracováno a speciálním způsobem anotováno celkem 400 15-minutových segmentů výpovědí (celkem 100 hodin), pro testy bylo zpracováno 10 celých výpovědí od různých řečníků (celkem cca 22 hodin). Všechny manuální anotace byly provedeny v ortografickém tvaru slov.
Detail publikace
Název: | Slovak Malach Speech Corpus |
---|---|
Autor: | Psutka, J. ; Matoušek, J. ; Radová, V. ; Psutka Josef V. ; Ircing, P. ; Müller, L. |
Název - česky: | Anotovaný korpus slovenských výpovědí svědků holocaustu |
Jazyk publikace: | anglicky |
Datum vydání: | 1.1.2006 |
Rok vydání: | 2006 |
Typ publikace: | Prototyp, uplatněná metodika, autorizovaný software |
Nakladatel: | Katedra kybernetiky, Fakulta aplikovaných věd, Západočeská univerzita v Plzni, Johns Hopkins Univ. v Baltimore, Shoah Visual History Foundation |
Klíčová slova
Slovak spontaneous speech corpus, large vocabulary continuous speech recognition
Klíčová slova v češtině
korpus slovenské spontánní řeči, rozpoznávání souvislé řeči s velkým slovníkem
BibTeX
@MISC{PsutkaJ_2006_SlovakMalachSpeech, author = {Psutka, J. and Matou\v{s}ek, J. and Radov\'{a}, V. and Psutka Josef V. and Ircing, P. and M\"{u}ller, L.}, title = {Slovak Malach Speech Corpus}, year = {2006}, publisher = {Katedra kybernetiky, Fakulta aplikovan\'{y}ch v\v{e}d, Z\'{a}pado\v{c}esk\'{a} univerzita v Plzni, Johns Hopkins Univ. v Baltimore, Shoah Visual History Foundation}, url = {http://www.kky.zcu.cz/en/publications/PsutkaJ_2006_SlovakMalachSpeech}, }