Publikace
Detail publikace
Citace
Katedra kybernetiky, Fakulta aplikovaných věd, Západočeská univerzita v Plzni, Johns Hopkins University Baltimore, Shoah Visual History Foundation, 2006. : Slovak Spontaneaous Speech – Acoustic&Language Models (MALACH) .
Abstrakt
The Visual History Foundation collected recently about 52 thousand testimonies of Holocaust survivors pronounced in 32 languages. There are approx. 580 Slovak testimonies with a total length of 1 300 hours. It is not feasible to transcribe all those testimonies maually due to the enornous time and money demands. Thus the transcription is performed using the automatic speech recognition system – data forthe system development were acquired from the Slovak Malach Speech Corpus. The basic AM unit is a triphone represented by a 5-state HMM, where every state is modeled as a GMM with 16 mixtures. The total number of states was reduced to 7902 using a phonetic clustering tree. The language model is designed as a combination of 2 bigram models.
Abstrakt v češtině
Visual History Foundation shromáždila v minulých létech cca 52 tisíc výpovědí svědků holocaustu namluvených ve 32 jazycích. Slovenských výpovědí je k dispozici cca 580 s celkovou délkou asi 1 300 hodin. Vzhledem k značné časové a finanční náročnosti není možné provést přepisy všech výpovědí manuálně. K přepisu bylo proto využito systému automatického rozpoznávání řeči. Data pro tvorbu modelů byla získána z Slovak Malach Speech Corpusu. Základní jednotkou AM je trifón reprezentovaný 5ti stavovým HMM, kde každý stav je modelován 16ti složkovým GMM. Aplikací fonetického shlukovacího stromu byl počet stavů snížen na 7902. Jazykový model je tvořen kombinací 2 bigramových modelů.
Detail publikace
Název: | Slovak Spontaneaous Speech – Acoustic&Language Models (MALACH) |
---|---|
Autor: | Psutka, J. ; Ircing, P. ; Psutka Josef V. |
Název - česky: | Akustický a jazykový model spontánní slovenštiny |
Jazyk publikace: | anglicky |
Datum vydání: | 1.1.2006 |
Rok vydání: | 2006 |
Typ publikace: | Prototyp, uplatněná metodika, autorizovaný software |
Nakladatel: | Katedra kybernetiky, Fakulta aplikovaných věd, Západočeská univerzita v Plzni, Johns Hopkins University Baltimore, Shoah Visual History Foundation |
Klíčová slova
Slovak acoustic model, Slovak language model, Speech recognition
Klíčová slova v češtině
Akustický model slovenštiny, jazykový model spontánní slovenštiny, rozpoznávání souvislé řeči
BibTeX
@MISC{PsutkaJ_2006_SlovakSpontaneaous, author = {Psutka, J. and Ircing, P. and Psutka Josef V.}, title = {Slovak Spontaneaous Speech - Acoustic&Language Models (MALACH)}, year = {2006}, publisher = {Katedra kybernetiky, Fakulta aplikovan\'{y}ch v\v{e}d, Z\'{a}pado\v{c}esk\'{a} univerzita v Plzni, Johns Hopkins University Baltimore, Shoah Visual History Foundation}, url = {http://www.kky.zcu.cz/en/publications/PsutkaJ_2006_SlovakSpontaneaous}, }