Russian Spontaneaous Speech – Acoustic&Language Models (MALACH)

Ircing, P.; Psutka, J.; Psutka Josef V.

Publikace

Všechny publikace

Detail publikace

Citace

Ircing, P. and Psutka, J. and Psutka Josef V. : Russian Spontaneaous Speech – Acoustic&Language Models (MALACH) . Katedra kybernetiky, Fakulta aplikovaných věd, Západočeská univerzita v Plzni, Johns Hopkins University v Baltimore, Shoah Visual History Foundati, 2005.

Abstrakt

The Visual History Foundation collected recently about 52 thousand testimonies of Holocaust survivors pronounced in 32 languages. There are approx. 7,050 Russian testimonies with a total length of 16,000 hours. It is not feasible to transcribe all those testimonies maually due to the enornous time and money demands. Thus the transcription is performed using the automatic speech recognition system – data forthe system development were acquired from the Russian Malach Speech Corpus. The basic AM unit is a triphone represented by a 5-state HMM, where every state is modeled as a GMM with 16 mixtures. The total number of states was reduced to 6969 using a phonetic clustering tree. The language model is designed as a combination of 2 bigram models.

Abstrakt v češtině

Visual History Foundation shromáždila v minulých létech cca 52 tisíc výpovědí svědků holocaustu namluvených ve 32 jazycích. Ruských výpovědí je k dispozici cca 7 050 s celkovou délkou asi 16 000 hodin. Vzhledem k značné časové a finanční náročnosti není možné provést přepisy všech výpovědí manuálně. K přepisu bylo proto využito systému automatického rozpoznávání řeči. Data pro tvorbu modelů byla získána z Russian Malach Speech Corpusu. Základní jednotkou AM je trifón reprezentovaný 5ti stavovým HMM, kde každý stav je modelován 16ti složkovým GMM. Aplikací fonetického shlukovacího stromu byl počet stavů snížen na 6969. Jazykový model je tvořen kombinací 2 bigramových modelů.

Detail publikace

Název:	Russian Spontaneaous Speech – Acoustic&Language Models (MALACH)
Autor:	Ircing, P. ; Psutka, J. ; Psutka Josef V.
Název - česky:	Akustický a jazykový model spontánní ruštiny
Jazyk publikace:	anglicky
Datum vydání:	1.1.2005
Rok vydání:	2005
Typ publikace:	Prototyp, uplatněná metodika, autorizovaný software
Nakladatel:	Katedra kybernetiky, Fakulta aplikovaných věd, Západočeská univerzita v Plzni, Johns Hopkins University v Baltimore, Shoah Visual History Foundati

/ 2011-06-09 12:50:52 /

Klíčová slova

Russian acoustic model, Russian language model, Speech recognition

Klíčová slova v češtině

Akustický model ruštiny, jazykový model spontánní ruštiny, rozpoznávání souvislé řeči

BibTeX

@MISC{IrcingP_2005_RussianSpontaneaous,
 author = {Ircing, P. and Psutka, J. and Psutka Josef V.},
 title = {Russian Spontaneaous Speech - Acoustic&Language Models (MALACH)},
 year = {2005},
 publisher = {Katedra kybernetiky, Fakulta aplikovan\'{y}ch v\v{e}d, Z\'{a}pado\v{c}esk\'{a} univerzita v Plzni, Johns Hopkins University v Baltimore, Shoah Visual History Foundati},
 url = {http://www.kky.zcu.cz/en/publications/IrcingP_2005_RussianSpontaneaous},
}

Pozice katedry v rámci univerzity

Oddělení katedry

Publikace

Detail publikace

Citace

Abstrakt

Abstrakt v češtině

Detail publikace

Klíčová slova

Klíčová slova v češtině

BibTeX