Publikace
Detail publikace
Citace
p. 139-142, INSTICC PRESS, Lisabon, 2007. : LIVE TV SUBTITLING - Fast 2-pass LVCSR System for Online Subtitling . SIGMAP 2007, ,
Abstrakt
The paper describes a fast 2-pass large vocabulary continuous speech recognition (LVCSR) system for automatic online subtitling of live TV programs. The proposed system implementation can be used for direct recognition of TV program audio channel or recognition of a shadow speaker who re-speaks the original audio channel. The first part of this paper focuses on preparation of an adaptive language model for TV programs, where person names are specific for each subtitling session and have to be added to the recognition vocabulary. The second part outlines the recognition system conception for automatic online subtitling with vocabulary up to 150 000 words in real-time. The recognition system is based on Hidden Markov Models, lexical trees and bigram and quadgram language models in the first and second pass, respectively. Finally, experimental results from our project with the Czech Television are reported and discussed.
Abstrakt v češtině
Článek popisuje rychlý dvouprůchodový rozpoznávací systém spojité řeči s velkým slovníkem (LVCSR) pro automatické online titulkování živých televizních pořadů. Implementace navrženého systému může být použita jak pro přímé rozpoznávání audio kanálu televizního programu, tak pro rozpoznávání stínového řečníka, který přemlouvá originální zvukový kanál. První část článku se zaměřuje na přípravu adaptivního jazykového modelu pro televizní programy, ve kterých jsou osobní jména specifická pro každou titulkovací úlohu a musejí být přidána do rozpoznávacího slovníku. Druhá část nastiňuje koncepci rozpoznávacího systému pro automatické online rozpoznávání se slovníkem do 150000 slov v reálném čase. Rozpoznávací systém je založen na Skrytých Markovových modelech, lexikálních stromech a bigramovém jazykovém modelu pro první průchod a čtyřgramovém jazykovém modelu pro druhý průchod. Závěrem jsou podány a diskutovány experimentální výsledky z našeho projektu s Českou televizí.
Detail publikace
Název: | LIVE TV SUBTITLING - Fast 2-pass LVCSR System for Online Subtitling |
---|---|
Autor: | Pražák, A. ; Müller, L. ; Psutka Josef V.. ; Psutka, J. |
Název - česky: | Titulkování živých televizních pořadů - rychlý dvouprůchodový LVCSR systém pro online titulkování |
Jazyk publikace: | anglicky |
Datum vydání: | 28.7.2007 |
Rok vydání: | 2007 |
Typ publikace: | Stať ve sborníku |
Název časopisu / knihy: | SIGMAP 2007 |
Edice: | |
Strana: | 139 - 142 |
ISBN: | 978-989-8111-13-5 |
Nakladatel: | INSTICC PRESS |
Místo vydání: | Lisabon |
Datum: | 28.7.2007 - 31.7.2007 |
Klíčová slova
ASR, LVCSR, HMM, real-time, class-based language model, live TV, online subtitling
Klíčová slova v češtině
ASR, LVCSR, HMM, reálný čas, třídový jazykový model, živé televizní vysílání, online titulkování
BibTeX
@INPROCEEDINGS{PrazakA_2007_LIVETVSUBTITLING, author = {Pra\v{z}\'{a}k, A. and M\"{u}ller, L. and Psutka Josef V.. and Psutka, J.}, title = {LIVE TV SUBTITLING - Fast 2-pass LVCSR System for Online Subtitling}, year = {2007}, publisher = {INSTICC PRESS}, journal = {SIGMAP 2007}, address = {Lisabon}, pages = {139-142}, ISBN = {978-989-8111-13-5}, url = {http://www.kky.zcu.cz/en/publications/PrazakA_2007_LIVETVSUBTITLING}, }