Přejít na obsah

Detail publikace

Citace

Pražák Aleš and Ircing Pavel and Švec Jan and Psutka Josef V. : Efficient Combination of N-gram Language Models and Recognition Grammars in Real-Time LVCSR Decoder . 9th International Conference on Signal Processing Proceedings, vol. ;, p. 587-591, IEEE, Peking, Čína, 2008.

Abstrakt

The paper presents a method for incorporation of regular grammars into n-gram language models. Such composite model then benefits from both language modeling formalisms - a grammar yields robust probability estimates for well-defined phrases with fixed structure whereas the n-gram provides better coverage of casual speech. Moreover, the grammar allows adding new words to the phrase pattern while taking advantage of the existing structural (context) information. The proposed method for grammar incorporation allows the use of combined models in our in-house real-time decoder which is designed to work only with standard n-gram language model. The performance of the combined model was tested in the dictation task where a simple grammar was designed for date entries. A statistically significant improvement of WER was achieved.

Abstrakt v češtině

Článek prezentuje metodu pro začlenění regulárních gramatik do n-gramových jazykových modelů. Navržený kombinovaný model využívá oba přístupy k jazykovému modelování - gramatika poskytuje robustní odhady pravděpodobnosti pro dobře definované fráze s pevnou strukturou, zatímco n-gram lépe pokrývá běžnou řeč. Gramatika navíc umožňuje přidávání nových slov do modelu s využitím existující strukturální (kontextové) informace. Navržená metoda pro začlenění gramatiky umožňuje použít kombinované modely v našem vlastním real-time dekodéru, který pracuje pouze se standardními n-gramovými jazykovými modely. Přínos kombinovaného modelu byl testován na diktovací úloze, do které byla navržena jednoduchá gramatika pro reprezentaci datumů. Dosaženo bylo statisticky významného zlepšení WER.

Detail publikace

Název: Efficient Combination of N-gram Language Models and Recognition Grammars in Real-Time LVCSR Decoder
Autor: Pražák Aleš ; Ircing Pavel ; Švec Jan ; Psutka Josef V.
Název - česky: Efektivní kombinace N-gramových jazykových modelů a rozpoznávacích gramatik v real-time LVCSR dekodéru
Jazyk publikace: anglicky
Rok vydání: 2008
Typ publikace: Stať ve sborníku
Název časopisu / knihy: 9th International Conference on Signal Processing Proceedings
Číslo vydání: ;
Strana: 587 - 591
ISBN: 978-1-4244-2178-7
Nakladatel: IEEE
Místo vydání: Peking, Čína
Datum: 29.10.2008
2011-03-15 16:21:32 / 2011-06-09 12:30:02 / 1

Klíčová slova

language modeling, n-gram, grammar, real-time, LVCSR

Klíčová slova v češtině

jazykové modelování, n-gram, gramatika, reálný čas, LVCSR

BibTeX

@INPROCEEDINGS{PrazakAles_2008_EfficientCombination,
 author = {Pra\v{z}\'{a}k Ale\v{s} and Ircing Pavel and \v{S}vec Jan and Psutka Josef V.},
 title = {Efficient Combination of N-gram Language Models and Recognition Grammars in Real-Time LVCSR Decoder},
 year = {2008},
 publisher = {IEEE},
 journal = {9th International Conference on Signal Processing Proceedings},
 address = {Peking, \v{C}\'{i}na},
 volume = {;},
 pages = {587-591},
 ISBN = {978-1-4244-2178-7},
 note = {Dopln\v{e}no UT ISI},
 url = {http://www.kky.zcu.cz/en/publications/PrazakAles_2008_EfficientCombination},
}