Publikace
Detail publikace
Citace
p. 448-452, ACTA Press, Anaheim, 2006. : Automatic transcription of audio archives for spoken document retrieval . Proceedings of the second IASTED international conference on Computational intelligence,
Abstrakt
The paper presents a system for automatic transcription of spontaneous Czech speech for the spoken document retrieval purposes. It focuses mainly on the language modeling technique that improves the recognition of words belonging to categories which proved to be important for the information retrieval purposes - the named entities. Using a specially designed class language model based on the morphological tags, we have managed to boost the transcription accuracy of the named entities.
Abstrakt v češtině
Článek představuje systém pro automatický přepis spontánní mluvené češtiny pro účely vyhledávání informací. Zaměřuje se hlavně na techniky jazykového modelování, které zlepšují rozpoznávání slov náležejících do kategorií důležitých pro vyhledávání - tzv. pojmenovaných entit. S použitím speciálně navrženého třídového jazykového modelu založeného na morfologických značkách se nám podařilo úspěšnost rozpoznávání těchto slov skutečně zlepšit.
Detail publikace
Název: | Automatic transcription of audio archives for spoken document retrieval |
---|---|
Autor: | Ircing, P. ; Psutka, J. ; Radová, V. |
Název - česky: | Automatický přepis zvukových archívů pro účely vyhledávání informací |
Jazyk publikace: | anglicky |
Datum vydání: | 20.11.2006 |
Rok vydání: | 2006 |
Typ publikace: | Stať ve sborníku |
Název časopisu / knihy: | Proceedings of the second IASTED international conference on Computational intelligence |
Strana: | 448 - 452 |
ISBN: | 0-88986-602-3 |
Nakladatel: | ACTA Press |
Místo vydání: | Anaheim |
Datum: | 20.11.2006 - 22.11.2006 |
Klíčová slova
speech recognition, spoken document retrieval
Klíčová slova v češtině
rozpoznávání řeči, vyhledávání informací
BibTeX
@INPROCEEDINGS{IrcingP_2006_Automatic, author = {Ircing, P. and Psutka, J. and Radov\'{a}, V.}, title = {Automatic transcription of audio archives for spoken document retrieval}, year = {2006}, publisher = {ACTA Press}, journal = {Proceedings of the second IASTED international conference on Computational intelligence}, address = {Anaheim}, pages = {448-452}, ISBN = {0-88986-602-3}, url = {http://www.kky.zcu.cz/en/publications/IrcingP_2006_Automatic}, }