Přejít na obsah

Detail publikace

Citace

Skorkovska, L. : JMZW: Topic Identification in Czech Newspaper Articles . SVK 2011 - magisterské a doktorské studijní programy, sborník rozšířených abstraktů, p. 95-96, Západočeská univerzita v Plzni, Plzeň, 2011.

Abstrakt

Topic identification module is a part of the complex system for acquisition and storing large volumes of text data from the Web called JMZW - Jazykové modelování z webu. This module processes each acquired text item, mostly newspaper article, and automatically assigns keywords from a predefined topic hierarchy to it.The main purpose of the JMZW system is to acquire and process data for training of extensive language models used in Automatic Speech Recognition systems. Since it has been shown that a smaller topic specific language model can outperform a much bigger general one, it is important to filter the gathered data according to its topics.

Detail publikace

Název: JMZW: Topic Identification in Czech Newspaper Articles
Autor: Skorkovska, L.
Název - česky: JMZW: Identifikace tématu českých novinových článků
Jazyk publikace: anglicky
Datum vydání: 26.5.2011
Rok vydání: 2011
Typ publikace: Stať ve sborníku
Název časopisu / knihy: SVK 2011 - magisterské a doktorské studijní programy, sborník rozšířených abstraktů
Strana: 95 - 96
ISBN: 978-80-261-0000-3
Nakladatel: Západočeská univerzita v Plzni
Místo vydání: Plzeň
Datum: 26.5.2011 - 26.5.2011
/ 2011-10-17 13:28:57 /

Klíčová slova

topic identification, newspaper, language models

BibTeX

@INPROCEEDINGS{SkorkovskaL_2011_JMZWTopic,
 author = {Skorkovska, L.},
 title = {JMZW: Topic Identification in Czech Newspaper Articles},
 year = {2011},
 publisher = {Z\'{a}pado\v{c}esk\'{a} univerzita v Plzni},
 journal = {SVK 2011 - magistersk\'{e} a doktorsk\'{e} studijn\'{i} programy, sborn\'{i}k roz\v{s}\'{i}\v{r}en\'{y}ch abstrakt\r{u}},
 address = {Plze\v{n}},
 pages = {95-96},
 ISBN = {978-80-261-0000-3},
 url = {http://www.kky.zcu.cz/en/publications/SkorkovskaL_2011_JMZWTopic},
}