Přejít na obsah

Detail publikace

Citace

Kanis, J. and Müller, L. : Using lemmatization technique for automatic diacritics restoration . SPECOM 2005 proceedings, p. 255-258, Moscow State Linguistic University, Moscow , 2005.

PDF ke stažení

PDF

Abstrakt

This paper is devoted to automatic construction of a lemmatizer from a Full Form - Lemma (FFL) training dictionary, and to lemmatization of new, in the FFL dictionary unseen - i.e. out-of-vocabulary (OOV), words. Three methods of lemmatization of three kinds of OOV words (missing full forms, unknown words, and compound words) are introduced. In addition, the application of lemmatizer automatic construction to the problem of automatic diacritics restoration is described.

Abstrakt v češtině

Tento článek se zabývá automatickou konstrukcí lematizátoru z Plný tvar - Lema trénovacího slovníku a lematizací nových, v trénovacím slovníku neviděných, tj. OOV slov. Jsou představeny tři metody pro lematizaci tří různých typů OOV slov (chybějící plné tvary, složená a neznámá slova). Nakonec je posána aplikace metody pro automatickou konstrukci lematizátoru na problém obnovení diakritiky.

Detail publikace

Název: Using lemmatization technique for automatic diacritics restoration
Autor: Kanis, J. ; Müller, L.
Název - česky: Využítí techniky lematizace pro obnovení diakritiky
Jazyk publikace: anglicky
Datum vydání: 17.10.2005
Rok vydání: 2005
Typ publikace: Stať ve sborníku
Název časopisu / knihy: SPECOM 2005 proceedings
Strana: 255 - 258
ISBN: 5-7452-0110-X
Nakladatel: Moscow State Linguistic University
Místo vydání: Moscow
Datum: 17.10.2005 - 19.10.2005
/ 2008-04-18 14:31:38 /

Klíčová slova

lemmatization, OOV words, diacritics restoration

Klíčová slova v češtině

lematizace, OOV slova, obnovení diakritiky

BibTeX

@INPROCEEDINGS{KanisJ_2005_Usinglemmatization,
 author = {Kanis, J. and M\"{u}ller, L.},
 title = {Using lemmatization technique for automatic diacritics restoration},
 year = {2005},
 publisher = {Moscow State Linguistic University},
 journal = {SPECOM 2005 proceedings},
 address = {Moscow },
 pages = {255-258},
 ISBN = {5-7452-0110-X},
 url = {http://www.kky.zcu.cz/en/publications/KanisJ_2005_Usinglemmatization},
}