Detail publikace
p. 439-446, 2007. : Information Retrieval Test Collection for Searching Spontaneous Czech Speech . Lecture Notes in Artificial Intelligence, 4629,
PDF ke stažení
This paper describes the design of the first large-scale IR test collection built for the Czech language. The creation of this collection also happens to be very challenging, as it is based on a continuous text stream from automatic transcription of spontaneous speech and thus lacks clearly defined document boundaries. All aspects of the collection building are presented, together with some general findings of initial experiments.
Abstrakt v češtině
Článek popisuje vývoj první rozsáhlé testovací kolekce pro vyhledávání informací vytvořené pro český jazyk. Tvorba této kolekce je shodou okolností velkou výzvou, neboť kolekce je postavena na souvislém proudu textu z automatického přepisu spontánní řeči a jako taková postrádá jasně definované hranice mezi dokumenty. Článek představuje všechny aspekty budování kolekce, včetně některých obecných zjištění vzešlých z prvních experimentů.
Detail publikace
Název: | Information Retrieval Test Collection for Searching Spontaneous Czech Speech |
Autor: | Ircing, P. ; Pecina, P. ; Oard, D. ; Wang, J. ; White, R. ; Hoidekr, J. |
Název - česky: | Testovací kolekce pro vyhledávání informací ve spontánní mluvené češtině |
Jazyk publikace: | anglicky |
Datum vydání: | 1.1.2007 |
Rok vydání: | 2007 |
Typ publikace: | Článek z časopisu |
Název časopisu / knihy: | Lecture Notes in Artificial Intelligence |
Svazek: | 4629 |
Strana: | 439 - 446 |
ISBN: | 0302-9743 |
Klíčová slova
Spoken Document Retrieval, Evaluation
Klíčová slova v češtině
Vyhledávání v řečových datech, evaluace
@ARTICLE{IrcingP_2007_InformationRetrieval, author = {Ircing, P. and Pecina, P. and Oard, D. and Wang, J. and White, R. and Hoidekr, J.}, title = {Information Retrieval Test Collection for Searching Spontaneous Czech Speech}, year = {2007}, journal = {Lecture Notes in Artificial Intelligence}, pages = {439-446}, series = {4629}, ISBN = {0302-9743}, url = {}, }