Euskarazko denbora-informazioaren tratamendu automatikoa TimeMLren eta HeidelTimeren bidez
Ekaia 30 : 153-165 (2016)
Abstract
Hizkuntzaren prozesamenduan (HP), denbora-informazioa beharrezkoa da testuak ulertzeko, testuko gertaerak noiz jazotzen diren edo zenbat irauten duten adierazten baitu. Artikulu honetan, euskarazko denbora-informazioaren azterketa eta prozesamendua aurkezten dira. Lehenik, denbora-egituren deskribapena egin da. Bigarren, informazio egituratua emateko markaketa-lengoaia eta horren bidez etiketatutako corpusak azaldu dira. Ondoren, etiketatzeko tresna automatikoa ere deskribatzen da eta lehen etiketatze automatikoaren saiakera bat eta horren emaitzak ere ematen dira.; Temporal information is compulsory for textual comprehension, since it describes when the events in text happen or their duration. In this article temporal information and processing are presented. First the temporal constructions are described. Secondly, the mark-up language that structures the data and the annotated corpora following it are shown. Finally, we describe automatic tool for annotation and a first automatic annotation effort and its results are also described.