Show simple item record

dc.contributor.advisorLópez de Lacalle Lecuona, Oier ORCID
dc.contributor.advisorAgirre Bengoa, Eneko ORCID
dc.contributor.advisorAldezabal Roteta, Izaskun ORCID
dc.contributor.authorAceta Moreno, Cristina
dc.date.accessioned2018-07-03T10:55:32Z
dc.date.available2018-07-03T10:55:32Z
dc.date.issued2018-06
dc.date.submitted2018-06
dc.identifier.urihttp://hdl.handle.net/10810/27867
dc.description.abstract[EU]Hitzen Adiera Desanbiguazioa (HAD) Hizkuntzaren Prozesamenduko (HP) erronkarik handienetakoa da. Frogatu denez, HAD sistema ahalik eta arrakastatsuenak entrenatzeko, oso garrantzitsua da entrenatze-datuetatik adibide (hitzen testuinguru) zailak kentzea, honela emaitzak asko hobetzen baitira. Lan honetan, lehenik, gainbegiratutako ereduak aztertzen ditugu, eta, ondoren, gainbegiratu gabeko bi neurri proposatzen ditugu. Gainbegiratutako ereduetan, adibideen zailtasuna definitzeko, anotatutako corpuseko datuak erabiltzen dira. Proposatzen ditugun bi gainbegiratu gabeko neurrietan, berriz, batetik, aztergai den hitzaren zailtasuna neurtzen da (hitzon Wordnet-eko datuak aztertuta), eta, bestetik, hitzaren agerpenarena (alegia, hitzaren testuinguruarena edo adibidearena). Biak konbinatuta, adibideen zailtasuna ezaugarritzeko eredu bat ere proposatzen da.es_ES
dc.description.abstract[EN]Word Sense Disambiguation (WSD) is one of the major challenges in Natural Language Processing (NLP). In order to train successful WSD systems, it has been proved that removing difficult examples (words in a context) from the training set improves the performance of these systems. In this work, we first analyze supervised models that, given annotated data, characterize the difficulty of examples. We then propose two unsupervised measures to characterize the difficulty of target words (by analyzing their WordNet data) and occurrences (context sentences), respectively. Combining them, a model able to characterize the difficulty of examples is also presented.es_ES
dc.language.isoenges_ES
dc.rightsinfo:eu-repo/semantics/openAccesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/3.0/es/*
dc.titleUnsupervised methods to predict example difficulty in word sense annotationes_ES
dc.typeinfo:eu-repo/semantics/masterThesises_ES
dc.rights.holderAtribución-NoComercial-CompartirIgual 3.0 España*
dc.departamentoesLengua Vasca y Comunicaciónes_ES
dc.departamentoesLenguajes y sistemas informáticoses_ES
dc.departamentoeuEuskal Hizkuntza eta Komunikazioaes_ES
dc.departamentoeuHizkuntza eta sistema informatikoakes_ES


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Atribución-NoComercial-CompartirIgual 3.0 España
Except where otherwise noted, this item's license is described as Atribución-NoComercial-CompartirIgual 3.0 España