Idiomatikotasunaren karakterizazio automatikoa: izena+aditza
Ekaia N. Extra : 47-68 (2016)
Resumen
Ikerkuntza-lan honen helburua izan da izena+aditza osaerako unitate fraseologikoak (UFak) corpusetik automatikoki eskuratzeko eta haien idiomatikotasunaren arabera karakterizatzeko teknikak garatzea eta esperimentalki testatzea. Idiomatikotasuna UFen ezaugarri definitzailetzat hartu dugu, eta haren lau propietate hauek hartu ditugu neurgai gisa: instituzionalizazioa (idiosinkrasia estatistikoa), ez-konposizionaltasun semantikoa, finkapen morfosintaktikoa eta finkapen lexikala. Ondorio nagusia da arlo honetan estandar diren agerkidetza-tekniken emaitzak modu esanguratsuan gainditu direla, batez ere teknika semantikoen bidez, baina baita malgutasun morfosintaktikoaren neurketen bidez ere. Aldiz, malgutasun lexikalaren neurketek ez dute espero izatekoa zen mailako emaitza izan. Azkenik, teoria fraseologikoaren aurresan batzuen ebidentzia esperimentalak lortu ditugu.; The goal of this research is to develop and experimentally test different techniques for the automatic extraction of phraseological units (PUs) of noun+verb structure in Basque and for their characterization according to the idiomaticity level. Idiomaticity is considered the defining feature of the concept of phraseological unit (PU), ande we have measured its following components: institutionalization (statistical idiosyncrasy), semantic non-compositionality, morphosyntact ic fixedness and lexical fixedness. The results show that the standard cooccurence techniques are significantly ourtperformed by semantic measures, and, to a lower extent, by measures of morphosyntactic flexibility. The results of lexical flexibility are poorer than expected. Finally, we obtain experimental evidence for several predictions of phraseological theory.