ASKHi: Analisi sintaktiko konputazional hibridoa paradigma desberdinen konbinazioan oinarrituta
Laburpena
Hizkuntzaren Prozesamenduan sintaxiak berebiziko garrantzia du. Hainbat atazatan erabiltzen da sintaxitik eratorritako informazioa, esaterako itzulpen automatikoan, rol semantikoen etiketatzean eta sentimenduen analisian. Tesi-lan honetan sintaxi konputazionala landu da, zehazki dependentzietanoinarritutako sintaxia jorratu da analizatzaile automatikoen bidez. Dependentzien analisi sintaktiko automatikoa hobetzeko bide desberdinak aztertudira: izaera desberdinetako analizatzaileen hibridazioa, ezaugarrien ingeniaritzako tekniken erabilpena, multzokatze mota desberdinen esperimentazioaeta automatikoki analizatutako zuhaitz-bankuetatik eratorritako ezaugarrien erabilpena.Bide horiek guztiak jorratzearen arrazoi nagusia morfologikoki aberatsak diren hizkuntzen dependentzien analisia hobetzen lagundu dezaketen era des-berdinak aztertzea da. Hori dela eta, egindako esperimentu gehienak bost hizkuntza desberdinetan probatu dira (euskara, frantsesa, alemana, hunga-riera eta suediera), eta hizkuntza horietan guztietan probatu ezin izan diren bideak euskararekin probatu dira, euskararen dependentzien analisia baitabereziki hobetu nahi dena.Tesi-lan honen beste atal garrantzitsua euskararako baliabideak sortzea da, sintaxiari hertsiki lotutako baliabideak hain zuzen ere. Tesiak iraun di-tuen urteetan baliabide desberdinak sortu dira, baina bi dira nabarmentzeko modukoak. Alde batetik, 150 milioi hitzeko zuhaitz-bankua etiketatu dasintaktikoki era automatikoan; beste aldetik, euskarazko jatorrizko zuhaitz-bankua nazioarteko Dependentzia Unibertsalak proiektuan proposatzen denformatura bihurtu da. Lehenengo corpusa tesi-lan honetan erabili da automatikoki analizatutako zuhaitz-bankuetatik eratorritako ezaugarriak sortzeko,eta bigarrena edozeinek erabil dezake, publikoki atzigarri baitago.