Code-Switching fenomenoaren detekzio automatikoa Twiter-eko txioetan
View/ Open
Date
2017-11-27Author
Corral Naves, Ander
Metadata
Show full item recordAbstract
Proiektu honen helburua Twitter-eko txioetan euskara-gaztelaniazko code-switching de-
lako fenomeno linguistikoa aztertzea da. Horretarako, errealitatearen corpus adierazga-
rri bat sortu da, euskarazko, gaztelaniazko eta txio elebidunak bilduz, hainbat pertsonaia
publiko eta bestelako erabiltzaileengandik. CRF sekuentzia etiketatzailea erabili da sis-
temari ezagutza emateko, algoritmo honek datu sekuentziak tratatzeko duen izaeragatik.
CRF algoritmoaren doiketa izan da proiektuaren atal nagusia, asmatze-tasen hobekun-
tza lortzeko asmoz. Emaitza gisa, denbora errealean, streaming bidez, lortutako txioen
code-switching-a analizatuko duen aplikazioa sortu da, non bilaketak erabiltzaile konkre-
tu baten edo hitz konkretu baten arabera egiteko aukera dagoen. Gainera, EUS-ES code-
switching fenomenoaren detekzio automatikoan lehen urratsak ematea bilatu da, etorki-
zuneko proiektuentzat abiapuntua finkatuko duen proiektua burutuz.