Show simple item record

dc.contributor.advisorAgirre Bengoa, Eneko ORCID
dc.contributor.advisorLópez de Lacalle Lecuona, Oier ORCID
dc.contributor.authorSalaberria Saizar, Ander
dc.date.accessioned2019-10-01T13:22:51Z
dc.date.available2019-10-01T13:22:51Z
dc.date.issued2019-09-30
dc.identifier.urihttp://hdl.handle.net/10810/35549
dc.description.abstractLengoaia Naturalaren Prozesamendu eta Ikusmen Artifizialaren arloaren erdigunean mo- dalitate anitzak, irudi eta testuak, aldi berean prozesatzea da helburu nagusietako bat. Proiektu honetan modalitate anitzeko sistemen estimazioak modalitate bakarra erabiltzen dutenena baino hobeagoak diren aztertu da. Hori burutzeko testu eta irudien arteko antze- kotasun semantikoak aztertu dira, STS eta vSTS atazen bidez. STS modalitate bakarreko ataza da, non bi esaldiren arteko antzekotasun semantikoak aztertzen diren. IXA taldeak berriki sortu duen vSTS atazan, aldiz, testu eta irudien errepresentazioak maneiatzen dira esaldien arteko antzekotasun semantikoak aztertzeko —hots, modalitate anitzeko ataza bat da—. Kasu honetan, esaldi bakoitza irudi batez lagunduta dator, esaldi hori irudiaren goiburukoa edo captiona delarik. Ataza horiek ebazteko artearen egoeran dauden hainbat motatako neurona-sare sakon landu dira. Hauen artean modalitate bakarra erabiltzen duten BERT, GloVe, GPT-2 eta USE sistemak aurkitzen dira, baita modalitate anitzeko errepresentazioak eraikitzen di- tuen VSE++ sarea ere. Sistema hauek STS eta vSTS atazetara moldatu dira, hauen erren- dimendua kasu ez-gainbegiratu eta gainbegiratuetan aztertuz. Aipatutako sistemak vSTS datu multzoan probatu dira. Datu multzo hau proiektu honetatik kanpo sortu eta hedatu bada ere, bere garapena sakon aztertu dugu. Gainera, modalitate anitzeko sistema berri bat sortu da, DiscoGAN arkitekturan oinarri- tuta dagoena, DiscoGAN-M 3 . DiscoGAN-M 3 sistemak modalitate anitzeko errepresenta- zioekin lan egiten ez badu ere, bi modalitateen arteko transformazioak ikasten ditu. Arki- tektura berri honen logika, eraikuntza eta ikasketa prozesuak sakonki azaldu dira. Gure lanak modalitate anitzeko adierazpenak erabiltzean emaitza hobeagoak lortzen dire- la erakusten du esperimentu ez-gainbegiratuetan. Hala ere, esperimentu gainbegiratuetan ez da horrela izan. Kasu horretan atentzio-mekanismoak erabiltzen dituen BERT bezala- ko Transformerrek emaitza onenak lortzen dituzte, vSTS atazan artearen egoera definituz. Egindako lanak modalitate anitzeko adierazpenen kontribuzioa erakusten badu ere, kasu gainbegiratuetan emaitzak hobetzeko aukera asko daudela uste da.es_ES
dc.language.isoeuses_ES
dc.rightsinfo:eu-repo/semantics/openAccesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/3.0/es/
dc.subjectadimen artifizialaes_ES
dc.subjectneurona-sare sakonaes_ES
dc.subjectdeep learninges_ES
dc.subjectlengoaia naturalaren prozesamenduaes_ES
dc.subjectikusmen artifizialaes_ES
dc.titleTestu eta irudien arteko antzekotasun semantikoa aztertzenes_ES
dc.typeinfo:eu-repo/semantics/masterThesises_ES
dc.rights.holderAtribución-NoComercial-CompartirIgual 3.0 España


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Atribución-NoComercial-CompartirIgual 3.0 España
Except where otherwise noted, this item's license is described as Atribución-NoComercial-CompartirIgual 3.0 España