Accesibilidad en Traducción e Interpretación: análisis de la calidad de subtítulos automáticos en euskera generados con reconocimiento del habla
View/ Open
Date
2024-05-03Author
Hidalgo Chamero, Jon
Metadata
Show full item recordAbstract
[ES] El auge de la automatización ha supuesto un gran cambio en el ámbito de la traducción y la interpretación. Además del rápido desarrollo de la traducción automática, se ha acontecido la evolución de los sistemas de reconocimiento automático del habla. Estos sistemas pueden utilizarse para garantizar la accesibilidad a los contenidos audiovisuales, por ejemplo, mediante la subtitulación para personas sordas, práctica tratada en este trabajo.
El presente Trabajo de Fin de Grado aborda la accesibilidad en la traducción e interpretación mediante un análisis cualitativo y cuantitativo de la calidad de los subtítulos en euskera, generados mediante estos sistemas. Los subtítulos automáticos analizados en este trabajo han sido generados mediante la última versión del software ADITU actualizada en marzo de 2023, de la Fundación Elhuyar. Se han analizado 20 muestras, de una duración de alrededor de 5 minutos cada una, que se corresponden con grabaciones realizadas en mayo de 2022 de distintas secciones de los informativos de la cadena pública vasca ETB1.
Para poder proceder con el análisis cuantitativo, se ha tomado como base el modelo NER (Romero-Fresco y Martínez Pérez, 2015), en el que se evalúa la precisión de los subtítulos mediante la detección y clasificación de los errores que afectan a la comprensión. Este modelo establece una tasa de precisión aceptable a partir del 98 % de precisión en el reconocimiento. Asimismo, en el análisis cualitativo se presentan varias cuestiones recurrentes a lo largo de las muestras que son importantes a la hora de estudiar estos subtítulos, tales como los nombres propios, la identificación del hablante y el uso de euskalkis, entre otros.
Por último, se ha efectuado una comparación de los resultados con un análisis previo en el que se utilizaron las mismas muestras y el mismo software de reconocimiento del habla en su versión de junio de 2022 (véase Tamayo y Ros-Abaurrea, en prensa). Se parte de la hipótesis de que la calidad de los subtítulos será mayor en el presente análisis. [EUS] Azken urteotan agitzen ari den automatizazioaren gorakadak aldaketa handi bat ekarri du itzulpengintza eta interpretazioaren arloan. Itzulpen automatikoaren garapen azkarraz gainera, hizketa ezagutzeko sistema automatikoen bilakaera jazo da. Sistema hauek ikus-entzunezko edukien irisgarritasuna bermatzeko erabili daitezke, esate baterako, pertsona gorrentzako azpitituluak sortuz. Lan hau praktika honi buruz arituko da.
Gradu Amaierako Lan honek irisgarritasuna jorratzen du itzulpengintza eta interpretazioaren arloan, hizketa ezagutzeko sistema automatikoen bidez sortutako euskarazko azpitituluen kalitatea aztertuz. Horretarako, analisi kualitatibo eta kuantitatibo bat egin da. Lan honetan aztertutako azpititulu automatikoak Elhuyar Fundazioko ADITU software-aren azken bertsioarekin sortu dira, 2023ko martxoan eguneratua. Aztertutako 20 laginetako bakoitzak 5 minutu inguruko iraupena du eta guztiak ETB1 euskal kate publikoko albistegietako hainbat atalen grabazioei dagozkie, 2022ko maiatzean igorri zirenak.
Laginen analisi kuantitatiboa egin ahal izateko, NER eredua (Romero-Fresco eta Martínez Pérez, 2015) hartu da oinarri bezala, non azpitituluen zehaztasuna aztertzen den, haien ulermenari eragiten dieten akatsak hauteman eta sailkatuz. Eredu honen arabera, azpitituluen zehaztasun-tasa % 98tik gorakoa izan behar da hauek onargarri bezala kontuan har daitezen. Era berean, analisi kualitatiboan laginetan behin eta berriz agertu diren eta azpitituluak aztertzerakoan garrantzitsuak diren hainbat gai aurkezten dira, hala nola, izen bereziak, hizlariaren identifikazioa eta euskalkien erabilera, besteak beste.
Azkenik, analisi hau aldez aurretik egindako beste analisi batekin alderatu da, lagin eta hizketa ezagutzeko sistema automatiko bera erabili zuena, 2022ko ekainaren bertsioan (ikusi Tamayo eta Ros-Abaurrea, prentsan). Halaber, lan honen analisian azpitituluen kalitatea handiagoa izango dela dion hipotesitik abiatzen da.