Show simple item record

dc.contributor.advisorNavas Cordón, Eva
dc.contributor.authorTavarez Arriba, David
dc.contributor.otherIngenieria de Comunicaciones;;Komunikazioen Ingeniaritzaes
dc.date.accessioned2017-02-13T13:37:03Z
dc.date.available2017-02-13T13:37:03Z
dc.date.issued2016-12-19
dc.date.submitted2016-12-19
dc.identifier.urihttp://hdl.handle.net/10810/20700
dc.description201 p.es
dc.description.abstractEl objetivo de la diarización es detectar los cambios de locutor en una grabación e identificar qué segmentos de voz corresponden a un mismo locutor, respondiendo a la pregunta ¿quién habló cuándo¿.El trabajo realizado en esta tesis abarca diferentes aspectos relacionados con el proceso de diarización de locutores, centrando el esfuerzo en los problemas comunes a los diferentes campos de aplicación.En primer lugar, se han recopilado dos nuevas bases de datos que permitirán el desarrollo y la implementación de nuevos sistemas de diarización en los dos principales ámbitos de aplicación. Además, se han diseñado dos nuevas técnicas de segmentación de audio, refrendadas con éxito en distintas campañas de evaluación organizadas por la Red Temática en Tecnologías del Habla. Se ha desarrollado un método de fusión de etiquetas que tiene en cuenta el desequilibrio entre clases, habitual en distintas áreas del procesado de la voz, como son la segmentación de audio, el reconocimiento de emociones o el reconocimiento y verificación de locutores. En cuanto a la tarea de segmentación de locutores, se ha introducido en esta tesis una técnica de detección de cambios de turno basada en el análisis trama a trama, que permite extender el funcionamiento online a los sistemas de diarización. Por último, se ha propuesto una técnica de mejora de la diarización basada en la identificación y reagrupamiento de clusters pertenecientes a un mismo locutor.es
dc.language.isospaes
dc.rightsinfo:eu-repo/semantics/openAccesses
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/*
dc.subjecttelecommunications technologyes
dc.subjecttecnología de las telecomunicacioneses
dc.titleTécnicas de mejora del rendimiento de los sistemas de diarización de locutoreses
dc.typeinfo:eu-repo/semantics/doctoralThesises
dc.rights.holder(cc)2016 DAVID TAVAREZ ARRIBA (cc by-nc 4.0)
dc.identifier.studentID272919es
dc.identifier.projectID14765es
dc.departamentoesIngeniería de comunicacioneses_ES
dc.departamentoeuKomunikazioen ingeniaritzaes_ES


Files in this item

Thumbnail
Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

(cc)2016 DAVID TAVAREZ ARRIBA (cc by-nc 4.0)
Except where otherwise noted, this item's license is described as (cc)2016 DAVID TAVAREZ ARRIBA (cc by-nc 4.0)