Show simple item record

dc.contributor.advisorSaratxaga Couceiro, Ibon ORCID
dc.contributor.advisorHernáez Rioja, Inmaculada ORCID
dc.contributor.authorSánchez de la Fuente, Jon ORCID
dc.contributor.otherIngenieria de Comunicaciones;;Komunikazioen Ingeniaritzaes
dc.date.accessioned2016-06-24T07:02:02Z
dc.date.available2016-06-24T07:02:02Z
dc.date.issued2016-02-05
dc.date.submitted2016-02-05
dc.identifier.urihttp://hdl.handle.net/10810/18491
dc.description156 p.es
dc.description.abstractLos sistemas de verificación de locutor (SV) tienen que enfrentarse a la posibilidad de ser atacados mediante técnicas de spoofing. Hoy en día, las tecnologías de conversión de voces y de síntesis de voz adaptada a locutor han avanzado lo suficiente para poder crear voces que sean capaces de engañar a un sistema SV. En esta tesis se propone un módulo de detección de habla sintética (SSD) que puede utilizarse como complemento a un sistema SV, pero que es capaz de funcionar de manera independiente. Lo conforma un clasificador basado en GMM, dotado de modelos de habla humana y sintética. Cada entrada se compara con ambos, y, si la diferencia de verosimilitudes supera un determinado umbral, se acepta como humana, rechazándose en caso contrario. El sistema desarrollado es independiente de locutor. Para la generación de modelos se utilizarán parámetros RPS. Se propone una técnica para reducir la complejidad del proceso de entrenamiento, evitando generar TTSs adaptados o un conversor de voz para cada locutor. Para ello, como la mayoría de los sistemas de adaptación o síntesis modernos hacen uso de vocoders, se propone transcodificar las señales humanas mediante vocoders para obtener de esta forma sus versiones sintéticas, con las que se generarán los modelos sintéticos del clasificador. Se demostrará que se pueden detectar señales sintéticas detectando que se crearon mediante un vocoder. El rendimiento del sistema prueba en diferentes condiciones: con las propias señales transcodificadas o con ataques TTS. Por último, se plantean estrategias para el entrenamiento de modelos para sistemas SSD.es
dc.language.isospaes
dc.rightsinfo:eu-repo/semantics/openAccesses
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/*
dc.titleUtilización de la fase armónica en la detección de voz sintética.es
dc.typeinfo:eu-repo/semantics/doctoralThesises
dc.rights.holder(cc)2016 JON SANCHEZ DE LA FUENTE (cc by-nc-sa 4.0)
dc.identifier.studentID6040es
dc.identifier.projectID9226es
dc.departamentoesIngeniería de comunicacioneses_ES
dc.departamentoeuKomunikazioen ingeniaritzaes_ES


Files in this item

Thumbnail
Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

(cc)2016 JON SANCHEZ DE LA FUENTE (cc by-nc-sa 4.0)
Except where otherwise noted, this item's license is described as (cc)2016 JON SANCHEZ DE LA FUENTE (cc by-nc-sa 4.0)