Reconocimiento multimodal de emociones

Romano Alonso, Nahiara

View/Open

TFG (3.738Mb)

Date

2023-11-28

Author

Romano Alonso, Nahiara

Metadata

Show full item record

Estadisticas en RECOLECTA
(LA Referencia)

URI

http://hdl.handle.net/10810/63213

Abstract

En este Trabajo de Fin de Grado, se desarrollan y se prueban distintas implementaciones de redes neuronales para reconocer las emociones de las personas en tres modalidades diferentes: imagen, vídeo y audio. Se hacen pruebas con distintos tipos de redes neuronales y con distintas bases de datos públicas para saber qué red neuronal (y sus hiperparámetros), puede ser la más adecuada para cada modalidad. Una vez se obtienen los resultados del entrenamiento de estas redes, se comparan los resultados para saber cuál es la que ofrece mayor exactitud. Finalmente, desarrollar un algoritmo de fusión de clasificaciones de audio y vídeo. En conclusión, podemos decir que los mejores resultados se han obtenido utilizando distintos tipos de redes neuronales convolucionales. En todas las bases de datos el mejor resultado se ha logrado utilizando diferentes arquitecturas CNNs, a excepción del reconocimiento del habla, que con una base de datos en concreto se ha alcanzado el mejor resultado utilizando una base red neuronal recurrente.